- 검색어 기반 Repository 얻기
- 검색어 기반 commits history 얻기
- commit에서 특정 확장자 파일 filter
- filtered file의 old,new version file 얻기
- tree-sitter code analysis
- tree-sitter분석 내용에 따라 함수단위 code, statement code 추출
- difft code diff
- Code Data 구조 작성
- 기존 code dataset 구조 조사
- data attribute 작성
- Database function 작성
- Github API token access limit 문제 해결
- 1시간당 5000번 계산해서 초과시 대기하도록 변경
- Commit sha와 file의 commit sha가 다른 문제 해결(merge commit과 연관)