1. 개인학습
- Passage Retrieval - Dense Embedding
- Custom vocab을 활용한 tokenizer 만들기!
- Special mission 1 ~ 3
2. 훈민정음에 스며들다 대회 진행
- Fine tuning 코드 완성하기 - inference까지 완성해서 check point를 만들어야함
- Custom tokenizer 오류 수정
- 그냥 사용시 공백 기준 tokenizing을 해버림
- 대화 문장이을 때 공백 넣기
- 요약문 앞뒤에 Special token 부착
- 데이터 EDA 하기
3. MRC 대회 진행
- base code / Roberta-large 성능 확인 하기