Week8 - Day1
1. 개인학습
2. 특강
- 서비스 향 AI 모델 개발하기
- 실제 개발시에는 데이터도 없고, 평가 방식도 정해져 있지 않은 경우가 많음
- 서비스 기획팀과 질의 응답을 통해 필요한 데이터셋 구체화
- 즉, 종류에 대한 정의/ 수집할 량을 정해야 함
- 기술 모듈 설계
- 데이터 수집하면서 어려움을 접함
- 전체 이미지에서 수식영역을 검출하는 모듈이 추가적으로 필요해짐
- 정답 준비
- 테스트 데이터셋 / 테스트 방법 준비
- offline test
- AI 모델 후보 선택 목적으로 활용
- 각 후보에 대한 면밀 분석 후 출시 버전 선택
- online test
- VOC (voice of customer)
- 개선 포인트 파악
- 모델 요구 사항 도출
- 처리시간
- 목표 정확도
- 목표 qps
- serving 방식
- 장비 사양
- 캐글 그랜드마스터의 노하우 대방출
- 탄탄한 검증 전략 구축
- Shake up 방지
- Test set에서 얻은 점수과 Training set에서 얻은 점수의 간격을 줄이는 것
- 보통 Training set을 8:2로 나누어 사용
- Stratfied K-fold 사용: class 별로 비율을 내어 나눔
- 앙상블
- 싱글모델 보다는 여러 모델의 결과를 섞는 것이 좋음
- 대회 종료 1~2주 전까지는 싱글모델로 점수 올리기
- 버전별로 폴더를 만들어 코드 관리
- AI와 저작권법
- 좋은 AI 모델은 좋은 데아터로부터 나온다!
- 저작물
- Creative Commons License (CCL)
- CC-BY
- CC-BY-ND
- ND: No Derivatives 변경 금지(변경 후 공유 금지)
- CC-BY-SA
- SA: Share Alike 동일조건 변경 허락
- CC-BY-NC
- NC: Non Commercial 비영리 목적으로만 이용 가능
- CC-BY-NC-ND
- CC-BY-NC-SA
3. 피어세션
- 그라운드룰 정하기
- 모더레이터 역활
- 팀명 의미 정하