KyungHyun Lim

ML/AI/SW Developer

Week8 - Day1

Sep 23, 2021

ustage

1. 개인학습

Hugging face-example

2. 특강

서비스 향 AI 모델 개발하기
1. 실제 개발시에는 데이터도 없고, 평가 방식도 정해져 있지 않은 경우가 많음
  - 서비스 기획팀과 질의 응답을 통해 필요한 데이터셋 구체화
  - 즉, 종류에 대한 정의/ 수집할 량을 정해야 함
2. 기술 모듈 설계
  - 데이터 수집하면서 어려움을 접함
    - E.g 수식 인식 모듈 서비스 제작시.
      - 수식을 하나만 나오게 촬영하기 어려움 등
  - 전체 이미지에서 수식영역을 검출하는 모듈이 추가적으로 필요해짐
3. 정답 준비
  - AI 모델 별로 입력에 대한 출력
4. 테스트 데이터셋 / 테스트 방법 준비
  - offline test
    - AI 모델 후보 선택 목적으로 활용
    - 각 후보에 대한 면밀 분석 후 출시 버전 선택
  - online test
    - VOC (voice of customer)
    - 개선 포인트 파악
5. 모델 요구 사항 도출
  - 처리시간
  - 목표 정확도
  - 목표 qps
  - serving 방식
  - 장비 사양
캐글 그랜드마스터의 노하우 대방출
- 탄탄한 검증 전략 구축
  - Shake up 방지
  - Test set에서 얻은 점수과 Training set에서 얻은 점수의 간격을 줄이는 것
  - 보통 Training set을 8:2로 나누어 사용
    - Stratfied K-fold 사용: class 별로 비율을 내어 나눔
- 앙상블
  - 싱글모델 보다는 여러 모델의 결과를 섞는 것이 좋음
  - 대회 종료 1~2주 전까지는 싱글모델로 점수 올리기
- 버전별로 폴더를 만들어 코드 관리
  - 마지막 앙상블을 위해서라도!
AI와 저작권법
- 좋은 AI 모델은 좋은 데아터로부터 나온다!
- 저작물
  - 사람의 생각이나 감정을 표현한 결과물
- Creative Commons License (CCL)
  - CC-BY
    - BY: Attribution 저작자 표시
  - CC-BY-ND
    - ND: No Derivatives 변경 금지(변경 후 공유 금지)
  - CC-BY-SA
    - SA: Share Alike 동일조건 변경 허락
  - CC-BY-NC
    - NC: Non Commercial 비영리 목적으로만 이용 가능
  - CC-BY-NC-ND
  - CC-BY-NC-SA

3. 피어세션

그라운드룰 정하기
모더레이터 역활
팀명 의미 정하