ML/AI/SW Developer

Week8 - Day1

1. 개인학습

2. 특강

  • 서비스 향 AI 모델 개발하기
    1. 실제 개발시에는 데이터도 없고, 평가 방식도 정해져 있지 않은 경우가 많음
      • 서비스 기획팀과 질의 응답을 통해 필요한 데이터셋 구체화
      • 즉, 종류에 대한 정의/ 수집할 량을 정해야 함
    2. 기술 모듈 설계
      • 데이터 수집하면서 어려움을 접함
        • E.g 수식 인식 모듈 서비스 제작시.
          • 수식을 하나만 나오게 촬영하기 어려움 등
      • 전체 이미지에서 수식영역을 검출하는 모듈이 추가적으로 필요해짐
    3. 정답 준비
      • AI 모델 별로 입력에 대한 출력
    4. 테스트 데이터셋 / 테스트 방법 준비
      • offline test
        • AI 모델 후보 선택 목적으로 활용
        • 각 후보에 대한 면밀 분석 후 출시 버전 선택
      • online test
        • VOC (voice of customer)
        • 개선 포인트 파악
    5. 모델 요구 사항 도출
      • 처리시간
      • 목표 정확도
      • 목표 qps
      • serving 방식
      • 장비 사양
  • 캐글 그랜드마스터의 노하우 대방출
    • 탄탄한 검증 전략 구축
      • Shake up 방지
      • Test set에서 얻은 점수과 Training set에서 얻은 점수의 간격을 줄이는 것
      • 보통 Training set을 8:2로 나누어 사용
        • Stratfied K-fold 사용: class 별로 비율을 내어 나눔
    • 앙상블
      • 싱글모델 보다는 여러 모델의 결과를 섞는 것이 좋음
      • 대회 종료 1~2주 전까지는 싱글모델로 점수 올리기
    • 버전별로 폴더를 만들어 코드 관리
      • 마지막 앙상블을 위해서라도!
  • AI와 저작권법
    • 좋은 AI 모델은 좋은 데아터로부터 나온다!
    • 저작물
      • 사람의 생각이나 감정을 표현한 결과물
    • Creative Commons License (CCL)
      • CC-BY
        • BY: Attribution 저작자 표시
      • CC-BY-ND
        • ND: No Derivatives 변경 금지(변경 후 공유 금지)
      • CC-BY-SA
        • SA: Share Alike 동일조건 변경 허락
      • CC-BY-NC
        • NC: Non Commercial 비영리 목적으로만 이용 가능
      • CC-BY-NC-ND
      • CC-BY-NC-SA

3. 피어세션

  • 그라운드룰 정하기
  • 모더레이터 역활
  • 팀명 의미 정하