Week4(pstage)

KyungHyun Lim

ML/AI/SW Developer

Aug 26, 2021

Loss 활용

  class MSELoss(_Loss):
      def __init__()
          ...
      def forward(self, ):
          return F.mse_loss(input, target, ...)

model.train() 으로 바꿔주기
- Dropout, BatchNorm train mode로 바꿔준다
- eval()과 다르게 적용되어야함
optimizer.zero_grad()
- 이전 스텝의 그래디언트 정보를 없애기 (loss가 더해진다)
- 그대로 쓸것인가? 초기화하고 쓸것인가? 결정 필요
Loss
- Chain 생성: grad_fn chain
- -> loss.backward()

Gradient Accumulation

  # 일정 횟수 마다 업데이트
  if i % SET_NUM == 0:
      optimizer.step()
      optimizer.zero_grad()

Data Augmentation
- 단순 학습으로는 70% 근처가 한계인듯 보임 특히 특정 클래스의 부분이 f1-score가 떨어짐
- 유독 적은 클래스 한번더 aug 적용
- 학습 중에도 확률적 aug 적용
Model
- Efficientnet (timm 라이브러리 활용) 현재 까지 가장 성능이 좋음
- learning rate의 중요성, 학습이 되다 말다 하다 lr을 계속 조정해보니 굉장히 학습이 잘되는 lr이 있었다. 인내하고 튜닝해보는게 답인가….?
향후 계획
- 3개의 분류기로 나누는 것은 안해봐도 될듯하다
- 완벽하게 모듈화 하기
- Test 결과 확인 하는 jupyter notebook 만들기
- 리포트 앞부분 미리 써놓기(문제정의, EDA 부분)