<aside> 💡

어텐션 병목을 해결하기 위한 방법론들과 터보퀀트가 가져올 것들

</aside>

트랜스포머의 근본문제

사전학습, 파인튜닝, 추론

같은 Transformer 라도 병목은 단계마다 다르게 드러남

  1. 사전학습(Pre-training)
  2. 파인튜닝(Fine-tuning)
  3. 추론(Inference)

어텐션 문제 해결의 두 방향

어텐션을 바꾸거나, 어텐션 밖으로 나가거나

  1. Attention 구조 변형
  2. Attention 탈출 시도

소프트웨어 최적화

소프트웨어 최적화는 단계별로 다른 병목을 겨냥함

  1. 사전학습
  2. 파인튜닝
  3. 추론