Transformers 가족 (BERT vs GPT vs GPT2)

Transformers 가족

BERT와의 차이점

실제 문제를 대상으로 학습을 진행할 때도 언오 모델을 함께 학습한다.
- 손실함수 loss가 2개 : 실제 학습 손실값 ($loss_1$) + 언어모델 손실값($loss_2$)
본 학습 문제에 특화된 입력값을 사용
다른 pre-train dataset

Language Generate

Encoders and Ensembles for Task-Free Continual Learning 리뷰 (0)	2022.03.11
Prompt Learning 오픈소스: OpenPrompt 리뷰 (0)	2022.03.11
GPT Understands, Too 리뷰 (0)	2022.03.11
MASS: Masked Sequence to Sequence Pre-training for Language Generation 리뷰 (0)	2022.02.22
XML, Cross-lingual Language Model Pretraining 리뷰 (0)	2022.02.22