자연어 처리 강의 영상 추천 : [고현웅] Large-scale LM에 대한 얕고 넓은 지식들 (part 1)

 



- 발표 자료 : https://github.com/jiphyeonjeon/season2/tree/main/advanced


★ 영상에서 다룬 내용들

  • GPT 1, 2, 3
  • BERT
  • T5
  • Switch Transformers
  • Message Passing
  • MPI, NCCL, DP
  • Ring All-reduce
  • Horovod
  • DDP
  • Mesh-tensorflow
  • Megatron-LM
  • GPipe, PipeDream, Interleaved Scheduling
  • 3D Parallelism
  • Mixed Precision
  • ZeRO, ZeRO-offload, ZeRO-infinity
  • Deep Speed
  • 1-Bit Adam
  • Progressive Layer Dropping


댓글

이 블로그의 인기 게시물

[todaycode오늘코드] [3/3] 파이썬 데이터 시각화 - seaborn lmplot과 regplot의 차이 신뢰구간의 의미와 hue 등 다양한 옵션 사용하기

[빵형의 개발도상국] 얼굴 인식 알고리즘 성능 비교 - Python, Deep Learning