Introduction

image.png

Background and Previous Works

Background

  1. 정규화 계층의 발전
  2. 정규화 계층의 중요성
  3. 새로운 접근: DyT(Dynamic Tanh)
  4. DyT 적용 및 결과

Previous Works

정규화 계층의 일반적인 구조와 대표적 방식:

Batch Normalization (BN)

Layer Normalization (LN)과 RMSNorm

+ LayerNorm이 잘 동작하는 이유