Motivation

๐จ ๊ธฐ์กด์ ๋ฌธ์ ์
- Autoregressive Model
- ๋ฐ์ดํฐ๋ฅผ ์์๋๋ก ์์ฑ โ p(x)๊ฐ ์๋์ ๊ฐ์ด ์ค์ ๋จ.
$$
p_{\theta} (x_1, x_2, ..., x_n) = \prod_{i=1}^n p_{\theta}(x_i |x_{<i})
$$
-
VAE
- directed model
- latent variable z ๋ฅผ ๋ฝ๊ณ , x๋ฅผ ์์ฑํ๋ค. (์์๋ฅผ ๊ฐ์ง๋ค.)
- ์ด๋ฐ ํํ๋ก ์ธํ
์ ํ๋ค ๋ณด๋ ์ง์ ์์ ๊ตฌํ ์ ์๊ณ , ELBO ํํ๋ฅผ ๋ง๋ค๊ฒ ๋จ.
- ๋ชจ๋ธ ๊ตฌ์กฐ๋ก ์ธํด ์ด์ฉ ์ ์๋ ELBO ๋ฌธ์ ๋ฐ์
$$
\max_{\theta} \log p_{\theta}(x)
$$
$$
\log p_{\theta}(x) = log \int p_{\theta}(x|z)p(z)dz
$$
$$
\log p(x) \geq \mathbb{E}{q(z \mid x)}[\log p(x|z)] - D{KL}(q(z|x)||p(z))
$$
- p(z) โ ์ ๊ท๋ถํฌ๋ก ์ ํ
โ ์ ํ๋ ๋ชจ๋ธ ๊ตฌ์กฐ!

GAN์ ๊ฒฝ์ฐ์๋ ๋ช
์์ ์ผ๋ก ํ๋ฅ ๋ถํฌ p(x)๋ฅผ ์ ์ํ์ง ์์๋ ๋จ.
โ ์ด์ ๋ชจ๋ธ๊ณผ ๋ฌ๋ฆฌ, ๊ตฌ์กฐ์ ์ ์ฝ ์ ๊ณ , ๋ชจ๋ธ๋ง ์์ ๋ ๋์.
๊ทธ๋ฌ๋ ์ฌ์ ํ ๋ฌธ์ ์ ์กด์ฌ
-
Likelihood๊ฐ ์ ์๋์ง ์์.
- p(x)๋ฅผ ์ ์ํ์ง ์์ log p(x)๋ฅผ ์ต๋ํํ๋๋ก ํ์ต๋์ง ๋ชปํ๋ค.
- VAE์ ๊ฒฝ์ฐ์๋ ELBO ๊ฐ์ ์ถ๋ ฅํจ์ผ๋ก์จ ํ์ธ์ด ๊ฐ๋ฅ.
-
unstable training
- Generator / Discriminator๊ฐ ๊ฒฝ์ํ๋ ๊ตฌ์กฐ. โ ๊ท ํ์ ๋ง์ถ๊ธฐ ์ด๋ ต๊ณ , ๋ฌดํํ ์ง๋ํ ์ ์์.
-
hard to evaluate
- ํ๋ฅ ๋ถํฌ๋ฅผ ๋ช
์์ ์ผ๋ก ์ ์ํ์ง ์์์ ์ ํ์ต์ด ๋๊ณ ์๋์ง ํ์ธ X
-
Mode Collapse
- ํน์ ์ซ์๋ง ๊ณ์ ์์ฑํด๋ (MNIST์ ๊ฒฝ์ฐ)
- cheating (์๋๋ ๊ฒ๋ค๋ง ๊ณ์ ์์ฑ)