AI Research Portfolio Post

[GAN] 입문 개요

난이도: 초중급

태그: generative,gan,생성모델

GAN은 "가짜를 만드는 생성자"와 "가짜를 구별하는 판별자"가 서로 경쟁하면서 함께 강해지는 구조다.

GAN은 생성 모델의 대표적인 출발점이다. 목표는 진짜 데이터처럼 보이는 샘플을 만드는 것이다. 핵심은 생성자와 판별자가 게임처럼 서로를 속이고 막는 과정을 통해 학습된다는 점이다.

초심자에게 중요한 관점은 GAN이 데이터를 직접 확률식으로 모델링하기보다, "진짜처럼 보이게 만들 수 있는가"를 경쟁 구조로 학습한다는 점이다. 그래서 likelihood 기반 모델과는 접근 철학이 꽤 다르다.

{min}_{G} {max}_{D} V (D, G) = 𝔼_{x ~ p_{d a t a}} [\log D (x)] + 𝔼_{z ~ p (z)} [\log (1 - D (G (z)))]

판별자 \(D\)는 진짜와 가짜를 구분하려 하고, 생성자 \(G\)는 판별자를 속이는 샘플을 만든다.

즉 GAN은 생성 모델 역사에서 "샘플 품질"을 강하게 밀어 올린 계열로 볼 수 있다. 이후 diffusion이 부상했어도, 생성 경쟁 구조와 mode collapse 같은 핵심 문제를 이해하려면 여전히 좋은 출발점이다.

GAN을 처음 볼 때는 "누가 loss를 최소화하고 누가 최대화하는지"와 "왜 경쟁 구조가 생성 품질을 끌어올리는지"를 이해하는 것이 가장 중요하다.

면접에서는 여기에 더해 "왜 GAN은 학습이 불안정한가", "왜 mode collapse가 생기는가"까지 이어서 말할 수 있으면 좋다.

수식, 직관, 장단점을 더 자세히 보려면 아래 상세 문서를 같이 읽으면 좋다.