paper review
2022. 3. 22.
[논문리뷰] 잠재 디리클레 할당 - LDA(Latent Dirichlet Allocation)
[ML] 토픽 모델링(Topic Modeling) - LSA와 LDA 포스트에서 LDA의 가정과 원리에 대해 간단히 설명해본 적이 있다. 좋은 기회가 있어서 논문을 읽게 되어 더 자세하게 설명을 해보려 한다. 토픽 모델링에 대한 설명은 위 포스트를 참고, 이번 포스트는 LDA의 generative model과 inference과정에 초점을 맞춰보려 한다. LDA 논문 원본 https://www.jmlr.org/papers/volume3/blei03a/blei03a.pdf 이쪽! Terminology 본격적으로 들어가기 앞서 각 term에 대한 정의를 살펴본다. 단어(word)란 이산 데이터의 기본 단위이며, \( {1, ..., V} \)의 형식으로 index된 어휘(vocabulary)의 항목으로 정의..