2.8. LDA-Latent Dirichlet Allocation(潜在狄利克雷分配)¶
“LDA” 通常指的是 “Latent Dirichlet Allocation”(潜在狄利克雷分配)。
这个模型最初由 David Blei、Andrew Ng 和 Michael I. Jordan 于 2003 年提出。
LDA 是一种概率主题模型,用于分析文档集合中的主题结构
在 LDA 中,每个文档被看作是多个主题的混合,而每个主题又被看作是多个单词的分布。模型的目标是找到一个能够解释文档中单词分布的主题分布,以及每个文档中主题的分配情况。LDA 的输出包括每个文档的主题分布和每个主题的单词分布。
2.8.1. Ensemble LDA¶
EnsembleLda is a method of finding and generating stable topics from the results of multiple topic models, it can be used to remove topics from your results that are noise and are not reproducible.
https://radimrehurek.com/gensim/auto_examples/tutorials/index.html
2.8.2. LDA Model¶
2.8.3. 参考¶
Introduction to Latent Dirichlet Allocation: https://blog.echen.me/2011/08/22/introduction-to-latent-dirichlet-allocation/