トピックモデルのLDA(Latent Dirichlet Allocation)が難しいって話をよく聞きますけど,詳しい理論的な部分はともかくどういう流れに位置するものかってのはわかりやすいので簡単にメモ.
専門でないので,詳しくは参考文献を読んだほうがいいです.
トピック
同じ文書内で使われる確率が高いような似た意味を持つ単語の集まり.
例えばスポーツトピックなら「野球」「サッカー」「ボール」が出やすい,など.
トピックモデルは文書のトピックと,トピックに属する単語を推定する.
トピックモデルのLDA(Latent Dirichlet Allocation)が難しいって話をよく聞きますけど,詳しい理論的な部分はともかくどういう流れに位置するものかってのはわかりやすいので簡単にメモ.
専門でないので,詳しくは参考文献を読んだほうがいいです.
同じ文書内で使われる確率が高いような似た意味を持つ単語の集まり.
例えばスポーツトピックなら「野球」「サッカー」「ボール」が出やすい,など.
トピックモデルは文書のトピックと,トピックに属する単語を推定する.