唯物是真 @Scaled_Wurm

プログラミング(主にPython2.7)とか機械学習とか

論文感想: "Learning Latent Personas of Film Characters" (ACL 2013)

キャラクターのタイプ(persona、人格)を分析する話。
自然言語処理では物語のプロットとかイベントの連鎖の研究は多いけど、キャラクターのタイプに対する研究は初めてらしい

映画のデータを対象としている(Wikipediaなどを利用)。
テキストだけでなく年齢、性別などのメタデータも使う

大雑把に説明すると、トピックモデルを利用して各キャラクターについて、動作をする側としてのトピック、動作を受ける側としてのトピック、どのような単語で修飾されるかのトピックを推定している

以下の論文中の図は、ゾンビのpersonaを表している簡単な例
f:id:sucrose:20130930231748p:plain

  • 動作主としては、食べたり殺したりする(eat, kill)
  • 動作を受ける側としては、殺されたりする(kill)
  • 修飾する属性として多いのは、死んでいる(dead)

感想

ちょっと映画の知識が少ないので出力(キャラクターのクラスタリング結果)を見てもあまり理解できなかった……

Twitterで見かけたんですが、なんかこの論文については論争があるらしいです