キャラクターのタイプ(persona、人格)を分析する話。
自然言語処理では物語のプロットとかイベントの連鎖の研究は多いけど、キャラクターのタイプに対する研究は初めてらしい
映画のデータを対象としている(Wikipediaなどを利用)。
テキストだけでなく年齢、性別などのメタデータも使う
大雑把に説明すると、トピックモデルを利用して各キャラクターについて、動作をする側としてのトピック、動作を受ける側としてのトピック、どのような単語で修飾されるかのトピックを推定している
以下の論文中の図は、ゾンビのpersonaを表している簡単な例
- 動作主としては、食べたり殺したりする(eat, kill)
- 動作を受ける側としては、殺されたりする(kill)
- 修飾する属性として多いのは、死んでいる(dead)
感想
ちょっと映画の知識が少ないので出力(キャラクターのクラスタリング結果)を見てもあまり理解できなかった……
Twitterで見かけたんですが、なんかこの論文については論争があるらしいです
ACL論文からはじまった論争に既視感。この種の人文系の人が計算を理解することはないから、自分の土俵から出られない。どこに的があるかを知らぬまま、はるか遠くから槍を投げるだけ。計算の側から一方通行で手を伸ばすしかない。URL
2013-09-23 20:28:30 via web