「最強のポケモンの生成」 - NLP2012のオノマトペ関係の論文

言語処理学会18回年次大会で音象徴の機械学習による再現：最強のポケモンの生成という面白そうなタイトルの論文があったので紹介します．

概要

「最強のポケモンの生成」というタイトルですが，ポケモン廃人的な意味ではなくて「どんな名前のポケモンが強そうに聞こえるか」という内容の研究です．
いわゆる音象徴と呼ばれる分野の話で，ゴジラやキングギドラなどの怪獣の名前には濁音が多い，という話にも関係してきます．

ブーバ/キキ効果

音象徴でよく使われる例としてブーバ/キキ効果と呼ばれるものがあります．
以下の画像に描かれている2つの図形に対して「どちらがブーバでどちらがキキと思うか？」とたずねます．
(ファイル:BoobaKiki.png - Wikipedia, Drawn by Andrew Dunn, 1 October 2004.)

すると回答者の母語によらず「曲線のほうがブーバで鋭角のほうがキキ」と答えるという結果が得られていて，音の種類と視覚的な印象には関係があると考えられています．

得られた最強ポケモン

実験の結果，母音ではUやA，子音ではDやGが含まれていると強そうに感じられるという結果が得られたそうです．

生成された最強のポケモンの結果は正直見てもよくわかんないです……．

ロフスムパ
ズルプケミ
デアイゼズ
クキメパヂ
ダドェイフ
ブラセミグ
タトジゴク
グテネミバ
ヅラナミグ
ゾラセクト

詳細

以下詳細に興味のある方向け
バイアスを除去するためポケモンを知らない被験者に対して実験を行なっています．

実験1

文字から人が受ける印象がどの程度一致するかを調査．
ポケモンの名前2つのペアを8名の被験者に提示し，どちらが強いと思うかを回答してもらう．
その結果の一致度を調べると被験者の間で7割程度．

実験2

SVMによる機械学習を行い，名前の強弱判断を機械的に再現できることを目指す．
カタカナの文字とローマ字に直した文字のunigramとbigramを特徴(素性)として利用．
SVMによる学習結果の精度は7割程度で，人間と同程度と考えられる．

追加実験

ポケモンの名前を1文字ずつ変えていき，被験者ごとに学習したSVMで過半数が強い/弱いと判断したものを追加する手順を繰り返して最強/最弱のポケモンの名前を生成する．
被験者による最強と最弱のポケモン間の評価には8割強の大きな一致が見られた．

NLP2012のその他のオノマトペ関係の論文

他にもオノマトペ(擬音語，擬態語)関係の論文はたくさんあって流行ってるみたいです．

オノマトペの音象徴を利用した評判分析

ポケモンの話と似ていますが，通常のオノマトペについてポジティブかネガティブかを判定しています．
SVMに与える特徴としては音声記号や子音などの複雑なものを利用．
またオノマトペを含んだ文章のポジネガの判定もおこなっており，従来の単語のみのモデルよりもオノマトペの音象徴を考慮したほうがよい結果を与えることを示している．