概要
フリーな辞書のWiktionaryを利用して、弱教師あり形態素解析を行う。
Wiktionaryに登録されている品詞が選ばれるように制限をかけて,隠れマルコフモデルをEMアルゴリズムを用いて学習.
Unsupervisedな場合よりも良い結果が得られた.
また近年提案されているバイリンガルなパラレルコーパスを用いた手法と比べても,同等かそれ以上の結果を示した.
注意点は,辞書の利用法として今回の手法が優れているわけではなく,辞書を使った従来手法でも同様の結果が得られること.
今回のタスクでは利用していないが,Wiktionaryには単語の説明や翻訳なども記載されていて,様々なタスクでの利用が期待できる
感想
Wiki-lyとWeaklyをかけたタイトルが面白い
検索などでWiktionaryをたまに見かけることはあったけど,こういう実用的なタスクに使えるほど整備されてるとは知らなかったので興味深かった.
日本語版の出来はどうなんでしょうね.
間違えて記事を消してしまったのを記憶によって書きなおしたのでちょっと間違っているところがあるかもしれません…….