唯物是真 @Scaled_Wurm

プログラミング(主にPython2.7)とか機械学習とか

論文感想: "Ergodic multigram HMM integrating word segmentation and class tagging for Chinese language modeling"(ICASSP-96)

概要

1996年のかなり古い論文。
隠れマルコフモデル(Hidden Markov Model, HMM)で中国語の形態素解析(単語分割と品詞タグ付け)をする話。

感想

中国語や日本語などの分かち書きされていない言語で、HMMを使って単語分割と品詞タグ付けをする場合の式を知りたかったのだけど、本を読んでも見つからなかったので読みました。
たぶん日本語資料も探せば見つかるんだと思うのですが、Google検索して最初に見つかったのがこれでした。

一緒に↓の本も参考にしていましたが、この本はわかりやすくてオススメです。
ただし単語分割と品詞タグ付けのそれぞれの場合についての式は書いてあるのですが、それらを組み合わせた場合については書いてありません。
それら2つがわかれば自分で簡単に導けるという話なのかもしれませんが……。

言語と計算 (4) 確率的言語モデル

言語と計算 (4) 確率的言語モデル