唯物是真 @Scaled_Wurm

プログラミング(主にPython2.7)とか機械学習とか

IBM翻訳モデルの違いメモ

いずれも単語ベースの統計的機械翻訳手法.
単語のアラインメントの概念が重要.


番号の大きいモデルは小さなモデルを含む.

Model 1
異なる言語間の単語の翻訳確率を推定.
Model 2
文章中の単語の(絶対的)位置を考慮.
Model 3
単語が翻訳される個数を考慮.複数の単語に翻訳されたり,どの単語にも翻訳されない場合がある.
Model 4
単語の(相対的)位置を考慮.
Model 5
複数の単語が同じ位置になってしまう問題を解消.

推定手法

モデル2以下はEMアルゴリズム
モデル3以上は山登り法など.

参考

Statistical Machine Translation

Statistical Machine Translation