唯物是真 @Scaled_Wurm

プログラミング(主にPython2.7)とか機械学習とか

MeCabのバリエーションいろいろ

一番使われている(ような気がする)日本語形態素解析器のMeCabのバリエーションについて調べた.

Sen, GoSen

Java移植版.
現在はサイトにアクセス出来ない.

NMecab

.NET移植版.C#で書かれている.
辞書作成はできず,解析処理のみ.

Igo

様々な言語に移植されている.
解析結果がMeCabと若干異なるらしい.

Pythonへの移植

辞書の作成機能はなし.

Rubyへの移植

辞書の作成機能はなし.

Gomoku

Java版Igoの辞書同梱版.
Google App Engine上でも問題なく動作するらしい.

junsai

Java移植版.
UTF-16を内部コードとして利用.