唯物是真 @Scaled_Wurm

プログラミング(主にPython2.7)とか機械学習とか

MeCabの出力フォーマット

形態素解析MeCab分かち書きを得たい時には-Owakati、読みを得たい時には-Oyomiとかオプションを付けますが、もっと細かくフォーマットを指定することができるみたいです。
いくつか試してみたので、書いときます。

形態素と品詞のペア

mecab -F"%m-%f[0] " -U"%m-未知語 " -E"\n"
竹やぶ焼けた
竹やぶ-名詞 焼け-動詞 た-助動詞

原型に戻した形の分かち書き

%fの後の番号は辞書によって異なる。以下はIPADicの番号。
UniDicだと%f[12]。

mecab -F"%f[6] " -U"%m " -E"\n"
竹やぶ焼けた
竹やぶ 焼ける た
-->