2012-07-11 MeCabの出力フォーマット 自然言語処理 形態素解析機MeCabで分かち書きを得たい時には-Owakati、読みを得たい時には-Oyomiとかオプションを付けますが、もっと細かくフォーマットを指定することができるみたいです。 いくつか試してみたので、書いときます。 形態素と品詞のペア mecab -F"%m-%f[0] " -U"%m-未知語 " -E"\n" 竹やぶ焼けた 竹やぶ-名詞 焼け-動詞 た-助動詞 原型に戻した形の分かち書き %fの後の番号は辞書によって異なる。以下はIPADicの番号。 UniDicだと%f[12]。 mecab -F"%f[6] " -U"%m " -E"\n" 竹やぶ焼けた 竹やぶ 焼ける た 参考 出力フォーマット MeCabのコマンドライン引数一覧とその実行例 | mwSoft