唯物是真 @Scaled_Wurm

プログラミング(主にPython2.7)とか機械学習とか

読んだ論文: "Self-adjusting Bootstrapping", Shoji Fujiwara and Satoshi Sekine, CICLing 2011

ブートストラップ法って?

シードに似たアイテムのグループを抽出する方法として用いられている.
シードからコンテキストを見つけて,次にコンテキストを利用してアイテムを見つけるという過程をくりかえす.
例,クリントン,ブッシュ→○○大統領→オバマ

パラメータの推定(この論文の肝)

ブートストラップ法には多くのパラメータがあり,最適な値はタスクにより異なる.
この論文ではシードを評価用のシードとそれ以外に分割し,クロスバリデーションを行って最適なパラメータを推定している.
最適なパラメータが求められたら,あらためてすべてのシード使ってブートストラップ法を行う.
全体で単一のパラメータを使うよりもカテゴリーごとに本手法で求めたパラメータを用いたほうがよい結果が得られた.