唯物是真 @Scaled_Wurm

プログラミング(主にPython2.7)とか機械学習とか

論文感想: "Multi-Domain Learning: When Do Domains Matter?"(EMNLP-CoNLL 2012)

概要

マルチドメインラーニング(MDL)におけるいくつかの疑問に対する検証.

MDLによる精度上昇は必ずしもドメインの影響ではなく,アンサンブルの効果ではないか?

ドメインラベルをランダムに入れ替えても,いくつかのMDLの手法は単一のSVMよりも精度が向上した.
正しいドメインラベルの時はそれ以上に精度が向上している.
このことからMDLによる精度向上には,手法によってはドメイン以外の効果もある程度含まれていると考えられる.

ドメインごとの事例数の偏りが精度の改善の大きな要因なのではないか?

偏りの情報を与えるだけでも大きな改善が見られた.

感想

ドメイン関係の研究(ドメイン適応)などは実験設定が疑問に思える事が多かったので,この論文は興味深かった.
比較されている各手法を理解していないので,少し誤読があるかもしれません.