唯物是真 @Scaled_Wurm

プログラミング(主にPython2.7)とか機械学習とか

来年は機械学習のコンペにもうちょっと参加したい

今年はいろいろ開催されたのに全然参加できなかった
目標に「kaggleに参加する」とか書いてた気がするんだけど……
画像認識系だとまったく手が出ないのもなんとかしたい

機械学習のコンペは、訓練データが与えられてそれで何かしら予測モデルを作って予測結果を提出するっていう形式が多いです
途中のランキング用のデータと最終評価用のデータが別にあってうまく予測できているかを競います
賞金付きなのが結構多く、学生限定とかの出場制限もあまりありません
ちなみに素性エンジニアリングとかをがんばるのなら時間がある方が有利かなと思うので学生の人におすすめです(?)

コンペが開催されてるサイト

kaggle(英語)

一番の大手。参加者が多くて相手が強すぎる感じもする
終了後にフォーラムとかブログとかで手法が公開されていることが多いので参考になる

OPT DataScienceLab(日本語)

日本語のコンペサイトの中では最近活発なイメージ
直近のコンペでleakageが話題になってたけどどうなったんだろう?


CrowdSolving(日本語)

最近は学生向けのコンペをやってたけど、もう学生でないので参加できない……
前に賞金をいただきました

クラソル(CrowdSolving)の第3回コンペの結果: 1/16位 - 唯物是真 @Scaled_Wurm

CrowdSolving「【チャレンジコンペ】記事間のリンク推定」の「入賞者の予測手法紹介」が公開されていた - 唯物是真 @Scaled_Wurm

TopCoderマラソンマッチ(英語)

競技プログラミングで有名なTopCoderだけど、マラソンマッチ(長期間のコンテスト)では機械学習系のコンテストも多い(だいたい賞金付き)
提出形式とか使えるライブラリとかが特殊(ソースコードを1ファイルで提出、実行時間に制限があるのが多い)なのと、開催期間が2週間ぐらいと短いことが多いのが特徴
下のは今年唯一参加した機械学習系のコンペですが、簡単な手法でそこそこの順位でした

TopCoder マラソンマッチ AlleleClassifier に参加した(11/154位) - 唯物是真 @Scaled_Wurm

その他

これら以外にも2014年はZOZOTOWNのデータを使ったコンペとかがあった