唯物是真 @Scaled_Wurm

プログラミング(主にPython2.7)とか機械学習とか

機械学習

論文感想: "Exploring Topic Coherence over many models and many topics"(EMNLP-CoNLL 2012)

"Exploring Topic Coherence over many models and many topics" 概要 トピックモデル[LSA(SVDによる), LSA(NMFによる), LDA]の比較を行う。 出力したトピックのコヒーレンス(一貫性)を近年提案された手法(UCI measure, UMass measure)の平均やエントロピー…

numpyを使ってK-meansを書いてみた

知り合いが書いたコードがまったくnumpyの機能を使ってなかったのでついカッとなって書いた。 今では反省している。 numpyを使うときはできるだけforループとインデックスによるアクセスを使わずに、行列・ベクトル単位で演算するのが基本的なやり方(Rとかと…

いろいろなF値

機械学習の分野でPrecisionとRecallの調和平均であるF値(F-measure)を評価指標として使うことがあります。 しかし「F値」という言葉は他の意味で使われることもあり、曖昧性の高い単語です。 どんなものがあるかググって調べてみました。 F-measure 先に書い…

ベイズ的ってなに?

「パターン認識と機械学習(PRML)」を読むとまず「ベイズ的ってなに?」ていうのでつまづきます. 事前分布を考えてベイズの定理を使えばいいのかと思えば,「もっとベイズ的にすると云々」という文章が登場. 「ベイズ的」ってのは,「すごくベイズ的」だっ…

サザエさんのじゃんけん予測問題のサーベイ

ちょっと前にサザエさん ジャンケン学というサイトが話題になりました. その時はてブのコメントに「誰か機械学習で三値分類してくれればよいのに」的なことを書いたのですが,実際にやっている人を発見したので紹介しておきます. 問題設定 過去のサザエさ…

Deep Learningが面白そう

Deep Boltzmann MachinesのRuslan Salakhutdinov先生の講演を聞く機会があってDeep Learning面白そうだな〜と思いました。 Deep LearningというのはDeep Belief Networkとかいろいろな手法があるのですが、簡単に言うとニューラル・ネットワークのような多層…

「日本統計学会創立75周年記念出版『21世紀の統計科学』(全3巻) 増補HP版 (2012年1月)」

「日本統計学会創立75周年記念出版『21世紀の統計科学』(全3巻) 増補HP版 (2012年1月)というものが以下のURLで公開されています. 日本統計学会75周年記念出版 目次を読んでみると面白そうな章が多いです. とりあえず機械学習や自然言語処理などで使いそう…

読んだ論文: Topic Modeling Ensembles

Topic Modeling Ensembles 概要 ICDM 2010の論文. PLSA(PLSI)やLDAなどのトピックモデルに,アンサンブル学習の枠組みを導入する. トピックモデル ある文書内の単語があるトピックをもとに生成されたと考えて,文書とトピック,単語間の関係を推定するモデ…

Rで単純パーセプトロンを実装

研究室のPython勉強会で単純パーセプトロンを実装してたので,Rの便利さを布教するためについカッとなって書いてみた. Rだと内積が使えるから実装が簡単です.forやwhileをできるだけ避けるように書いてみたのですが,永続付値とどっちがコストが大きいんで…