機械学習
"Exploring Topic Coherence over many models and many topics" 概要 トピックモデル[LSA(SVDによる), LSA(NMFによる), LDA]の比較を行う。 出力したトピックのコヒーレンス(一貫性)を近年提案された手法(UCI measure, UMass measure)の平均やエントロピー…
知り合いが書いたコードがまったくnumpyの機能を使ってなかったのでついカッとなって書いた。 今では反省している。 numpyを使うときはできるだけforループとインデックスによるアクセスを使わずに、行列・ベクトル単位で演算するのが基本的なやり方(Rとかと…
機械学習の分野でPrecisionとRecallの調和平均であるF値(F-measure)を評価指標として使うことがあります。 しかし「F値」という言葉は他の意味で使われることもあり、曖昧性の高い単語です。 どんなものがあるかググって調べてみました。 F-measure 先に書い…
「パターン認識と機械学習(PRML)」を読むとまず「ベイズ的ってなに?」ていうのでつまづきます. 事前分布を考えてベイズの定理を使えばいいのかと思えば,「もっとベイズ的にすると云々」という文章が登場. 「ベイズ的」ってのは,「すごくベイズ的」だっ…
ちょっと前にサザエさん ジャンケン学というサイトが話題になりました. その時はてブのコメントに「誰か機械学習で三値分類してくれればよいのに」的なことを書いたのですが,実際にやっている人を発見したので紹介しておきます. 問題設定 過去のサザエさ…
Deep Boltzmann MachinesのRuslan Salakhutdinov先生の講演を聞く機会があってDeep Learning面白そうだな〜と思いました。 Deep LearningというのはDeep Belief Networkとかいろいろな手法があるのですが、簡単に言うとニューラル・ネットワークのような多層…
「日本統計学会創立75周年記念出版『21世紀の統計科学』(全3巻) 増補HP版 (2012年1月)というものが以下のURLで公開されています. 日本統計学会75周年記念出版 目次を読んでみると面白そうな章が多いです. とりあえず機械学習や自然言語処理などで使いそう…
Topic Modeling Ensembles 概要 ICDM 2010の論文. PLSA(PLSI)やLDAなどのトピックモデルに,アンサンブル学習の枠組みを導入する. トピックモデル ある文書内の単語があるトピックをもとに生成されたと考えて,文書とトピック,単語間の関係を推定するモデ…
研究室のPython勉強会で単純パーセプトロンを実装してたので,Rの便利さを布教するためについカッとなって書いてみた. Rだと内積が使えるから実装が簡単です.forやwhileをできるだけ避けるように書いてみたのですが,永続付値とどっちがコストが大きいんで…