唯物是真 @Scaled_Wurm

プログラミング(主にPython2.7)とか機械学習とか

2012-10-01から1ヶ月間の記事一覧

GitHubで「実績解除」ができる"coderwall"

GitHubをゲーミフィケーション化して、いわゆる「実績解除」ができるようになるcoderwallというサイトがあったので登録してみました。 coderwall.com : mugenen's profile 実績解除できたのは「○○言語で○個プロジェクトを作る」と「forkしてcommitする」だけ…

論文感想: "Ergodic multigram HMM integrating word segmentation and class tagging for Chinese language modeling"(ICASSP-96)

概要 1996年のかなり古い論文。 隠れマルコフモデル(Hidden Markov Model, HMM)で中国語の形態素解析(単語分割と品詞タグ付け)をする話。 感想 中国語や日本語などの分かち書きされていない言語で、HMMを使って単語分割と品詞タグ付けをする場合の式を知りた…

std::threadを使った時にハマったところ

c++

コンパイル時 g++でコンパイルするときに-lpthreadしないとダメ。 std::threadの引数 参照渡しをするときには明示的にstd::refで渡さないとダメ。

std::unordered_mapをboost::serializationしたい

c++

結論 検索した程度では方法は見つからなかった 代替案 #include <boost/tr1/unordered_map.hpp>してstd::tr1::unordered_mapを使う。 すると#include <boost/serialization/unordered_map.hpp>でシリアライズできる。</boost/serialization/unordered_map.hpp></boost/tr1/unordered_map.hpp>

unordered_mapでpairとかを使うときにはhashを定義しないと動かないらしい

c++

unordered_mapにpairを突っ込んだら動かなくて悩んだんですが、自分の作ったクラスだけでなくpairとかtupleでもhashを定義しないと動かないみたいです。namespace stdに指定する方法とハッシュ関数をunordered_mapに渡す方法の2種類があるみたいですが、とり…

Pixiv Bookmark with Star version 1.3

pixivでブックマークするときに同時に10点評価するChrome拡張を書きました - 唯物是真 @Scaled_Wurm ユーザー数が一桁しかいない誰得拡張ですが、pixiv側の変化で使えなくなっていたので直しておきました。なぜかイラスト側と小説側で使うJavaScriptの関数が…

論文感想: "Automatically Constructing a Normalisation Dictionary for Microblogs"(EMNLP-CoNLL 2012)

"Automatically Constructing a Normalisation Dictionary for Microblogs" 概要 Twitterとかでの単語の正規化用の辞書を作る話。 例、2morw→tomorrow 手法 文脈類似度の似た、辞書にない単語(OOV)と辞書にある単語(IVのペア)を集める 集めたペアを文字列的…

論文感想: "Adversarial Support Vector Machine Learning"(KDD 2012)

"Adversarial Support Vector Machine Learning" 概要 敵対的学習の話。 spam検出や侵入検出などの相手がチェックをかいくぐろうとして通常に見せかけようとする場合の機械学習。 See: 敵対的学習 - 機械学習の「朱鷺の杜Wiki」 先行研究では悪意のある敵対…