唯物是真 @Scaled_Wurm

プログラミング(主にPython2.7)とか機械学習とか

2012-05-01から1ヶ月間の記事一覧

WindowsでJSXを動かそう

新たなベターJavaScriptとしてJSX - a faster, safer, easier alternative to JavaScriptというものが公開されていたので触ってみました。 Windowsだとそのままでは動かないっぽいです。 必要なもの Github for Windows(git) node.js (perlも必要かも) 手順 …

いろいろなF値

機械学習の分野でPrecisionとRecallの調和平均であるF値(F-measure)を評価指標として使うことがあります。 しかし「F値」という言葉は他の意味で使われることもあり、曖昧性の高い単語です。 どんなものがあるかググって調べてみました。 F-measure 先に書い…

githubでwatchしている人の一覧を見る方法

いつのまにかリポジトリのwatchのところから見れなくなっていました(?) 方法 リポジトリのURLの最後に/watchersを足す リポジトリのオーナーのページのリポジトリ一覧から、目的のリポジトリの目のマークをクリック 各リポジトリのwatcherの数値のところ…

論文感想: "Semi-Supervised SimHash for Efficient Document Similarity Search"

Semi-Supervised SimHash for Efficient Document Similarity Search ACL2011の論文. 概要 類似文書検索のタスク。 既存の半教師ありのハッシュによる手法は、PCAやSVDライクな手法を用いているため、計算量が大きくまたビットを増やすほど曖昧なビットが増…

論文感想: "Word Maturity: Computational Modeling of Word Knowledge"

Word Maturity: Computational Modeling of Word Knowledge ACL2011の論文. 概要 単語の難しさを年齢(学年?)ごとに分けるタスク。 含まれる年齢の範囲の異なるコーパス(1, 1-2, 1-3,..., adult)から単語頻度-文書行列を作成。 adult以外のそれぞれについて…

論文感想: "Autonomous Self-Assessment of Autocorrections: Exploring Text Message Dialogue"

Autonomous Self-Assessment of Autocorrections: Exploring Text Message Dialogue NAACL2012の論文. 概要 SMSなどでの会話では入力の補助として,単語の訂正(ここでは補完を含む)のシステムが使われていることが多い. しかし,そういったシステムは間違…

論文感想: "Finding Deceptive Opinion Spam by Any Stretch of the Imagination"

PDF ACL2011の論文. 概要 最近食べログとかのステマが話題になりましたが,この研究は数値によるレビューではなく文章によるレビューに対するspamの検出. Amazon Mechanical Turkを使って偽の褒めるレビューを書いてもらって,それと実際の高評価のレビュ…

Chromeウェブストアの拡張機能のレビューって作者に通知されないんですね

いつの間にか自作の拡張に一ヶ月ぐらい前にレビュー(というか要望)がついていたのに気づきました. デベロッパー ダッシュボードに何の表示もないし,メールが送られてくるわけでもないし,気づく要素が何もないです. なんか設定とかで変えられないんですか…

論文感想"Using paraphrases for improving first story detection in news and Twitter"

"Using paraphrases for improving first story detection in news and Twitter" NAACL2012の論文。 パラフレーズ(言い換え)を利用してTwitterからFirst Story Detection(FSD)を行う。 概要 表現の多様性がFSDのタスクでは問題になる。 そこでパラフレーズの…