WindowsでJSXを動かそう

新たなベターJavaScriptとしてJSX - a faster, safer, easier alternative to JavaScriptというものが公開されていたので触ってみました。 Windowsだとそのままでは動かないっぽいです。必要なもの Github for Windows(git) node.js (perlも必要かも) 手順 …

2012-05-18

いろいろなF値

機械学習

機械学習の分野でPrecisionとRecallの調和平均であるF値(F-measure)を評価指標として使うことがあります。しかし「F値」という言葉は他の意味で使われることもあり、曖昧性の高い単語です。どんなものがあるかググって調べてみました。 F-measure 先に書い…

2012-05-10

githubでwatchしている人の一覧を見る方法

いつのまにかリポジトリのwatchのところから見れなくなっていました（？）方法リポジトリのURLの最後に/watchersを足すリポジトリのオーナーのページのリポジトリ一覧から、目的のリポジトリの目のマークをクリック各リポジトリのwatcherの数値のところ…

2012-05-08

論文感想: "Semi-Supervised SimHash for Efficient Document Similarity Search"

論文自然言語処理

Semi-Supervised SimHash for Efficient Document Similarity Search ACL2011の論文．概要類似文書検索のタスク。既存の半教師ありのハッシュによる手法は、PCAやSVDライクな手法を用いているため、計算量が大きくまたビットを増やすほど曖昧なビットが増…

2012-05-08

論文感想: "Word Maturity: Computational Modeling of Word Knowledge"

論文自然言語処理

Word Maturity: Computational Modeling of Word Knowledge ACL2011の論文．概要単語の難しさを年齢(学年？)ごとに分けるタスク。含まれる年齢の範囲の異なるコーパス(1, 1-2, 1-3,..., adult)から単語頻度-文書行列を作成。 adult以外のそれぞれについて…

2012-05-05

論文感想: "Autonomous Self-Assessment of Autocorrections: Exploring Text Message Dialogue"

論文自然言語処理

Autonomous Self-Assessment of Autocorrections: Exploring Text Message Dialogue NAACL2012の論文．概要 SMSなどでの会話では入力の補助として，単語の訂正(ここでは補完を含む)のシステムが使われていることが多い．しかし，そういったシステムは間違…

2012-05-04

論文感想: "Finding Deceptive Opinion Spam by Any Stretch of the Imagination"

論文自然言語処理

PDF ACL2011の論文．概要最近食べログとかのステマが話題になりましたが，この研究は数値によるレビューではなく文章によるレビューに対するspamの検出． Amazon Mechanical Turkを使って偽の褒めるレビューを書いてもらって，それと実際の高評価のレビュ…

2012-05-03

Chromeウェブストアの拡張機能のレビューって作者に通知されないんですね

chrome extension

いつの間にか自作の拡張に一ヶ月ぐらい前にレビュー(というか要望)がついていたのに気づきました．デベロッパーダッシュボードに何の表示もないし，メールが送られてくるわけでもないし，気づく要素が何もないです．なんか設定とかで変えられないんですか…

2012-05-02

論文感想"Using paraphrases for improving first story detection in news and Twitter"

論文

"Using paraphrases for improving first story detection in news and Twitter" NAACL2012の論文。パラフレーズ(言い換え)を利用してTwitterからFirst Story Detection(FSD)を行う。概要表現の多様性がFSDのタスクでは問題になる。そこでパラフレーズの…