2012-05-01から1ヶ月間の記事一覧
新たなベターJavaScriptとしてJSX - a faster, safer, easier alternative to JavaScriptというものが公開されていたので触ってみました。 Windowsだとそのままでは動かないっぽいです。 必要なもの Github for Windows(git) node.js (perlも必要かも) 手順 …
機械学習の分野でPrecisionとRecallの調和平均であるF値(F-measure)を評価指標として使うことがあります。 しかし「F値」という言葉は他の意味で使われることもあり、曖昧性の高い単語です。 どんなものがあるかググって調べてみました。 F-measure 先に書い…
いつのまにかリポジトリのwatchのところから見れなくなっていました(?) 方法 リポジトリのURLの最後に/watchersを足す リポジトリのオーナーのページのリポジトリ一覧から、目的のリポジトリの目のマークをクリック 各リポジトリのwatcherの数値のところ…
Semi-Supervised SimHash for Efficient Document Similarity Search ACL2011の論文. 概要 類似文書検索のタスク。 既存の半教師ありのハッシュによる手法は、PCAやSVDライクな手法を用いているため、計算量が大きくまたビットを増やすほど曖昧なビットが増…
Word Maturity: Computational Modeling of Word Knowledge ACL2011の論文. 概要 単語の難しさを年齢(学年?)ごとに分けるタスク。 含まれる年齢の範囲の異なるコーパス(1, 1-2, 1-3,..., adult)から単語頻度-文書行列を作成。 adult以外のそれぞれについて…
Autonomous Self-Assessment of Autocorrections: Exploring Text Message Dialogue NAACL2012の論文. 概要 SMSなどでの会話では入力の補助として,単語の訂正(ここでは補完を含む)のシステムが使われていることが多い. しかし,そういったシステムは間違…
PDF ACL2011の論文. 概要 最近食べログとかのステマが話題になりましたが,この研究は数値によるレビューではなく文章によるレビューに対するspamの検出. Amazon Mechanical Turkを使って偽の褒めるレビューを書いてもらって,それと実際の高評価のレビュ…
いつの間にか自作の拡張に一ヶ月ぐらい前にレビュー(というか要望)がついていたのに気づきました. デベロッパー ダッシュボードに何の表示もないし,メールが送られてくるわけでもないし,気づく要素が何もないです. なんか設定とかで変えられないんですか…
"Using paraphrases for improving first story detection in news and Twitter" NAACL2012の論文。 パラフレーズ(言い換え)を利用してTwitterからFirst Story Detection(FSD)を行う。 概要 表現の多様性がFSDのタスクでは問題になる。 そこでパラフレーズの…