唯物是真 @Scaled_Wurm

プログラミング(主にPython2.7)とか機械学習とか

2012-01-01から1年間の記事一覧

ヤオコーのWebサイト( www.yaoko-net.com )で見かけた脆弱性

修正されたようなので簡単にメモっておきます。 お知らせが公開されていたヤオコーのWebページのURLが以下のようになっていました。 http://www.yaoko-net.com/ir/document.php?date=日付&title=タイトル&url=アドレス XSSを見慣れた人ならタイトルやアドレ…

Project Euler Problem 243

Problem 243 - Project Euler ある数dを分母としたとき,分子がd以下のそれ以上約分できない分数の個数をR(d)とする. このときR(d)/d たとえばd = 12ならR(d)は4個(1/12, 5/12, 7/12, 11/12). オイラーのトーティエント関数で互いに素な個数を求めるのをエ…

Chrome拡張にEvent pages(Background Pagesの必要な時だけロードされる版)が追加されるらしい

Event Pages - Google Chrome Extensions - Google Code まだ開発版の話みたいですがChrome拡張にEvent Pagesというものが追加されるそうです. これは拡張の裏側で動作し続けているBackground Pagesに似ていますが,メッセージが送られてきた時などの必要な…

英語の語彙力の測定テスト〜英単語のボキャブラリーレベル計測試験〜 - Weblio

http://uwl.weblio.jp/vocab-index 久しぶりにやったらスコアが良かったのでメモ。 今回のweblio語彙力診断結果は「レベル23」推定語彙数「16001〜17000語」称号「達人」grade「savant」回答時間「1分19秒」スコア「160.2」 #vocab_test わりとスコアの分散…

知り合いのサイトでXSSを探してみた

知り合いのサイト(承諾済み)にいろんな入力を投げてXSSを探してみました. まず手始めにユーザー名にscript要素を入れておくと,ユーザー登録画面でスクリプトが動作しました. 他の画面だとタグは全てフィルタされていたので,あまり使わない登録画面だけ見…

「Pixiv Tag Suggest」version 3.2

Pixiv Tag Suggest pixivでブックマーク時にタグの推薦を行うChrome拡張. 詳細は以下のURLを. Chrome ウェブストア - Pixiv Tag Suggest 「Pixiv Tag Suggest」に学習機能を追加しました - 唯物是真 @Scaled_Wurm pixivでブックマークタグをサジェストする…

numpyを使ってK-meansを書いてみた

知り合いが書いたコードがまったくnumpyの機能を使ってなかったのでついカッとなって書いた。 今では反省している。 numpyを使うときはできるだけforループとインデックスによるアクセスを使わずに、行列・ベクトル単位で演算するのが基本的なやり方(Rとかと…

Twitter Translation Centerが色々と変わってた

Twitterのボランティア翻訳者に与えられるバッジが各国語の上位20%の人にしか表示されなくなったらしいですね。 あと自分が上位何%とかわかるようになったみたい。 参考 Twitter Translation Center Twitter Translation Center 追記 最近は上位60%(TRANSLAT…

自動2chまとめblog生成?

ここ数日2chまとめblogに対する転載禁止が話題になっています 2ちゃんねる、一部まとめサイトを名指しで「転載禁止」に? - ITmedia ニュース その影響なのか前からなのか、痛いニュース(ノ∀`) - ライブドアブログが記事の最後に転載元スレのURLを載せるよう…

1行のPull Requestを送るのは申し訳ない気もする

というわけで昨日見つけたバグ(?)についてPull Requestを送って、ありがたいことに無事取り入れていただきました。 https://github.com/jsx/JSX/pull/2 Windows環境でも問題なく動いてる人がTwitterにいたのですが、--runオプションで動かしていなかったの…

WindowsでJSXを動かそう

新たなベターJavaScriptとしてJSX - a faster, safer, easier alternative to JavaScriptというものが公開されていたので触ってみました。 Windowsだとそのままでは動かないっぽいです。 必要なもの Github for Windows(git) node.js (perlも必要かも) 手順 …

いろいろなF値

機械学習の分野でPrecisionとRecallの調和平均であるF値(F-measure)を評価指標として使うことがあります。 しかし「F値」という言葉は他の意味で使われることもあり、曖昧性の高い単語です。 どんなものがあるかググって調べてみました。 F-measure 先に書い…

githubでwatchしている人の一覧を見る方法

いつのまにかリポジトリのwatchのところから見れなくなっていました(?) 方法 リポジトリのURLの最後に/watchersを足す リポジトリのオーナーのページのリポジトリ一覧から、目的のリポジトリの目のマークをクリック 各リポジトリのwatcherの数値のところ…

論文感想: "Semi-Supervised SimHash for Efficient Document Similarity Search"

Semi-Supervised SimHash for Efficient Document Similarity Search ACL2011の論文. 概要 類似文書検索のタスク。 既存の半教師ありのハッシュによる手法は、PCAやSVDライクな手法を用いているため、計算量が大きくまたビットを増やすほど曖昧なビットが増…

論文感想: "Word Maturity: Computational Modeling of Word Knowledge"

Word Maturity: Computational Modeling of Word Knowledge ACL2011の論文. 概要 単語の難しさを年齢(学年?)ごとに分けるタスク。 含まれる年齢の範囲の異なるコーパス(1, 1-2, 1-3,..., adult)から単語頻度-文書行列を作成。 adult以外のそれぞれについて…

論文感想: "Autonomous Self-Assessment of Autocorrections: Exploring Text Message Dialogue"

Autonomous Self-Assessment of Autocorrections: Exploring Text Message Dialogue NAACL2012の論文. 概要 SMSなどでの会話では入力の補助として,単語の訂正(ここでは補完を含む)のシステムが使われていることが多い. しかし,そういったシステムは間違…

論文感想: "Finding Deceptive Opinion Spam by Any Stretch of the Imagination"

PDF ACL2011の論文. 概要 最近食べログとかのステマが話題になりましたが,この研究は数値によるレビューではなく文章によるレビューに対するspamの検出. Amazon Mechanical Turkを使って偽の褒めるレビューを書いてもらって,それと実際の高評価のレビュ…

Chromeウェブストアの拡張機能のレビューって作者に通知されないんですね

いつの間にか自作の拡張に一ヶ月ぐらい前にレビュー(というか要望)がついていたのに気づきました. デベロッパー ダッシュボードに何の表示もないし,メールが送られてくるわけでもないし,気づく要素が何もないです. なんか設定とかで変えられないんですか…

論文感想"Using paraphrases for improving first story detection in news and Twitter"

"Using paraphrases for improving first story detection in news and Twitter" NAACL2012の論文。 パラフレーズ(言い換え)を利用してTwitterからFirst Story Detection(FSD)を行う。 概要 表現の多様性がFSDのタスクでは問題になる。 そこでパラフレーズの…

Project Euler 124

Problem 124 - Project Euler エラトステネスのふるい的に素因数分解、積を求めてソート。 def rad(MAX): rad = [1] * MAX i = 2 while MAX + 1 > i: if rad[i - 1] == 1: rad[i - 1] *= i temp = i * 2 while temp < MAX + 1: rad[temp - 1] *= i temp += i…

Google Code Jam 2012 Qualification Round問題B, C

二時間ぐらいかけてBとCだけ解けた. B 値がp+2*(p-1)以上の個数と,あるいは値がp+2*(p-2)以上の個数(S個まで)を足せばよい. C 数値の前半と後半を入れ替えた時に以下をチェックすればよい. 先頭が0でない 元の数値と等しくない 値が範囲内 すでに出てい…

Googleの「画像で検索」ってAPIとかないんですか?

Google 画像検索には「画像で検索」(Search by Image)という機能があり,画像から似た画像を探すことができます. これを自動的に叩ければ画像の配布元を見つけたり,転載の検出とかできるのではないかと思って試しにAPIがないか調べてみたのですが,見つか…

ベイズ的ってなに?

「パターン認識と機械学習(PRML)」を読むとまず「ベイズ的ってなに?」ていうのでつまづきます. 事前分布を考えてベイズの定理を使えばいいのかと思えば,「もっとベイズ的にすると云々」という文章が登場. 「ベイズ的」ってのは,「すごくベイズ的」だっ…

サザエさんのじゃんけん予測問題のサーベイ

ちょっと前にサザエさん ジャンケン学というサイトが話題になりました. その時はてブのコメントに「誰か機械学習で三値分類してくれればよいのに」的なことを書いたのですが,実際にやっている人を発見したので紹介しておきます. 問題設定 過去のサザエさ…

非C++使いがC++に触って困ったこと

C++

たぶん機能を知らないだけなのもいくつかある気がする. エラーメッセージの意味がわからない エラーメッセージの行番号が書き間違えてる場所とぜんぜん違う 配列の長さがsizeofしないとわからない 文字列操作が貧弱 テンプレートを使うと型名がすごく長くな…

「Pixiv Tag Suggest」version 2.8

Pixiv Tag Suggest pixivでブックマーク時にタグの推薦を行うChrome拡張. 詳細は以下のURLを. Chrome ウェブストア - Pixiv Tag Suggest 「Pixiv Tag Suggest」に学習機能を追加しました - 唯物是真 @Scaled_Wurm pixivでブックマークタグをサジェストする…

AtCoderという日本語プログラミングコンテストが始まるらしい

AtCoder 第1回コンテスト - 4/14 21:00 ~ 22:30に 第1回 AtCoderコンテスト を開催! id:chokudaiさんが日本語の競技プログラミングコンテストを始めるらしいです. 【お知らせ】日本語によるプログラミングコンテストを定期開催します。初コンテストは4/14の…

KyTea 0.4.1ではWindows版バイナリも配布するらしい

以前形態素解析器KyTeaがWindowsで使えるようになったらしいという記事を書きましたが,コンパイル済みバイナリの配布が始まったみたいです. KyTea 0.4.1をリリースしました URL !主に変わっているのはWindows版が(やっと)できたところです。それ以外、…

タイピングゲームで英単語学習

タイピングゲームのタイプウェルの英単語版をやって英単語を覚えよう! 私は大学受験前に英語の勉強と称してやってました(ぇ 最高でXDまでしかいけませんでしたが,タイプ速度の上昇には単語を覚えるのは必須なのではかどります. 問題点は単語の形を覚えら…

CoffeeScript関係のデメリットについて書いた記事をいくつか見かけた

はてなブックマークにCoffeeScriptの批判記事が上がってて色々見てみた. 簡潔に書けるのが利点なのはいいとして,批判点としては以下のようなものが挙げられていました. JavaScriptとCoffeeScriptの両方の知識が必要 デバッグが大変 CoffeeScriptが廃れる…