唯物是真 @Scaled_Wurm

プログラミング(主にPython2.7)とか機械学習とか

2012-03-01から1ヶ月間の記事一覧

cProfileでpythonスクリプトのボトルネックを調べる

Pythonのスクリプトの遅い部分を調べるためにcProfileという標準のプロファイラを使ってみました.プロファイラというのはプログラムの実行効率を調べるツールです. cProfileを使うと関数が呼び出された回数(再帰の有無含む)や,どれぐらいの時間を処理に使…

Deep Learningが面白そう

Deep Boltzmann MachinesのRuslan Salakhutdinov先生の講演を聞く機会があってDeep Learning面白そうだな〜と思いました。 Deep LearningというのはDeep Belief Networkとかいろいろな手法があるのですが、簡単に言うとニューラル・ネットワークのような多層…

クリックするとjQueryを現在のページにロードしてくれるChrome拡張"jquery-injector"を入れてみた

Chrome Web Store - jquery-injector クリックしてjQueryをロードした後にJavaScriptコンソールでjQueryの関数が使えます. ブックマークレットでもいいような気もしますが,拡張になっているので更新に追随してくれるのではないかと期待. Greasemonkeyを超…

「最強のポケモンの生成」 - NLP2012のオノマトペ関係の論文

言語処理学会18回年次大会で音象徴の機械学習による再現:最強のポケモンの生成という面白そうなタイトルの論文があったので紹介します. 概要 「最強のポケモンの生成」というタイトルですが,ポケモン廃人的な意味ではなくて「どんな名前のポケモンが強そ…

単語感情極性対応表のミス?

日記の下書き一覧を見てたら,昔の書き上がってる記事があったので蔵出し. 「単語感情極性対応表」という単語がポジティブ(+1)かネガティブ(-1)かというスコアをつけた辞書が公開されています. 商品や人物などについてどんな評判が囁かれているかを推定す…

シリアライズ用のライブラリMessagePackを使ってみた

Pythonでシリアライズに使えるライブラリは標準でもpickleやjsonなどがありますが,研究室でMessagePackというものを使っている人がいたので試してみました. MessagePackはバイナリ形式に保存するタイプのもので高速かつ軽量とのこと. Python以外にも様々…

形態素解析器KyTeaがWindowsで使えるようになったらしい

KyTea (京都テキスト解析ツールキット)は読み推定などの機能がついた最新の形態素解析器です. おお、KyTeaがまともにWindowsで動きました!v. 0.4.1からWindows版も配布できそうです。Windowsでのビルド説明書( URL )を書いてくれた @knzm2011 さんに感謝…

Twitterのつぶやきをはてなダイアリーで引用する方法

今更ですが,使い方がわからなかったので. ヘルプによるとツイートの指定方法は2種類あるそうですが,URLそのままのほうがわかりやすいと思います. title形式 シンプルな形式.長いつぶやきは省略されてしまう. [https://twitter.com/#!/Scaled_Wurm/stat…

日記を毎日書くのって大変ですね

ここ数週間ほど毎日日記を更新するという目標を持ってやっていたのですが,一ヶ月続けることができませんでした. 毎日かかさず更新を続けているブログや個人ニュースサイトの筆者の方々には尊敬の念を抱く他無いです. どんどん日記を書けば書くほどネタが…

単語の頻度からLDAまでの流れの簡単なイメージのメモ

トピックモデルのLDA(Latent Dirichlet Allocation)が難しいって話をよく聞きますけど,詳しい理論的な部分はともかくどういう流れに位置するものかってのはわかりやすいので簡単にメモ. 専門でないので,詳しくは参考文献を読んだほうがいいです. トピッ…

Chromeのリファラ制御

Chromeではa要素のrel='noreferrer'がサポートされていてGreaseMonkeyスクリプトなどから簡単にリファラ送信の抑制をすることができます. リファラを書き換えたい場合にはWeb Requests APIを使った拡張機能を作らないといけないようです. 参考記事 WebKit …

ニコニコ静画で画像ダウンロード用のリンクを追加するChrome拡張機能「Seiga Download」

Chrome ウェブストア - Seiga Download いつの間にか300ユーザー近くになっていたので,今更ですが紹介記事を書いておきます. だいぶ前から公開してますが,なんの反応も見たことが無いので本当にユーザーが居るのか心配です>< 概要 ニコニコ静画で画像の…

「日本統計学会創立75周年記念出版『21世紀の統計科学』(全3巻) 増補HP版 (2012年1月)」

「日本統計学会創立75周年記念出版『21世紀の統計科学』(全3巻) 増補HP版 (2012年1月)というものが以下のURLで公開されています. 日本統計学会75周年記念出版 目次を読んでみると面白そうな章が多いです. とりあえず機械学習や自然言語処理などで使いそう…

キュアピースのジャンケン

今日は勝ったらしいので4勝1敗ですね. カイ二乗検定 chisq.test(c(4,1,0))をRでやるとp値が0.07強になります.

はてなブログよりもはてなダイアリーの方を使う理由

基本的に無料の範囲の話です. シンタックスハイライト はてなブログでは使えない. gistなどの外部サービスを使う必要がある. 正確には言語によってはハイライトされるらしい. アクセス解析 はてなダイアリー版の方がページごとにアクセス元や検索ワード…

霊夢の嫁は誰なのか? - 紅魔郷編

同人弾幕STGで有名な東方Projectにはほとんど女性キャラしか登場しませんが,以下のように様々なカップリングが考えられています. 東方Projectのカップリング一覧 (とうほうぷろじぇくとのかっぷりんぐいちらん)とは【ピクシブ百科事典】 東方Projectのカッ…

最近読んだ面白かった本

日本語入力を支える技術 日本語入力の説明だけではなく,自然言語処理や機械学習の説明としてもわかりやすい. 様々なTrieや最新の機械学習アルゴリズムについて書かれた日本語の本は他に無いと思うので,非常におすすめ 日本語入力を支える技術 ?変わり続け…

npmでインストールしたライブラリが動かないと思ったらNODE_PATHを設定し忘れていた(Windows)

Windowsでnpm -gで入れたライブラリがコマンドラインでは呼び出せるのに,node.jsからrequireで呼ぶと以下のようなエラーメッセージが出て動かないので困っていました. Error: Cannot find module 'express' at Function._resolveFilename (module.js:332:1…

TwitterのアイコンでアニメーションGIFを使う

何年か前はTwitterでアニメーションGIFをアイコンにするときには拡張子を偽装したり,バイナリエディタでいじったりしないといけませんでした. いつの間にか制限が変わっていたようで,普通のアニメーションGIFのファイル(73*73px)をアップロードしても動く…

pull request後のリポジトリの修正

githubでforkしてpull requestしたあとに本家の過去の修正がコミットされて困りました. しかしpull request後でも修正が効くみたいで,本家のリポジトリを取ってきてrebase,のちgit push --forceでなんとかなりました. カタコトの英語でやりとりしてるの…

TopCoderなどのプログラミングコンテストの日付をGoogleカレンダーに読み込む

TopCoder以外にもCodeforcesなど様々な大会があってつい忘れてしまいます. そこではてなのTopCoder部のカレンダーを利用することにしました. このカレンダーはiCal形式によって配信されていて,Google Calendarに簡単にインポートできます. 「他のカレン…

ChromeをVimライクに操作するChrome拡張「Vichrome」を使い始めた

Chrome Web Store - Vichrome ニートなプログラマが世界を変える: Vichrome : vim風インタフェースを実現するChrome Extension 最近Vimを使おうと勉強しているので,ついでにChromeにも拡張を入れました. 慣れるまでは以前のショートカットキーと間違えそう…

node.jsのライブラリはWindowsだと動かないのがあるみたい?

以前はてブでnode.jsの開発時に。ファイル変更でサーバプロセスを自動再起動「Always」という記事が80ブクマ近くを集めていたのですが,Windows環境で試してみると動かないのでデバッグしました. とりあえずforkしたもの 調べてみたところ問題は以下の2つで…

pixivの無断転載への対応

先日pixivでプロフィールに「通報大歓迎^^^^^^^^^^^^^^ 無断転載されたくなかったらWEBに載せるなよ^^^^^^^」と書いている明らかな無断転載を見つけました. 転載されたものの作者ではないため法的には根拠ないけどと思いながら,pixiv…

Caps LockキーをCtrlキーに変える(Windows 7)

自宅と出先でキーボードのCtrlの位置が違うのにイライラして変えました. 使用したのはここのKeySwapっていうソフトです. 操作方法 変換元の「キー名」と変換先の「変換キー名」をキー入力で指定して,終了すると適用されます. 適用後はログオフまたは再起…

Androidマーケットの霊圧が……消えた……!?

Android Marketがいつの間にか消えて、Google Playとかいうのができてます。 公式ブログによるとGoogle Playでは音楽、映画と、電子書籍、Androidアプリを合わせたサイトになるとのこと。 Android Market, Google Music, Google eBookstoreはGoogle Playの一…

キュアピースのジャンケンは不正

毎週日曜日に行われているジャンケン対決でキュアピースがサザエさんに三連勝しました. 通常勝ち負けあいこの確率は等しいはずで、この結果からは不正が疑われます. そこでRを用いて二項検定を行いp値を調べます. 勝利確率を1/3とし二項検定binom.test(c(…

日本語WordNetのフロントエンドを弄る

日本語Wordnetという単語の関係や意味を示した辞書があり自然言語処理ではよく使われています. Python用フロントエンドとしてはy_yanbeさんによるものが知られています. 日本語WordNetの最新バージョンではファイル名が変わっていたり,試してみるとsyns(…

node.jsで簡易テスト(Assertモジュール)

node.jsに付属のAssertモジュールで簡単なテストができます. テストに失敗した時点でエラーを吐いて止まってしまうので,全体中のいくつ成功したかは残念ながらわかりません. テストできる種類 通常のモジュールと同様以下のように読み込みます. var asse…

CoffeeScriptのnotでミスったorz

CoffeeScriptでは論理否定演算子"!"は"not"で表されるんですが,カッコをつけないでいたらバグって困りました. JavaScriptでも起きるのでCoffeeScriptの問題ではないといえばないのですが,CoffeeScriptなら適切にカッコを足してくれるのかなと思ったら,そ…