唯物是真 @Scaled_Wurm

プログラミング(主にPython2.7)とか機械学習とか

2014-01-01から1年間の記事一覧

2014年のこのブログのGoogle Analyticsのサマリーとか

去年の↓ 2013年のこのブログのGoogle Analyticsのサマリーとか - 唯物是真 @Scaled_Wurm 2013年のこのブログのGoogle Analyticsのサマリーとか - 唯物是真 @Scaled_Wurm1年経ちましたがまだあまりGoogle Analyticsの使い方がよくわかりません 去年よりセッシ…

Seiga Downloadで保存するときのファイル名を指定できるようにした(Version 3.5)

Seiga Download - Chrome ウェブストア ニコニコ静画で画像ダウンロード用のリンクを追加するChrome拡張機能「Seiga Download」 - 唯物是真 @Scaled_Wurm ニコニコ静画に投稿されているイラストをダウンロードするChrome拡張 久々にChrome拡張の更新したらい…

来年は機械学習のコンペにもうちょっと参加したい

今年はいろいろ開催されたのに全然参加できなかった 目標に「kaggleに参加する」とか書いてた気がするんだけど…… 画像認識系だとまったく手が出ないのもなんとかしたい機械学習のコンペは、訓練データが与えられてそれで何かしら予測モデルを作って予測結果…

2014年にはてブされたこのブログの記事

ちょっと早いですが今年のまとめです ちなみに去年のはこちら 2013年にはてブされたこのブログの記事 - 唯物是真 @Scaled_Wurm 2013年にはてブされたこのブログの記事 - 唯物是真 @Scaled_Wurm 以下今年書いた記事の現時点でのトップ10です(同数なので11個 …

ABCのA問題を早解きしたい / AtCoderで提出するときに自動で言語選択してくれる野良Chrome拡張を作った話

前に競技プログラミングのAtCoder Beginner Contest(ABC)のA問題の早解きに挑戦しようと思ってタイトルのような拡張を作ってました AtCoder (アットコーダー)では、なぜか各回の最初の提出時にプログラミング言語を毎回選択する必要があります コンテストの…

組み合わせの個数(二項係数)を計算する

Pythonで組み合わせ(Combination)を計算 - 唯物是真 @Scaled_Wurm 数年前に上のような記事を書きましたが、ライブラリを使わない場合の計算について書いてなかったので記事にしました 組み合わせとは いくつかの要素の中から、順番を区別せずにいくつかの要…

ハッカドール攻略 - バッジ取得条件

前にDeNAのオタク系ニュースアプリ『ハッカドール』のミニゲームの攻略(?)記事を書きましたが、今度はバッジ(実績システムのようなもの)の獲得条件をメモっておきます 本当は全部レベル5(最大値)になってから記事にしたかったのですが、なかなか達成できそ…

毎日が天皇誕生日になるには何回天皇が交代する必要があるか(シミュレーション版)

今日は天皇誕生日ですが、以前「あと何回天皇が交代すれば毎日が天皇誕生日になるか(不謹慎)」の期待値を求める記事を書きました 毎日が天皇誕生日になるには何回天皇が交代する必要があるか - 唯物是真 @Scaled_Wurm 毎日が天皇誕生日になるには何回天皇が…

日本語形態素解析器のイメージ

前にこんなツイートをしたけどもうちょっとちゃんとメモっておく ゆるふわカジュアル勢()なので内容に間違ってる点があったら教えてくださると嬉しいです勝手なイメージだと、MeCab →一番使われてる 。速い。辞書を弄くるのが簡単。いろいろ移植されてる。Ju…

グラフ中の三角形や四角形(長さ3, 4の単純閉路)の数を求める

グラフ中の三角形や四角形(長さ3, 4の単純閉路)の数を求めたい グラフはすべてループや多重辺を含まない無向の単純グラフとする 三角形の数を求める グラフのどの頂点同士が結びついてるかを01であらわした隣接行列を\(A\)とすると 隣接行列 - Wikipedia グ…

ツイート時間の分布をクラスタリングしてみた

前にツイート時間の分布の類似度を求めるというのをやりました Twitterの投稿時間で類似度を計算してみた - 確率分布の類似度 - 唯物是真 @Scaled_Wurm Twitterの投稿時間で類似度を計算してみた - 確率分布の類似度 - 唯物是真 @Scaled_Wurm今回はツイート…

夏コミ(C86)の同人誌の感想とか

冬コミも近くなってきたので夏コミで手に入れた同人誌の感想を書いておきます(遅ちなみに前回はこちら 冬コミ(C85)の同人誌の感想とか - 唯物是真 @Scaled_Wurm 冬コミ(C85)の同人誌の感想とか - 唯物是真 @Scaled_Wurm 日本声優統計学会 『声優統計 第四号…

2014年に読んだよかった本

最近は積読が溜まっていくばかりで全然本を読めてないですorz 背信の科学者たち 背信の科学者たち―論文捏造、データ改ざんはなぜ繰り返されるのか (ブルーバックス)作者: ウイリアム・ブロード,ニコラス・ウェイド,牧野賢治出版社/メーカー: 講談社発売日: 2…

NumPyのブロードキャストのメモ

Pythonの行列演算ライブラリのNumPyはforループを使って計算すると遅いので、できるだけ行列演算やベクトル演算だけで計算を行いたいNumPyでは大きさの違うarray同士で計算するときのブロードキャストという仕組みがあります これを使うと複雑な計算が簡単な…

Advent Calendarの参加者は毎年どれぐらい入れ替わっているのか?

Machine Learning Advent Calendarの参加者を去年の参加者と比べると入れ替わりが激しいんだなーと思ったので他のも調べてみましたMachine Learning Advent Calendarの今年の分読んでたけど、2014年と2013年の共通の執筆者って4/25ぐらいしかいないんだなぁ …

論文感想: "Machine Learning: The High-Interest Credit Card of Technical Debt"

Machine Learning: The High Interest Credit Card of Technical Debt NIPS 2014のWorkshopのSE4ML: Software Engineering for Machine Learningというので発表された論文っぽいです Twitterで話題になっていたので読んだメモです久しぶりに英語論文を読んだ…

Pythonで出力したCSV(UTF-8)がExcelで読み込めなくて困った話

Pythonで出力したUTF-8のCSVを渡したら「文字化けしてExcelで読めない」と言われて困りました原因は文字コードがUTF-8の時によく問題になるBOM(バイトオーダーマーク)です バイトオーダーマーク - Wikipedia UTF-8のファイルにはBOMが付いている場合と付いて…

読書感想『シグナル&ノイズ 天才データアナリストの予測学』☆☆☆☆☆

この本は予測について書かれた本である なぜ、ある予測は当たり、ある予測は外れるのか。もう少し洞察力を持って計画し、過去の失敗を繰り返さないようにするために、本書が役に立つことを願っている 著者のネイト・シルバー(Nate Silver)は2012年の大統領選…

ハッカドールのミニゲーム「ハッカト~ク ふぁーすとしーずん」の攻略

DeNAのオタク系ニュースアプリのハッカドールについてる四択のミニ会話ゲー(?)の攻略 君にシンクロするニュースアプリ ハッカドール (Hackadoll) ハッカドール :君にシンクロするニュースアプリ 〜アニメ・ゲーム・マンガ〜 ログインしたり記事を見たりツイ…

Twitterに何時に投稿したらフォロワーに読まれやすいのか調べてみた

TwitterにはTwitterアナリティクスというアクセス解析があります インプレッション(見られた数)やふぁぼられた数、リツイートされた数、その他多くの情報がわかります 最近のデータをCSVでダウンロードできるようになっています(あまり長期のデータはダウン…

Pythonワンライナーでpaiza Online Hackathon 4 liteに挑戦してみた

paizaで新しいオンラインハッカソンが出題されていたので挑戦してみました エンジニアでも恋がしたい〜転職初日にぶつかった女の子が同僚だった件〜|paizaオンラインハッカソン4 Lite マンガ版「エンジニアでも恋がしたい!」〜転職初日にぶつかった女の子…

Isomapで東方キャラの関連性のデータを二次元に可視化する

昨日の記事で得られた東方キャラ同士の関連性の強さ(NPMI)を使って、Isomapという手法でキャラを二次元上に配置して可視化します 東方キャラの関連性の強さをニコニコ動画の動画数で測ってみた - 唯物是真 @Scaled_Wurm 東方キャラの関連性の強さをニコニコ…

東方キャラの関連性の強さをニコニコ動画の動画数で測ってみた

昨日の記事でニコニコ動画の動画検索の結果を取得できるようになりました ニコニコ動画 『スナップショット検索API』 に触ってみた - 唯物是真 @Scaled_Wurm ニコニコ動画 『スナップショット検索API』 に触ってみた - 唯物是真 @Scaled_Wurm このデータを使…

ニコニコ動画 『スナップショット検索API』 に触ってみた

一人アドベントカレンダーの一日目です(違10月にニコニコ動画から『スナップショット検索API』というのが出ていたので触ってみました 毎日朝5時の時点のデータのスナップショットから検索できるAPIでニコニコ動画のコンテンツを解析する目的で検索/取得する…

サザエさんのジャンケンの次の手を決定木で予測+可視化してみた

前に決定木の可視化をしようと思ってやってなかったのでやっておきます決定木のライブラリは例のごとくscikit-learnを使う pythonの機械学習ライブラリscikit-learnの紹介 - 唯物是真 @Scaled_Wurm pythonの機械学習ライブラリscikit-learnの紹介 - 唯物是真…

TopCoder SRM 638 Div1 x-- 1283->1284

156th, 0.00pts, +0/-0 challenge Volatility: 512->462いつもどおりDiv1 Easyが解けず。 Challengeいけそうな気がしたけど、毎回このパターンでマイナスの点になっているので我慢した 300: ShadowSculpture 立方体をいずれかの面がくっつくようにつなげてい…

TopCoder SRM 637 Div2 oo- 1168->1283

17th, 704.33pts, +1/-0 challenge Volatility: 501->512EasyとMediumの早解き回 部屋1位だった 1000点の問題を誤読していた(´・ω・`) SRM 637 - Togetterまとめ writerの解説 SRM637 - あなたは嘘つきですかと聞かれたら「YES」と答えるブログ SRM637 - あ…

jqコマンドでJSONをCSVに変換する

jq 前に以下のニコニコ動画のデータセットの記事でも使いましたが、jqコマンドはJSONを変形したり一部を抽出したりするのにとても便利なコマンドです ニコニコ動画のデータセットが公開されたらしい - 唯物是真 @Scaled_Wurm ニコニコ動画のデータセットが公…

読書記録『コーディングを支える技術 ~成り立ちから学ぶプログラミング作法』☆☆☆

「コーディングを支える技術」ってタイトルよりもサブタイトル(?)の「成り立ちから学ぶプログラミング作法」の方がこの本の内容を表しているように思ったコーディングを支える技術 ~成り立ちから学ぶプログラミング作法 (WEB+DB PRESS plus)作者: 西尾泰和…

Derangement

Derangement - Wikipedia, the free encyclopedia 完全順列 - Wikipedia Derangementは\(1, 2, \dots, n - 1, n\)を要素とする順列のうち、すべての\(i\)番目の要素が\(i\)と等しくない順列のこと(不動点の個数が\(0\))たとえば\(1, 2, 3\)を要素とする順列…