唯物是真 @Scaled_Wurm

プログラミング(主にPython2.7)とか機械学習とか

2013-04-01から1ヶ月間の記事一覧

「Pixiv Tag Suggest」version 3.6

Pixiv Tag Suggest pixivでブックマーク時にタグの推薦を行うChrome拡張. 詳細は以下のURLを. Chrome ウェブストア - Pixiv Tag Suggest pixivでブックマークタグをサジェストするGreasemonkeyスクリプトpixiv-tag-suggestを書きました - 唯物是真 @Scaled…

単語などをIDにマッピングする

異なる要素ごとに別々の数値をIDとして割り振って管理したいってことがよくあります。Twitterで以下のようなツイートを見かけました。 Pythonでwids = defaultdict(lambda: len(wids))だけで単語を単語IDにマッピングする辞書を作れることに気づいた。Python…

『デザイニング・インターフェース 第2版』☆☆☆

インターフェイスデザインのパターンをまとめた本。 ソーシャルメディアやインフォグラフィックスなどについても触れている。基本的にはデザインのパターンの辞典みたいな感じ。 全編フルカラーのスクリーンショットが載っていて、パラパラめくるだけでも概…

小説家になろうのランキングをトピックモデルで解析(gensim)

小説家になろうというWeb小説投稿サイトがあります。 いわゆるライトノベル的な作品が多いのですが、近年書籍化される作品が多く出ていて注目を集めています。 続々と「小説家になろう」から書籍化作品が登場! - フラン☆Skin はてな支店 小説を読もう! || …

『レガシーコード改善ガイド』☆☆☆☆☆

表紙に「テストがないコードはレガシーコードだ!」というラジカルな主張が書かれた本。 単純に「テストを書け!」という話だけではなく、既存の依存性のあるコード、privateなメソッドやシングルトンなどの複雑な構造をテストできるように変更するための、…

第2回電王戦の感想

毎週土曜の楽しみにしていた第2回電王戦が終わってしまいました。 第2回将棋 電王戦 HUMAN VS COMPUTER | niconico 人間対コンピュータとの触れ込みでしたが、私はコンピュータ側を応援していました。 プロ棋士1勝、コンピューター3勝、引き分け1となりまし…

『並行コンピューティング技法』☆☆☆☆☆

並列アルゴリズムの一般的な話だけでなく、具体的なアルゴリズムの逐次版を並列版に変える話が載っていて面白かった。 後半のアルゴリズムの並列化では、ソートやサーチやグラフアルゴリズムについて扱われているが、一目読んだ限りでは簡単でなくてまだ理解…

特徴量(素性)を作るときのメモ + scikit-learnにちょっと触る

機械学習のデータとして特徴量を作るときの注意点や悩むことなどをメモっておきました。間違いなどが含まれているかもしれません。 基本的な内容ですので調べればもっと適切なやり方があると思います。 カテゴリカル・データ カテゴリカル・データというのは…

CrowdSolving第1回コンペに参加しました 5/43位

CrowdSolving | データ分析・予測モデル作成のコンペサイトのコンペが終わったので、結果とかアプローチとか書いときます以前書いた記事↓ CrowdSolvingに参加中 - あるいは機械学習関連のメモ - 唯物是真 @Scaled_Wurm タスク コンテンツ販売サービスの会員…

『理系のための法律入門』☆☆☆☆

技術者や研究者向けの法律の入門書。 主に知的財産権について多くページが割かれている。 何年か前の本なので一部の法律については変わっているかもしれない。色々な裁判の事例を出しながら解説していて面白い。 知的財産権の話や製造物責任法、内部告発あた…

Google Code Jam Qualification Round 2013 A問題とC問題 (large 1)

問題 A問題のsmallとlarge、C問題のsmallとlarge 1を解きました。 Problem A. Tic-Tac-Toe-Tomek 4かける4のマス目がある。 各プレイヤーの駒(O, X)が縦横斜め一列に並んでいる場合にそのプレイヤーは勝利となる。 ただし一列のうち、ひとつの駒がTであって…

TopCoder マラソンマッチに初参加した(2013 TCO Marathon Round 1 SnowCleaning) 128/315th (provisional)

最終結果が出てから投稿しようかと思ったけど、まだまだかかりそうなので投稿。 問題文 仮順位 マラソンマッチに1度は参加してみたいなーと思っていたのですが、今回やっと初参加しました。 目標は↓な感じです。 マラソンマッチに初submitした。53/82位、何…

『 マネー・ボール 奇跡のチームをつくった男』☆☆☆☆☆

映画にもなった一冊。 従来野球で考えられていた通説に反する、データを元にした指標を使って、割安な年俸でチームを強くしていくという話。内容はWikipediaに結構載っています。 マネー・ボール - Wikipedia 物語的な部分も面白いのですが、そちらはWikiped…

第178回TOEIC公開テスト受けた

2,3年ぶりにTOEICを受けました。 リスニング395リーディング440で合計835点でした。最高記録が855なので勉強してないわりにはあまり下がっていなかったです。 しかし、ただでさえ苦手なリスニングが30点ぐらい下がってたのは残念ですね。「単語を覚える」と…

ブログのデザインテーマを変えた

はてなブログのテーマストアって見たことがなかったんで、ざーっと眺めて以下のテーマに変えました。 Yunomi - テーマ ストア - はてなブログ 幅が減って記事というか主にソースコードが見にくくなるんですけど、2カラムの方が好きなんですよね。テーマスト…

Python で疎行列(SciPy)

疎行列とは 疎行列は成分のほとんどがゼロである行列のことです。 たとえば、文書に登場する単語の頻度を数えたりするとこういった行列になります。 他にも疎なグラフの隣接行列は疎行列になります。 こういった行列は通常の行列(密行列)を使うよりも、少な…

TopCoder SRM 575 Div 2 ○○- 1070->1104

221th, +1/-1 challenge 250 配列中の任意の2箇所を入れ替えた時にできる配列の異なり数。 文字列化してsetに入れて数えただけ。 import java.util.HashSet; public class TheSwapsDivTwo { public int find(int[] sequence) { HashSet<String> set = new HashSet<String>();</string></string>…