唯物是真 @Scaled_Wurm

プログラミング(主にPython2.7)とか機械学習とか

2013-01-01から1年間の記事一覧

TopCoder SRM 580 Div 2 ○-○ 1019->1127

34th, 0/0 challenge 前回Div 2 Hardが解けそうでしたが時間が足りなかったので、今回は最初にHardを開いたら初めてDiv 2 Hardが解けました。 Easy 範囲がかぶっているペアの数を答えるだけ。 焦っていて何故か範囲の比較の条件式が思いつかず、間の値を全部…

pythonの機械学習ライブラリscikit-learnの紹介

scikit-learn(sklearn)の日本語の入門記事があんまりないなーと思って書きました。 どちらかっていうとよく使う機能の紹介的な感じです。 英語が読める方は公式のチュートリアルがおすすめです。 scikit-learnとは? scikit-learnはオープンソースの機械学習…

IPythonを使い始めました

今更ながらIPythonを使い始めました。 IPythonはPython用のインタラクティブシェルで、標準のものとは違って補完機能や自動インデント、シェルコマンドの実行などの色々と便利な機能がついています。 並列処理にも使えるみたいですが、その辺りはまだ調べて…

「Pixiv Tag Suggest」version 3.9

Pixiv Tag Suggest pixivでブックマーク時にタグの推薦を行うChrome拡張. 確率モデル(IBMモデル1)でやってます 詳細は以下のURLを. Chrome ウェブストア - Pixiv Tag Suggest pixivでブックマークタグをサジェストするGreasemonkeyスクリプトpixiv-tag-sug…

論文紹介 “Representing Topics Using Images” (NAACL 2013)

“Representing Topics Using Images", Nikolaos Aletras and Mark Stevenson 研究室で論文紹介したので適当に以下に資料を貼っておく。 論文を読んだ後で気づいたけど、NAACL 2013はまだやっていないので、preprintバージョン(?)っぽい。 何故か研究室での…

『研究発表のためのスライドデザイン』☆☆☆☆

「研究発表のためのスライドデザイン」はプレゼン初心者・中級者におススメの本 - 発声練習 上の記事で紹介されていた本。 すぐに使えるテクニック的な内容も多い 「文章を簡潔に」とか「箇条書きを控える」とかそれぞれの項目は理解できるものの、図を作る…

Google code jam 2013 Round 1 C ◯△△

A、B、CのsmallとAのlargeを正解。 1000人までが次のラウンドに通過できるんですが、447位でした。 ここ数年は毎年挑戦してるんですが初めてRound 2に行けました(弱 Problem A. Consonants 部分文字列中で子音(aeiou)がn文字以上連続で登場するものの個数を…

Pythonスクリプト実行後に対話的に操作したい

以下のように'-i'を指定するだけでできるみたいです。 こんな簡単なのを知らなかったとは……やはりドキュメントはちゃんと読まないといけませんね。 python -i ファイル名あるいは対話モードの時にexecfile関数を実行すれば同様のことができるみたいです。最…

『コンピュータ将棋の進歩 6 -プロ棋士に並ぶ-』☆☆☆☆☆

昨日読んだ本よりもより技術的な内容が多い本。 内容の半分以上が機械学習的な話だった。 また多数決による合議アルゴリズムが取り上げられているが、直感的に「多数決によって強くなる」というのが納得できるようなできないような感じでもやもやする。 コン…

『人間に勝つコンピュータ将棋の作り方』☆☆☆☆☆

アルゴリズム部分はあまり詳細でないらしいが読み物としても面白かった。 またこの分野に詳しくないので、アルゴリズム的な部分も勉強になった。 特に評価関数と局面の探索をしているという基本的な部分は共通しているが、それぞれのソフトごとにかなり違う…

「理系人に役立つ科学哲学」☆☆☆☆

理系の人に役立つかどうかはわからないが哲学とかが好きなので面白かった。 紹介されている理論について、ちょくちょく「言葉遊び的であまり違いがないなぁ」と思う部分があるけど、哲学慣れしてないからなんでしょうか。確率の解釈について頻度主義的解釈と…

「Pixiv Bookmark with Star」 Version 1.4

Chrome ウェブストア - Pixiv Bookmark with Star pixivでブックマークした時に一緒に10点評価してくれるだけの誰得なChrome拡張です。 pixiv側のHTMLのクラス名が変更されて動かなくなっていたので修正しました。

『オンラインゲームを支える技術』☆☆☆☆☆

表紙を見て主にMMORPGについて書いてあるのかと思いましたが、MOについても書いてありました。 あとはリアルタイム性の高い格闘ゲームとかについてももっと詳しく書いてあると嬉しかったかも。初期費用が何千万とかかる、とか同時アクセス数の多さとかMMORPG…

「Pixiv Tag Suggest」version 3.6

Pixiv Tag Suggest pixivでブックマーク時にタグの推薦を行うChrome拡張. 詳細は以下のURLを. Chrome ウェブストア - Pixiv Tag Suggest pixivでブックマークタグをサジェストするGreasemonkeyスクリプトpixiv-tag-suggestを書きました - 唯物是真 @Scaled…

単語などをIDにマッピングする

異なる要素ごとに別々の数値をIDとして割り振って管理したいってことがよくあります。Twitterで以下のようなツイートを見かけました。 Pythonでwids = defaultdict(lambda: len(wids))だけで単語を単語IDにマッピングする辞書を作れることに気づいた。Python…

『デザイニング・インターフェース 第2版』☆☆☆

インターフェイスデザインのパターンをまとめた本。 ソーシャルメディアやインフォグラフィックスなどについても触れている。基本的にはデザインのパターンの辞典みたいな感じ。 全編フルカラーのスクリーンショットが載っていて、パラパラめくるだけでも概…

小説家になろうのランキングをトピックモデルで解析(gensim)

小説家になろうというWeb小説投稿サイトがあります。 いわゆるライトノベル的な作品が多いのですが、近年書籍化される作品が多く出ていて注目を集めています。 続々と「小説家になろう」から書籍化作品が登場! - フラン☆Skin はてな支店 小説を読もう! || …

『レガシーコード改善ガイド』☆☆☆☆☆

表紙に「テストがないコードはレガシーコードだ!」というラジカルな主張が書かれた本。 単純に「テストを書け!」という話だけではなく、既存の依存性のあるコード、privateなメソッドやシングルトンなどの複雑な構造をテストできるように変更するための、…

第2回電王戦の感想

毎週土曜の楽しみにしていた第2回電王戦が終わってしまいました。 第2回将棋 電王戦 HUMAN VS COMPUTER | niconico 人間対コンピュータとの触れ込みでしたが、私はコンピュータ側を応援していました。 プロ棋士1勝、コンピューター3勝、引き分け1となりまし…

『並行コンピューティング技法』☆☆☆☆☆

並列アルゴリズムの一般的な話だけでなく、具体的なアルゴリズムの逐次版を並列版に変える話が載っていて面白かった。 後半のアルゴリズムの並列化では、ソートやサーチやグラフアルゴリズムについて扱われているが、一目読んだ限りでは簡単でなくてまだ理解…

特徴量(素性)を作るときのメモ + scikit-learnにちょっと触る

機械学習のデータとして特徴量を作るときの注意点や悩むことなどをメモっておきました。間違いなどが含まれているかもしれません。 基本的な内容ですので調べればもっと適切なやり方があると思います。 カテゴリカル・データ カテゴリカル・データというのは…

CrowdSolving第1回コンペに参加しました 5/43位

CrowdSolving | データ分析・予測モデル作成のコンペサイトのコンペが終わったので、結果とかアプローチとか書いときます以前書いた記事↓ CrowdSolvingに参加中 - あるいは機械学習関連のメモ - 唯物是真 @Scaled_Wurm タスク コンテンツ販売サービスの会員…

『理系のための法律入門』☆☆☆☆

技術者や研究者向けの法律の入門書。 主に知的財産権について多くページが割かれている。 何年か前の本なので一部の法律については変わっているかもしれない。色々な裁判の事例を出しながら解説していて面白い。 知的財産権の話や製造物責任法、内部告発あた…

Google Code Jam Qualification Round 2013 A問題とC問題 (large 1)

問題 A問題のsmallとlarge、C問題のsmallとlarge 1を解きました。 Problem A. Tic-Tac-Toe-Tomek 4かける4のマス目がある。 各プレイヤーの駒(O, X)が縦横斜め一列に並んでいる場合にそのプレイヤーは勝利となる。 ただし一列のうち、ひとつの駒がTであって…

TopCoder マラソンマッチに初参加した(2013 TCO Marathon Round 1 SnowCleaning) 128/315th (provisional)

最終結果が出てから投稿しようかと思ったけど、まだまだかかりそうなので投稿。 問題文 仮順位 マラソンマッチに1度は参加してみたいなーと思っていたのですが、今回やっと初参加しました。 目標は↓な感じです。 マラソンマッチに初submitした。53/82位、何…

『 マネー・ボール 奇跡のチームをつくった男』☆☆☆☆☆

映画にもなった一冊。 従来野球で考えられていた通説に反する、データを元にした指標を使って、割安な年俸でチームを強くしていくという話。内容はWikipediaに結構載っています。 マネー・ボール - Wikipedia 物語的な部分も面白いのですが、そちらはWikiped…

第178回TOEIC公開テスト受けた

2,3年ぶりにTOEICを受けました。 リスニング395リーディング440で合計835点でした。最高記録が855なので勉強してないわりにはあまり下がっていなかったです。 しかし、ただでさえ苦手なリスニングが30点ぐらい下がってたのは残念ですね。「単語を覚える」と…

ブログのデザインテーマを変えた

はてなブログのテーマストアって見たことがなかったんで、ざーっと眺めて以下のテーマに変えました。 Yunomi - テーマ ストア - はてなブログ 幅が減って記事というか主にソースコードが見にくくなるんですけど、2カラムの方が好きなんですよね。テーマスト…

Python で疎行列(SciPy)

疎行列とは 疎行列は成分のほとんどがゼロである行列のことです。 たとえば、文書に登場する単語の頻度を数えたりするとこういった行列になります。 他にも疎なグラフの隣接行列は疎行列になります。 こういった行列は通常の行列(密行列)を使うよりも、少な…

TopCoder SRM 575 Div 2 ○○- 1070->1104

221th, +1/-1 challenge 250 配列中の任意の2箇所を入れ替えた時にできる配列の異なり数。 文字列化してsetに入れて数えただけ。 import java.util.HashSet; public class TheSwapsDivTwo { public int find(int[] sequence) { HashSet<String> set = new HashSet<String>();</string></string>…