唯物是真 @Scaled_Wurm

プログラミング(主にPython2.7)とか機械学習とか

はてなブックマーク数が多い2016年のアドベントカレンダーの記事

QiitaとAdventarにあるアドベントカレンダーについて、個別の記事とカレンダー全体のはてなブックマーク数のランキングを27日の0時ごろに集計した 個別記事上位100件のURLについては軽く目で見て最近の記事でなかったりするURLをフィルタリングしてある(漏れ…

PHP関連で読んだドキュメントの翻訳が間違っていて(?)日付の書式に%Gを書いてハマった話

日付を表す書式文字列の一つに%Gというものがあります(意味するところはツールや関数によって違うかもしれません) PHPの日本語ドキュメントと、テンプレートエンジンのSmartyのドキュメントがわかりづらくて、西暦の4桁の年を表示する%Yと間違えて%Gを使って…

はてなブックマーク数が多い2016年のアドベントカレンダーの記事(途中経過)

去年書いたスクリプト↓がだいたいそのまま動いたのでアドベントカレンダーのはてなブックマークの合計数のランキングと記事別のランキングを今年も出してみた sucrose.hatenablog.com 全件記事を見たわけではないので変なゴミが混じっているかも今年はディー…

ソシャゲで確率を推定するにはどれくらい試行が必要か

ソシャゲをやっていてドロップ確率などを調べるには何回ぐらい試せばよさそうか気になったので調べてみた一定確率\(p\)で成功、\(1-p\)で失敗するという単純なモデルを仮定する つまりある確率\(p\)でアイテムがドロップするとしたときに、試行回数に対する…

シェルスクリプトで文字列の大小比較をする

シェルスクリプトのif文で文字列の辞書順の大小関係を条件判定したかったので調べましたbashなどには[[]]コマンドがあるので、簡単に文字列比較ができます(ところで[[]]って検索しづらいですね[](test)コマンドの方でも文字列の大小比較はできますが、以下の…

アドベントカレンダーの参加者は毎年どれぐらい入れ替わっているのか?2016

去年Advent Calendarの参加者が1年間でどれぐらい入れ替わっているのか調べました sucrose.hatenablog.com せっかくなので今年も調べてみます2016年と2015年のQiitaで公開されているアドベントカレンダーを調査の対象とします Advent Calendar 2016 - Qiita …

読書記録『数学ガールの秘密ノート 場合の数』☆☆☆☆

確率の話とかは出ずに純粋に場合の数の話 中華料理店などにあるような回転するテーブルが英語で"Lazy Susan"と呼ばれるというトリビアが取り上げられていた(すぐ忘れそう場合の数はよく考えないと、すぐに間違えるので難しい 取り上げてる内容は以下のような…

Chromeの拡張機能のバージョンを固定したかった

Chromeに入れた拡張機能(エクステンション)は自動的に更新されてしまう 自動更新を停止してバージョンを固定して使う方法はないかな、と軽く調べてみたらよい方法が見つからなかったメモ 経緯 この前記事に書いたけどChrome拡張があるバージョンにアップデー…

不正なChrome拡張の悪質化(マルウェア)に引っかかってしまった

最近Chrome拡張が突然悪質化してマルウェアになり情報を盗んだりする事例があるという話が話題になっていました今日Chromeを起動したら「不正なChrome拡張を無効にしました」的なことを言われてChrome拡張が無効化されてしまいました しかも悪質なことにアン…

約数の個数の求め方と高度合成数(Highly composite number)のリスト(10^8まで)

約数の個数を求めるアルゴリズムと約数が多い数である高度合成数についてのメモ 約数の個数の求め方 実際に割ってみる方法 ある数\(n\)の約数の数を求めます \(\sqrt n\)より大きい約数は\(n\)自身しかないので、\(1\)から\(\sqrt n\)まで割れば十分です 割…

Google の可視化ツールの Data Studio を試してみた

Google Data Studio (データスタジオ) という可視化サービスがベータ版で使えるようになっていたので試してみた見たい数値を一覧するためのダッシュボード的なものを作るためのサービスなので、いろんな場所からデータを取ってきて一箇所でまとめて確認する…

BigQueryでクエリ課金額が多いユーザーを通知するbotを作ったら富豪的解決がなされた

qiita.com 上の記事でBigQueryに投げたクエリのログ(Audit Log)がインポートできることを知ったので、会社で使われているBigQueryのアカウントについて毎日クエリの課金額(処理したバイト数)の多いユーザーをSlackに通知してみたちなみにAudit Logsをインポ…

BigQueryでINSERTやUPDATEが使えるようになるらしい

2016年9月末のリリーズでBigQueryにいろいろ機能が追加されました 個人的に便利そうだな、と思ったものを紹介します Release Notes | BigQuery | Google Cloud Platform cloud.google.com 標準SQL (Standard SQL) BigQueryでは独自のSQLを使っていたのですが…

AtCoderのレーティングの分布について調べてみた

競技プログラミングサイトのAtCoderのレーティングの仕組みが新しくなりました 別の競技プログラミングサイトであるCodeforcesのレーティングとどれぐらい相関があるのか、参加回数がどれぐらいあればレーティングに差がなくなってくるのかなど気になったの…

Twitterの翻訳者バッジを手に入れました(数年ぶり2度目)

久しぶりに存在を思い出したので少しやってみたら条件がゆるくなっていて簡単に取れた翻訳・投票したものが採用されるとカルマポイントが貰えて、300ポイント以上になると翻訳者バッジが貰える(既に300ポイント以上あったせいか、新制度になってから初めてい…

ハッカドールのミニゲーム「ハッカトーク!さまーばけーしょん」「ハッカトーク!さまーばーべきゅーっ」の攻略

例のごとく↓過去の攻略と同じフォーマットで攻略を書いておきます ハッカドールのミニゲーム「ハッカト~ク ふぁーすとしーずん」の攻略 - 唯物是真 @Scaled_Wurm 「ハッカトーク!さまーばけーしょん」 blog.hackadoll.com シナリオ別の選択肢の結果 水着だ…

遅い通信だとChromeはdocument.writeで外部のスクリプトを読み込んでも動かなくなるらしい(A Parser-blocking, cross-origin script ...)

概要 Google Chromeを使って、document.write()で外部のJavaScriptを読み込んでいるページを開くと、いつの間にか開発者ツールのコンソールに以下のようなメッセージが出る状態になっていた "A Parser-blocking, cross-origin script, スクリプトのURL, is i…

PHP 7.1 で mt_rand() の間違った実装が直るらしい(しかも rand() が mt_rand() になるらしい)

前にこんな記事を書きましたsucrose.hatenablog.comTwitterで見かけたのですがPHP 7.1で直る予定らしいですPHP 7.1でmt_rand()問題がついに解決されるのか? 一貫して壊れていたmt_rand()が直るとか素晴らしいPHP: 下位互換性のない変更点 - Manual https://t…

Weblio語彙力診断のスコア分布を調べてみた

最近Twitterで流行っていた日本語の語彙力診断の結果のツイートの分布が変という話がありました qiita.comたまにTwitterでみかけるWeblioの英単語の語彙力診断だとどんな分布なのか気になったので調べてみました uwl.weblio.jp以下のような形式のツイートを…

BigQueryで有り金全部溶かさないように、テーブルの日付ごとのパーティション(partition)機能について調べてみた

BigQueryではクエリのたびに対象のテーブルをフルスキャンします スキャンしたテーブルのサイズによって料金が請求されるので、コストの削減のために日付などの単位でテーブルを分割するのがベストプラクティスとして知られていますqiita.comテーブルを日付…

読書記録『「学力」の経済学』☆☆☆☆

日本の教育で専門家が発言していることは、データによって示された客観的なエビデンスがないのではないか教育の分野でもエビデンスが大事、という話アメリカなどの国でランダム化比較試験などの比較的信頼性の高い方法によって得られた教育の知見を紹介して…

制御文字をgrepする

gitで管理しているリポジトリのファイルに間違って、改行やタブ以外の変な制御文字が入っていたことがあったのでgit grepでチェックしたbashとかは$''で囲んだ中に16進数の表記を書くと展開してくれるらしいので以下のように書ける(-Iはバイナリファイル以外…

広告ブロックを使っていると一部機能が動かないサイトのメモ

Chromeに広告ブロックの拡張のAdBlockを入れていると、Webサイトの機能の一部が動かないことがあるのでメモっておく(環境や設定によると思う) Googleウェブマスターツール 検索アナリティクスのページが「エラーが発生しました。しばらくしてからもう一度お…

はてなブログのサイトマップ

Google の Search Console (旧ウェブマスターツール)でサイトマップの登録機能ってありますけど、はてなブログの場合どうなっているのかなっていうのを調べてみたまず結論からいうとSearch Consoleでサイトマップを登録したりする必要はなさそう なぜならrob…

ツイートの時間帯をヒートマップで可視化

Pythonでヒートマップを描く方法の記事を書こうかと思ったけど、細かく説明するといろいろとめんどくさそうだったのでとりあえず実際にやってみた可視化だけ書いておくTwitter APIで自分のツイートを適当に3000件ぐらい取ってきてツイートした時刻と曜日を抽…

Twitterで特定のユーザー達が共通してフォローしているユーザーをリストアップする

前にこんなツイートをしたホクソエムからフォローをされている数で定義されるホクソエム数— 無限猿(id:sucrose)@29月病 (@Scaled_Wurm) 2016年4月1日 連休で時間があったのでTwitter APIに慣れるついでに計算してみた ホクソエムとは よくわからないけど、Tw…

ハッカドールのミニゲーム「帰ってきた!オッカトーク![ハッカドール免許試験]」の攻略

エイプリルフール企画で今日4月3日までしかプレイできないとのこと クリアすると「ハッカドール免許証」の画像がもらえる最初はいつもどおりにクイズ(簡単)ですが、最後に「実技試験」として2Dシューティングゲームが始まって笑いました 意外と難しいのです…

シェルスクリプト(bash)でファイル名の末尾が偶数や奇数のファイルだけ処理したい

1.txt, 2.txt, 3.txt, ...のように連番のファイルがあった時に、ファイル名が特定の条件(たとえば偶数)になっているものだけを処理したいということがあって簡単に調べたのでメモ偶数奇数の場合には数値の最後の文字だけを見れば偶数か奇数かは判定できるど…

BigQueryでテーブルを日付ごとに分ける必要がなくなったり、古いテーブルのストレージ代が安くなったりするらしい

↓の記事にBigQueryの予定している新機能などが書いてあったので個人的に気になったのを紹介 cloud.google.com テーブルの自動パーティショニング まだアルファ版らしいけど、テーブルの自動パーティショニングが使えるようになるらしい BigQueryではクエリの…

読書記録『勝てる野球の統計学――セイバーメトリクス』☆☆☆

野球のデータを統計的に見ていくセイバーメトリクスの入門書 セイバーメトリクス - Wikipedia アウトカウントと走者の状況別のその後の得点期待値を見ると、得点期待値は送りバントをすると下がってしまうが、得点確率を見ると状況によっては上がるらしい、…