唯物是真 @Scaled_Wurm

プログラミング(主にPython2.7)とか機械学習とか

東京の新型コロナウイルス感染者数はキリがよい数字が多かったりするのか下一桁を見てみた

2021-07-30 の感染者数が3300人でキリがよかったので、キリがよい数字がどれぐらい出てるか気になった。
とりあえず下一桁の数字がそれぞれどんな回数でてるか見てみた。
あまり内容がある話ではないので先に結果を書いておくと、特に下一桁が0のものが多かったりはしなさそうでした(それはそう)

データ

このページでCSVが公開されていたのでそれを使う。使いやすい形で公開されていてありがたい。
東京都福祉保健局が Creative Commons — 表示 4.0 国際 — CC BY 4.0 で公開している(おそらく)
catalog.data.metro.tokyo.lg.jp

最初の方の日付は使わずに2021年以降のデータだけを使った

中身を見ると

0や9がちょっと多そうにも見えましたが

f:id:sucrose:20210731233740p:plain
東京の感染者数の下一桁のカウント

scipy.stats.chisquare を使って全部が均等に出る場合が帰無仮説の統計的検定をしてみたらp値は0.14ぐらいだったので帰無仮説は棄却されなかった。

pip のインストールが Python 2系で sys.stderr.write(f"ERROR: {exc}") の部分で SyntaxError: invalid syntax と出て失敗する

1月23日頃に出た pip 21.0 でついにPython 2系のサポートが切られてインストールできなくなりました
https://pip.pypa.io/en/stable/news/

f:id:sucrose:20210201230725p:plain
pip 21.0 Deprecations and Removals

stackoverflow.com

https://bootstrap.pypa.io/2.7/get-pip.py などに古いバージョン向けのpipが置いてあるので
https://bootstrap.pypa.io/get-pip.py ではなくそっちの方を使えば一応動かせます

Colaboratoryで試しに動かしてみた結果