唯物是真 @Scaled_Wurm

プログラミング(主にPython2.7)とか機械学習とか

Project Eulerのバイオインフォマティクス版のROSALINDを始めました

最近時間がなくてProject Eulerを全然やっていませんでした。
というか数論の知識がなくて全然解けないのでやる気が出ません。

そんな時にTwitterProject Eulerバイオインフォマティクス版のRosalindというのがあるらしいという話を聞いたのでこの土日でやってみました。

問題

問題一覧を見るとわかりますが、形式はかなりProject Eulerに似ています。
内容は、DNAとかRNAとかコドンとか記憶の片隅に埋もれた生物系の単語がたくさん出てきますが、基本的にはアルゴリズム、特に文字列操作などです。
生物系の知識が多少必要な場合もありますが、だいたいは問題のページに書いてあります。
f:id:sucrose:20121112003213j:plain:w600

提出方法

大きな違いはGoogle Code Jamのように解答を提出するときは入力をダウンロードして時間内(5分以内)に解答、という形式になっていることです。

問題の順序

また前提となる問題をクリアしないと以降の問題に挑戦できないようになっています。
これはグラフで確認できます。
f:id:sucrose:20121112003524j:plain:w600
明らかに関係がある問題で難しい方に先にぶつからないで済むのはいいですが、つまる場合もあるので良し悪しっぽいですね。

気になったところ

問題文がわかりづらい

生物系の人間でないからかもしれませんが、問題に複数の解釈があったりまったく意味がわからなくて悩むものがありました。

また別の問題で出てきた表の値を使わないと計算できない問題があって、不親切だと感じられました。

サンプルインプットとアウトプットだけではうまくいかなくて、解答用の入力を見たらフォーマットが思ってたのと違っていた、ということがよくあります……。

解答の公開ができない

ROSALIND | FAQによれば"please do not publish your code outside of the Rosalind website"らしいです。

今なら日本人の上位になれますよ(笑)

登録者で日本国籍にしている人は今日現在4人しかいません。

問題数も今のところ66問しかなくてProject Eulerみたいに多くないです。