今回は機械学習系などでTwitterで見かけたのを入手した
気になった記事だけ触れます
SIGNICO 『SIGNICO vol.4』
SIGNICO
冊子版とPDF版があったのでPDF版を手に入れた
ミスマッチ判別機を用いたイラストの着色転写手法の提案
線画と色情報を表す参照用の画像を使って、指定した色風の画像を生成する
画像から色情報を抽出するようなネットワークと、抽出された色情報と線画を入力として画像を生成するネットワークと、抽出された色情報と線画がマッチしたものであるかどうかを判別するネットワークでGAN的なことをしている
自由にポーズを変えられる画像生成
OpenPoseを使うと画像から人間のポーズを抽出できる
この抽出されたポーズからGAN(pix2pix)を使って画像を生成している
ニューラルネットワークで画像圧縮
ニューラルネットワークを使った画像の圧縮手法のWaveOneの解説と再現実装(途中)
SIGCOWW 『COSMIC LO Vol.3』
冊子版を買ったら電子版のDLコードもくれたのが個人的にはよかった
深層学習とささやきフィルタによる音声変換
変換元の人の音声と変換先の人の音声のパラレルデータを作るために無響室に3時間篭ってもらった的なことが書いてあってデータづくりが大変そう
音声の変換については以下の論文の方法を使っているらしい
Voice Conversion Using Input-to-Output Highway Networks
2-Optで解く10万年巡回セールスマン問題
最近paizaの問題で巡回セールスマン問題を見かけたので個人的にはタイムリーな内容だった
2箇所の経路をつなぎ変えて経路長を短くしていく2-optをやっている
高速化として以下の様なことをしている(他にもある)
- あらかじめ頂点ごとに近傍のリストをもっておいてその間だけつなぎ変えを考える
- Don't Look Bitという一度つなぎ変えを試して改善しなかった頂点はその後見ないようにする処理
- つなぎ変えが発生したときに周りの頂点のDon't Look Bitをオフにするために逆の近傍リストを使う
Girls Manifold 『Create Anime Characters With A.I.』
アニメ系の顔画像を髪の毛の色などの属性を指定して自動生成する方法の解説。英語の論文調でかなり詳しく書いてありました
デモサイトがこちら↓
make.girls.moe
配布していた同人誌と同じ内容が以下のURLで公開されている
http://make.girls.moe/technical_report.pdf
データセット作りに力を入れているっぽい
Danbooruなどから画像をクロールして取ってくると画風やクオリティの偏りがあるのでGetchu.comの画像を使っている
ErogameScape -エロゲー批評空間-のエロゲーマーのためのSQL -エロゲーマーのためのSQL- のAPIを使ってURLのリストを取得している
集めてきた画像をlbpcascade animefaceで顔画像周辺を切り抜いている
OpenCVによるアニメ顔検出ならlbpcascade_animeface.xml - デー
髪の毛の色などの属性を指定して画像を自動生成できるようになっている
これに使う属性情報はIllustration2Vecの出力を利用しているらしい
Illustration2Vec: A Semantic Vector Representation of Illustrations
画像の生成はDRAGANというGANの一種を使用している
[1705.07215] How to Train Your DRAGAN
yusuke-ujitoko.hatenablog.com
Generatorの入力に属性の次元の乱数のベクトル、Discriminatorに属性の分類をさせている
他にも生成した画像の超解像も試していて、waifu2xではぼやけてしまうのでGANベースのモデルのSRGANを使っている(デモサイトの方では実装されていない)