developer.cybozu.co.jp
Speech2Face - 声からあなたの顔つきを当てる研究
声から、喋っている人がどんな顔なのかを推定する、という研究です。 上に並んでいるのが、短文の音声メッセージの話者です。これ左端はダニエル・クレイグ氏(007)ですよね。他はわかりませんが。 サイトで再生ボタンを押すと、推定に使われた音声データが聴けます。10秒も無いぐらいの短い文章です。 そして、下に並んでいるのが、その音声から深層ニューラルネットワークを利用して推定した話者の顔。 学習データとしては、インターネット/YouTube 上の数百万の人が喋っている動画を使ったそうです。「こんな風貌の人は、こんな風に話す」というデータを大量に食わせることで、「こんな風