2016年7月8日金曜日

Siriみたいな音声認識のとこ作ってみた。

おじさんまた仕事ないです。
おじさんこの前、しゃべるロボットを作りたい会社の役員と面談をして、音声認識なんて一日くらいあれば作れますよっていったんですが、あやしーといわれ全く信用されず。
なので仕事がないんです。

暇なのでアップルのSiriみたいなものって作れるのか試してみました。
基本的に、Siriのようなソフトは、

1. 音声を文字にする。
2. 文字を自然言語処理する。
3. 結果を表示したりしゃべる。

を作ればできそうですよね。
でもいきなり全部はできないので本日のブログでは1の音声を文字に変換することまで。

まず、音声を文字に変換するには、音声をフォルマント分析し・・・・・中略・・・・・隠れマルコフモデルで・・・・・中略・・・・・、モデルを生成するために・・・・・省略・・・・・

理論はとっても説明に時間がかかるので省略します。
まず、ライブラリと学習結果を持ってきます。
juliusっていう音声認識ライブラリはフリーでとてもよく整備されているのでこれを使うことにします。

http://julius.osdn.jp/

このライブラリ本当にすごいです。Anrdoid、iPhone、Windows、Linux、MacなどありとあらゆるOSで動いてしかも学習結果のデータもセットになっていて、精度もかなりでています。ドキュメントもものすごい整備されているので簡単にコンパイルできます。
ラスパイとかでも動くのでロボットなどの組み込みで音声認識をしたい人はもってこいです。Googleもすごいけど、このライブラリ作ってる京都大学もすごいですね。ソースコードからも頭の良さが伝わってきます。

ということでサクッとダウンロードしてとってきます。
どれくらいの精度で認識できるかはネットで試験した人がいるので以下の動画でわかります。

https://www.youtube.com/watch?v=l8sIT7lRh1M


ほら、コンパイルするだけでよいので、一日で作れるでしょ。
実行形式のバイナリーも大体のOSで公開されているので、試してみるだけならばコンパイルもする必要もありません。

本当は正直に一時間で作れるって言わないと採用されないのかなぁ・・・・・。

0 件のコメント:

コメントを投稿