【Unity】音声認識についてさらっと調べてみた話

adventar.org

「雑談Slack Advent Calendar 2017」19日目の記事です。
18日目はteaeast_westさんの「絵を描く犬の話 - 腹痛につき、三千年遅れます。」でした。
えがかけるひとはすごいとおもいます。



・結論

この記事で紹介されている、Google Speech APIを使うアセットが扱いやすくて良かったです。
assetsale.hateblo.jp

以下、備忘録的にざーっと書いていきます。


・背景

HTC ViveとHoloLensで日本語音声認識したくなったので、Unityで使えるらしい音声認識エンジンについて調べることにした(現在進行形)。

 
・調査対象

 ・Microsoft Azure Bing Speech API
 ・Google Speech API
 ・Watson Speech to Text
 ・UnityEngine.Windows.Speech
 ・UnityTechnologies Speech to Text
 ・Julius
 ・Intel RealsenseSDK
 ・Dialogflow(旧API.ai)
 ・Wit.ai

 
Microsoft Azure Bing Speech API

正直わからん...
magicbullet.hatenablog.jp
tarukosu.hatenablog.com
調べると記事は出てくるのですが、自分の環境ではまだ実現に至ってないのでまだ調査中です。


Google Speech API
assetsale.hateblo.jp
この記事で紹介されているGoogle Cloud Speech Recognitionというアセットが手軽に使えて良かったです。

認識精度も今回調査したものの中で一番ではないかと思うほどでした。

 
・Watson Speech to Text
www.ibm.com
この記事を参考にさせていただいて試しましたが、こちらの環境の問題なのかうまく認識してくれず...。

 
・UnityEngine.Windows.Speech
mizutanikirin.net
qiita.com
こちらも試した環境のせいなのかなんなのか、非常に認識精度が悪い結果となりました。


・UnityTechnologies Speech to Text
bitbucket.org
どうやら実態はGoogle Speech APIやWatson Speech to Textがベースになったもののようでした。

 
・Julius
tips.hecomi.com
qiita.com
「Unity 音声認識」などで検索すると多くの記事が出てきますね。

もともとの認識精度や、精度を上げるためのチューニングの大変さから実際に使用する候補としては...ちょっときついかな...という感想です。


Intel RealsenseSDK
qiita.com
qiita.com
導入自体は手軽でした。

先述のGoogle Speech APIほどの認識精度ではありませんでした。

まずまずという感じです。

 
・Dialogflow(旧API.ai)
・Wit.ai
どうも音声認識ができるっぽいのですが情報が少なく、実際に試してみるまでには至りませんでした。

そもそもチャットボットをつくるためのサービスなので音声認識の用途で使うには不向きなのかなと。

 

・まとめ

Bing Speech API Google Speech API Watson Speech to Text UnityEngine.Windows.Speech Julius RealsenseSDK
料金 従量課金 従量課金 従量課金 無料 無料 無料
Platform WebGL以外 Windowsのみ Windowsのみ
日本語対応
オフライン使用 × × × ×
認識精度 ? × ×


...すみません急いでちょっと雑になり過ぎました。
また加筆修正するかもしれません...。



明日はkakunpcさんの「例のアレ」です。