音声アシスタントの音声認識能力をチェック、Alexaが優秀か?

2018.5.17

音声AIアシスタントなどの音声に関するニュースなどを配信する「voicebot.ai」がスマートスピーカーに関するおもしろい発表をしていました。

Googleアシスタントを代表してGoogle Home,Amazon Alexaを代表してAmazon Echo,Siriを代表してHome Pod,Cortanaを代表してHarman Kardon Invokeの4つを使って音声認識に関するテストを行っています。

このテストは「私の声が聞こえているのか」と「私が話している事を理解できているのか」をチェックする目的で行われ、独立ワード認識テスト、発話認識テスト、ウェイクワードテストの3つのテストが実施されました。

音声認識テスト

テスト環境はこのように、すべて同じ環境になるように1mの距離をとって角度の異なる5つのスピーカーを設置して行っていました。では、気になるテスト結果を見ていきましょう。

独立ワード認識テスト

独立ワード認識テストでは、2音節の単語36個をスマートスピーカーのまわりに設置しているスピーカーより発してワードの認識能力をテストしています。

1回目に単語を認識できなかった場合にはもう一度再生し、2回目を行います。それでも認識できない場合には不合格となってしまうという条件です。結果的には、

音声認識テスト

このように、GoogleHomeが100%認識した事がわかります。独立ワード認識テストではGoogle Homeに軍杯が上がりましたね!

ですが、Amazon Alexaも97.2%となかなか高い数字を出していますね。ただAppleのSiriは80%と低い数字となってしまっています…iPhoneのSiriは意外と日本語は認識してくれるのですが、思ったよりも低かったです。

発話認識テスト

次は、発話認識テストです。異なる音圧の声をスマートスピーカーに流し、50%以上の精度で反応するかしないかのテストでした。

先ほどとテスト環境は同じで、30〜50dB(デシベル)、250〜4,000Hzの間の異なる音圧の声を再生し精度を測っています。テスト結果はこのようになりました。

音声認識テスト

上の図では、青い線が人間が声を認識できる聴覚の範囲を表しており、白い部分がせまいほど人間の聴覚に近いことが分かります。テスト結果ではまたしてもGoogle Homeがもっとも発話の認識能力が高い事が分かりましたね。

Cortanaが搭載されたHarman Kardon Invokeが最も悪い結果となっていますね。結構大きな声でしゃべりかけないと認識してくれないかも…

ウェイクワードテスト

最後にウェイクワードのテストです。各スピーカーに異なる音圧を流して反応するかどうかのテストを行っています。結果的には、Amazon Alexaが最も低いdB(デシベル)で反応しました。

つまりは、Amazon Alexaが小さい声でもちゃんとウェイクワードを拾って反応することが分かっています。

結果的にどの音声アシスタントが認識力が高かったのか

音声認識テスト

3つのテストの結果をまとめたのがこちらみたいです。グリーンがついてる箇所が各テストでもっとも数値がよかったもので、赤がその逆で悪かったもの。

見てもらうと分かるように、Google Homeが独立ワード認識テスト、発話認識テストでは優秀だったのですが最後のウェイクワードテストでは32dBと最も悪い数字を出しています。

Amazon Alexaでは全体的に数値は高く、最後のウェイクワードテストでも最も優秀だったため総合的にみるとAlexaが一番音声認識に関しては優秀かもしれませんね!

このような音声アシスタントの認識力のテストを行っていました。おもしろかったのでぜひ興味がある方は下記のリンクから記事をチェックしてみてください。