今回、Smartio編集部兼開発担当の私(ナガシマ)とシバトウが、2018年2月11日に神戸のスペースアルファ三宮で開催されるセミナー「Alexa Day 2018」に参加して来ましたので、まとめておきます。
セミナーは、全部で15個あったので、どれを聞くのか事前に決めて行きました。参加したのは下記の5つです。
参加したセミナー
- 「今日から始めるAlexaデバイスのプロトタイプ開発」 登壇者:市田 善久
- 「Alexa Skills Kit でプロダクトの可能性を広げる」 登壇者:市川 純
- 「kokexaの話」 登壇者:坂本 知子
- 「ハードウェアビジネス側から見た音声認識家電の現状とこれから」 登壇者:岩佐 琢磨
- 「Alexa連携デバイスクラウドを構成するAWSソリューション」 登壇者:榎並 利晃
今回のセミナーのメインは「Alexa連携デバイスクラウドを構成するAWSソリューション」です。参加した理由は、スキル作成するときに、データベースの部分で不明なところがあったので解決できればなぁという思いがあったからです。ついでに、アマゾンエコーの最新情報も聞くことが出来ればなと…。
実際にセミナーを受けみて、面白いなと思ったのは「今日から始めるAlexaデバイスのプロトタイプ開発」でした!
後、もともと聞く予定でした「Alexa連携デバイスクラウドを構成するAWSソリューション」は、クラウドサーバーとIoTのスマートホーム化についての内容でしたので想像していたのと違いました。。。
ここでは、最も印象に残った「今日から始めるAlexaデバイスのプロトタイプ開発」について書いていきます。
「今日から始めるAlexaデバイスのプロトタイプ開発」を受けての感想
はじめに受けた「Alexaデバイスのプロトタイプ開発」は、デバイスの作り方や作るうえでどのようなことに気を付けなければならないのかを学ぶことができました。ここでは、音声がどのようにしてアレクサ(AI)が受け取ってくれているのかを知ることもできました。
ハードウェアについては、超初心者なので間違ってる内容を記載しているかもしれません。ご指摘がありましたら、コメントをお願いします。
Alexaデバイスを作るときは、マイクとスピーカーとマイコン(チップ)、Ai(アレクサ)の4つが最低限必要なものです。
Alexaとの音声対話に関する流れの説明では、ハードウェアのところについて知識がないものでして正直理解することは難しかったです。でも、おおまか流れは理解できたかなと思っています。
「人が発した声がアレクサまで届き、アレクサが言葉を処理(自動音声認識・言語理解・追加拡張機能)して、言葉に対する応答をしてくれている。」
デバイスを作るときは、下↓3つのインタラクションモデルを想定して作ることが大事みたいです。
3つのインタラクションモデル
- タッチ操作:モバイルアプリやタッチして発話。
- ハンズフリー:声による操作。近距離。
- ファーフィールド:遠くからの声による操作。騒がしい場所。
スピーカーを使う場所や用途に合わせたものを考えて作る必要があります。
ハード面でのオーディオ部分を作るときは3つのポイントがあります。
オーディオ製作の3つのポイント
- オーディオアルゴリズム
- マイクの配置
- マイクの数
ハードウェア(マイクの配置やマイクの数)と音声のアルゴリズムを正しく設定すると聞き取り能力が向上します。逆に、正しく設定しないと聞き取りの反応が悪くなるので注意が必要です。
音声の処理で最も注意しないといけない部分は、音声のボリューム処理部分です。音声のボリューム処理には、リニア処理とノンリニア処理があります。
2種類の音声ボリューム処理
- リニア処理:小さい音でも、大きな音と同様に設定した分だけ音量を増幅させる方法(※大きい音は大きく、小さい音は小さく聞こえる)
- ノンリニア処理:一定の音量を増幅させるものではなく、入ってくる音量に合わせて増幅させる方法(※小さい音も大きい音も同じ程度に聞こえる)
Alexaデバイスを開発するときは、「オーディオ入力のノンリニア処理は使用するべきではない」と言われていました。なぜなのか・・・?
理由は、ノンリニア処理を使用することで、デバイスの音声認識制度が低下するからということでした。
あと、1点重要な事として挙げられた内容は「ビームフォーミング」です。
ビームフォーミングとは
ビームフォーミングとは、発言者の方向を特定することです。アレクサに話しかけるときは、スピーカーに対して15度の角度で話しかけることが最適になっているそうです。
スピーカーを天井に張り付けたり、壁掛けしたりすることはいいですが、発言者の特定が難しくなるので、反応が悪くなるというデメリットがあります。スピーカーを壁掛けでおしゃれにしたいならスピーカーの反応がちょっと悪くてもいいかもですね。おしゃれを取るか機能性を取るか、僕は完全に機能性をとりますね。ちゃんと動作するようにしておきたいし、何度も声かけしなくていいようにしておきたいです。
スピーカーの脳と呼ばれるマイコン(チップ)には、いろいろな種類があります。例えば、「ブラウザによるコントロールができる」「騒がしい場所でも音を聞き取ってくれる」など、各種メーカーがそれぞれの機能を盛り込んでいます。
Amazonは、誰もがAlexa搭載スピーカーを作れるように、無料でAIスピーカーを作ることが出来る「AVS開発キット」を提供しています。
デバイスを作るうえでのおおまかな情報は以上です。詳しく説明すると長くなりそうなので、簡潔にまとめています。
実際にデバイスを作るときは、マイクやスピーカー、マイコンなど必要なモノを組み合わせて、AVS開発キットのデータをマイコンに書き込んで、完了です。
スピーカー制作に至るまで、まだまだ知識不足ですが、貴重な情報を聞くことが出来ました。
デバイスの制作になるので主にハード面の内容でしたが、簡単にわかりやすく解説してくださいました。完全に理解できたとは思っていませんがある程度の仕組みを把握できたので良かったです。
セミナーを受けての感想
セミナーの内容で重要だなと思ったことや自分の見解をピックアップしてまとめておきます。
Alexa Skills Kitでのスキルの作成方法や作成の注意点
「Alexa Skills Kit でプロダクトの可能性を広げる」では、スキルの作成方法や作成の注意点などを話してくれました。今、スキル作成で詰まっている部分が解決できるような内容ではなかったのですが、スキル作成における流れや手順を再度確認することが出来ました。
スキル作成での肝は、ユーザーが発話するであろうサンプル情報を事前にたくさん集めることが重要だということもしれたので良かったです。
kokexaについて
「kokexaの話」は、想像していた通り「こけし」と「AI(アレクサ)」をミックスしたスピーカーの話でしたが、話を聞いてみると意外と楽しかったです。
いろいろな問題をクリアしながらスピーカーを作るのはとても楽しそうでした。こけしのスピーカーは2タイプ作られていました。1代目は縦長のこけしで、2代目は頭だけのこけしを使って作られていて、実にユニークな発想だなと思いました。楽しみながらスピーカーを作って実際にアレクサを使うこともできるのは最高ですね。
IoT関連の家電について
「ハードウェアビジネス側から見た音声認識家電の現状とこれから」では、IoT関連の製品の販売状況やAlexa対応家電がなんでここまで盛り上がってきているのか、今後どのような家電が出てきそうかなどの話を聞くことが出来ました。IoT製品は、海外だと年をまたぐ毎にどんどん増えている状況になっているので、今盛り上がりつつある日本もどんどん新しい商品を出してくるだろうと言ってましたね。
そもそも、なんでアレクサ対応家電が急激に増えているのか?理由は、IoT化が前々から進んでいるスマート家電に付け足すことが出来たので、こんなにも早く対応家電を出すことが出来ているそうです。今までは、海外だからめちゃくちゃ金かけてどんどん出しているのだと思っていたのですが、このような背景があったとは・・・。セミナーに行かなければ、勝手な想像だけで考えていましたね。
Alexa連携デバイスクラウドを構成するAWSソリューションについて
一番知りたい情報はここだと思い、「Alexa連携デバイスクラウドを構成するAWSソリューション」の話を聞いたのですが・・・。うん!予想していたことではない内容で、ちょっと残念でした。でも、IoTのスマートホームスキルAPIと家電のカスタムスキルに関する情報なのでど、クラウドとIoTのつながりを知る機会になってよかったです。
正直、ここに関しては濃ゆい話でして、僕も一度聞いただけではなかなか頭に入れ込むことができなかったです。
スマートホームスキルを作るときのデバイスとの接続や、メッセージのやり取りに関する話もありましたが、本当に内容が濃ゆくて一度では理解できなかったので、撮影した資料と音声を持ち帰り見て聞きなおしましたがそれでも完全に理解できなかったです。僕の頭ではすぐに処理できなかったですね。。。話の内容は、とても身になる内容だったので、あとあと聞いて良かったと思いました。