【2018年AI最新情報】日本発の音声認識AI技術の魅力をご紹介
- ツイート
-
- 2018/07/13
2017年後半からGoogle HomeやAmazon Echo、Homepodなどといったスマートスピーカー(AIスピーカー)が話題になっていますよね。こうしたスマートスピーカーはそれぞれGoogle Assistant(Google Homeに搭載)、Amazon Alexa(Amazon Echoに搭載)、Siri(Homepodに搭載)などの音声アシスタント(音声認識AI)を搭載しています。現時点では音声認識技術は海外の大企業が開発しているものが多いですが、日本国内で音声認識AIを意欲的に開発している企業の技術からも目が離せません。
今回は音声認識の技術に関する説明と、日本企業が開発する音声認識AIのご紹介をしたいと思います。
IT業界まるわかりガイドは、日本初Web専門スクールのインターネット・アカデミーが運営する業界情報メディアです。最新の業界情報を、初心者にも分かりやすくご紹介しています。
目次
音声認識とは?
「音声認識」とはAI(人工知能)開発の分野におけるディープラーニング(深層学習)という技術の応用例の1つです。コンピュータは音声(人間の声)を認識してからその特徴を捉え個人を識別したり、音声からテキストへの書き起こしをしたりします。学問やビジネスの分野でも、人間のスピーチパターンや発話パターンを認識するためにディープラーニングを利用した開発が行われています。
近年では世界中の多くの企業がAIによる自然言語処理に重点を置いて音声アシスタントの開発に力を入れています。こうした音声アシスタント技術の開発の進展により、2017年後半からはスマートスピーカー(AIスピーカー)などの商品も登場しました。デバイスを直接操作しなくても音声一つで様々な機能を使うことができるスマートスピーカーは、私たちの生活を大きく変える可能性を秘めています。
日本企業が開発するユニークな音声認識AI
日本企業が開発した音声認識AIの中で、特に注目を集めている技術を3つご紹介します。
人の気持ちを読み取る「音声感情解析AI」Empath(エンパス)とは?
2017年10月に設立されたばかりの日本企業、株式会社Empath(エンパス)が開発しているのは音声感情解析AIのEmpathです。音声感情解析とは文字通り人の声からその人の感情を解析する技術のことです。Empathは人が話す速さやピッチ、さらにはトーンなどの音声の物理的特徴量を解析することで「喜び」「平常」「怒り」「悲しみ」といった4つの感情と「元気度」をリアルタイムで解析することができます。またEmpathは音声の物理的特徴量から解析を行っているため、言語を問わず人の感情を解析することができます。 このような革新的な手法とその高い精度(車内などの雑音環境でもしっかり人の感情を読み取ることができます)がEmpathのユニークな点です。
Empathは今世界中で注目されておりおよそ40か国500社で利用されています。さらに2018年5月にはルクセンブルクで開かれたヨーロッパ最大のカンファレンス「ICT Spring2018」、さらにシンガポールで開かれたアジア最大のカンファレンス「Tech in Asia Singapore2018」の両方のピッチコンテストで優勝を果たすという快挙を成し遂げました。
Empathは従業員のメンタルヘルスケアやコールセンターでの顧客の感情の自動分類、さらには人の感情と購買行動の関係を利用したマーケティングなど、様々な分野での利用が期待されています。株式会社Empathの「音声感情解析」の技術によってAIが人間の感情を読み取ることができるようになる日がやってくるのもそう遠い未来ではないかもしれません。
しゃべってコンシェルと「新AIエージェント」my daiz(マイデイズ)とは?
NTTドコモが提供してきた、羊のキャラクターでおなじみの音声アシスタントサービス「しゃべってコンシェル」はよく知られた音声認識AIサービスの1つです。調べたいことや利用したいサービスをスマートフォンに向かって話しかけると情報を提示してくれますよね。このような音声アシスタントはスマーとフォンがすっかり普及した今ではかなり見慣れたものとなりましたが、しゃべってコンシェルのサービスが開始された2012年3月当初は話題となりました。
NTTドコモは18億回以上利用されたこのしゃべってコンシェルで培った技術やノウハウを駆使して、新たな「AIエージェントサービス」を競合他社に先駆けて発表しました。それが2018年5月30日から提供開始された「my daiz(マイデイズ)」です。my daizの最大の特徴はユーザーの使用履歴や通勤時間などの情報を学習し、各ユーザーの生活に合った情報を適切なタイミングで提供するという点です。電車の遅延情報から早めに家を出ることをユーザーに促したり、天気予報と帰宅時間から帰宅時には雨が降ることを知らせたり、というような情報までこのAIエージェントが知らせてくれます。 このようなユーザーのライフスタイルに密着したAIエージェントサービスは今後ますます私たちにとって身近なものとなっていくでしょう。
おわりに
今回はAI(人工知能)に関連する技術の中でも近年注目を集めている音声認識についてご紹介しました。音声認識AIの開発はアメリカをはじめとした海外諸国の技術が多くの注目を集めていますが、日本企業が開発する技術からも目が離せません。特に他の言語とは異なった特徴を持つ日本語の認識に特化した音声認識AIや、日本人の生活や文化に合わせたAIエージェントの市場はまだまだ拡大する見込みがあります。今後こうした分野での音声認識AIがどこまで進化するか期待したいですね。
近年では音声認識AIだけでなくその他のITに関わる技術をスクールで学びたいという方が増えています。
IT・Web専門スクールであるインターネット・アカデミーではAI(人工知能)についてはもちろん、ITに関する様々な知識やノウハウを提供していますので、ご興味のある方はスクールの無料体験レッスンにご参加ください。
また、インターネット・アカデミーはITの最新技術をビジネスで活用するノウハウを伝えるITコンサルティングも行っております。企業内でのIT人材教育を検討されているご担当者様に対しては、講座内容からスケジュールまで、研修内容をご要望に合わせてカスタマイズしてご提案することが可能ですので、お気軽にお問い合わせください。
AIエンジニア育成コース - 先端技術を活用できる人材を育成する
https://www.internetacademy.jp/ビジネスにおける活用事例などの基礎知識はもちろん、Pythonを使ったAIプログラミングの実践を行います。この実践を通じて、機械学習や深層学習を活用したシステムを構築を行い、IPAが定義している「AI開発者」のミドルレベル(既存のAIライブラリ等を活用して、AI機能を搭載したソフトウェアやシステムを開発できる)に該当する技術を学習します。