1. 身近に感じるクラウドAIの恩恵
皆さんのお宅にAmazon Echoはありますか?Alexaの音声認識レベルの高さには非常に驚きます。昔は音声認識といえば話者登録をして限られ音声で特定単語しか認識しなかったったのに、Amazonがディープラーニングで鍛えてくれたおかげで、誰の声でも認識してくれています。
もちろん認識しているのはあの小さい筐体にあるプログラムではなく、クラウド側のエンジンです。クラウド側のAIは音声を認識してテキストに変換するものとそのテキストを理解して処理をする部分(この部分はAlexaスキルとしてオリジナルなものを作ることも可能です)、処理結果を音声データに変換するもの(これもディープラーニングのおかげで流暢です)に分かれます。
我が家も毎日楽しく「アレクサ」と会話しています。もうちょっとこんなことできないかなと思えば、Alexaスキルから面白そうなものを選んで追加します。
これはトレーニングされたAIを使う方法の分かりやすい例です。
2. びっくりするYouTube
YouTubeは皆さん良くみることが多いと思います。英語のコンテンツでは数年前から自動で字幕がつけることができます。(YouTubeをアップした人がそのように設定している場合に限りますが、設定はワンタッチです。でも知らない人も多いようです)
YouTubeの自動字幕、とても良くできています。NHK BSなどで海外のニュースに字幕がはいるのを見たことがありますが、それは字幕が声に遅れてでてくるために、使えません。ところがYouTubeの自動字幕は人がしゃべるまえに字幕が出てきます。なのでしゃべりをききながら字幕を追うことができます。もとの映像の音声トラックから音声認識のAIが字幕を作成し、それをもとの動画に同期をとって合成し、送り出している様です。素晴らしい顧客体験を提供するためにはここまで使う側の立場にたった作りこみをしないといけない、良い事例です。
そして、最近気づいたのは、この字幕を自動翻訳してくれることです。翻訳対象の言語は実に様々、確認できませんが、ほとんどの言語に対応しているのではないかと思われます。この機能を利用して日本人がしゃべっている動画を外国の学生向けに英語字幕を自動付加してみました。日本語と英語とでは構文が異なるので、表示するタイミングも考えないといけませんが、ある一文を登場人物がしゃべりだす前に、対象の英語の文章が先に表示されていました。どれもこれも、GoogleがAIをしっかりと訓練してくれたおかげです。
これもトレーニングされたAIを使う方法の分かりやすい例です。
3. AIは作るから使う時代に
AIというとディープラーニングを勉強してPythonを勉強して、とてもハードルが高いと思われている方もいらっしゃるかもしれません。自らAIを作りたいと思う人は、当然その勉強が必要です。
しかし、画像認識のAIを作りたいということであれば、画像認識用のAIエンジンはAWSもGoogleもAzureも提供してくれています。学習させたい画像は用意する必要はありますが、後はデータを与えるだけです。
しかし、記述した様に学習済みのAIというものが実は世の中にたくさんあります。皆さんが使っているWordやPowerPointにもDictationという音声認識AIが組み込まれています。口述したものをリアルタイムで文章にしてくれます。少し専門的ですが、産総研は動作解析AIというのも既に公開しています。
我々ビジネスユーザが知るべきは、まずは学習済みAIにどのようなものが既に存在しているのかを知ることとです。そのうえで不足しているものがあれば、AIをトレーニングするのか、AIエンジンそのものを作るのかを考えていくことになります。
■執筆者プロフィール
氏名:宗平 順己(むねひら としみ)
所属:武庫川女子大学経営学部教授
ITコーディネータ京都 副理事長
Kyotoビジネスデザインラボ 代表社員
資格:ITコーディネータ、公認システム監査人
専門分野
・デジタルトランスフォーメーション
・サービスデザイン(デザイン思考)
・クラウド
・BSC(Balanced Scorecard)
・IT投資マネジメント
・ビジネスモデリング
・エンタープライズ・アーキテクチャ などなど
コメントをお書きください