<ケース1>
皆さんの多くはOffice365を使っておられると思います。
それにDictationという機能が追加できるのをご存知でしょうか?
いわゆる音声入力機能です。
WordやPowerPointにおいて音声入力したものをそのまま表示するだけではなく、翻訳した文章を出力することも可能になっています。対応言語も幅広いです。
実はデスクトップ版でもダウンロードして使うことができます。
https://dictate.ms/
<ケース2>
また、YouTubeを見ている方も多いと思います。
画面の右下にスマホでおなじみの設定ボタンがあります。
海外企業が制作したものでこのボタンを押すと字幕というファンクションが表示され、選択すると、英語(自動生成)というものが表示されます。(フランス語ならフランス語(自動生成)、日本語なら日本語(自動生成)になります)。これを選択すると、字幕が自動生成されます。よく見ていると、人がしゃべるより前に字幕が表示され、言葉と字幕がよく同期されています。
さらに、Chromeを使っていると自動翻訳というアプリがあって、結構長い文章でもそれなりの精度で翻訳して返してくれます。
ケース1、ケース2とも無料です。
ケース1はMicrosoftがCortanaのために育てた音声認識AIを無料開放してくれています。ケース2はGoogleが育てた音声認識AIと自動翻訳AIを無料提供してくれています。AlexaだとAmazonが同様のサービスを提供してくれていますね。
このような学習されたAIというには音声認識だけでなく、画像認識においても同様です。Mask R-CNNという一般物体認識用の学習済みAIモジュールをダウンロードして例えばPythonで利用することができます。
いずれもディープラーニングによる学習成果ですが、音声認識、画像認識、文字認識用の素材がインターネット上に膨大にあるため、大量の学習用データを大きなコストをかけずに収集し、学習させることができているのです。
今、世の中のAI関連サービスは2つに分かれています。
自社でAIを育てるためのディープラーニング環境を提供するものと、すでにトレーニングされたAIを提供するものです。Amazonのジェフベゾス氏は、これからAWSを通じてAIの専門家のいない中堅・中小企業でもAIを利活用できるように、機械学習とAIを提供するといっていますが、その意味は上述の通りです。
トレーニングされたAIはこれからも多く出てくるものと思います。私たちは、これらのAIを組み合わせ、どうしても自社のオリジナリティを出したい部分は機械学習エンジンを使ってAIを育成し、うまく全体を組み合わせて使う、このような時代にすでに突入しています。
このような視点で世の中のAI関連サービスを見ていただくと、身近にAIを活用することができます。
■執筆者プロフィール
氏名:宗平 順己(むねひら としみ)
所属:ITコーディネータ京都 副理事長
Kyotoビジネスデザインラボ 代表
資格:ITコーディネータ、公認システム監査人
URL:https://www.kyoto-bdl.com/
専門分野
・サービスデザイン(UX)
・クラウド
・BSC(Balanced Scorecard)
・IT投資マネジメント
・ビジネスモデリング
・エンタープライズ・アーキテクチャ などなど
コメントをお書きください