キーボード入力に代わる入力装置として、タッチパネルやバーコードリーダー、音声入力のマイクロフォン、そしてOMR(Optical Mark Reader)やOCR(Optical Character Reader)等がありますが、ここにきてOCR技術とAI技術を組み合わせることで、飛躍的に文字認識率が上がり、昔のイメージとは大きく変わっています。DX推進への期待も併せてOCRの歴史の変遷から少し手繰ってみたいと思います。
■OCR発展の歴史
OCRは、紙媒体を光学的(Optical)に走査して画像イメージであるアナログ情報を読み込み、文字(Caracter)を抽出してデジタル情報として認識する装置(Reader)である。1900年前後から世界的に文字認識技術の開発が始まりましたが、国産化が始まったのは1960年代後半で、郵便事業自動化の一環で郵便番号の読み取りにOCR技術を活用し、集配義務の効率化の為に実用化されました。
1970年代には商用化された汎用OCRが登場し、徐々にOCRの業務適用が広がり、1980年代に普及期に入ります。ただ、定型フォーマットで指定された領域を読み取る帳票フォーマットで扱えるものでしたが、1990年代にはあらかじめ指定された領域を読み取るのでない非定型フォーマットの新聞や印刷物などOCRを意識しない媒体の認識処理を可能とする文書OCRが実現しました。また手書き漢字認識もこの時期には可能となりましたが、読み取り率には限界がありました。

■OCRの業務適用体験
OCRが国産化された1970年代に私は資材情報管理システムでのリモートOCRの適用プロジェクトを担当しました。OCR帳票を読み込んで、その数字のデジタル情報をホストコンピュータに送信する制御アプリケーションの設計開発でした。当時のシステム構成は、OCR装置をミニコンコンピュータ(以下、ミニコン)で制御するもので、ミニコンは16ビットのワードマシンでコアメモリーが16Kワードでした。入出力は紙テープで、作成したプログラムは紙テープで保存し、上記16Kのメモリーに格納(ロード)して利用しました。
適用業務は資材の調達業務における「購入要求書」がOCR帳票になっており、ホストコンピュータにその内容を送って処理した結果を「納品書」の帳票で打ち返すもので、初期のオンラインシステムでした。ミニコンを介してネットワークにつながったOCRシステムなのでリモートOCRと呼んでいました。
当時のシステムはOCR装置そのものが原始的で文字認識の目玉に相当するスキャナーが読取り行をガチャンガチャンと物理的に移動するもので、移動しながら読み込んだ数字データをミニコンからホストコンピュータに転送するものでした。この購入要求書は、まさに指定された定位置の数字データをイメージ(アナログ)で認識して購入品目コードや納期・数量や分納まで指示できる数字データ(デジタル)に変換するものでした。
■AI OCR活用によるDX推進への期待
OCRは何と言っても文字認識率の問題が起こります。手書き数字や活字は認識率が高いですが、手書き文字になると従来型のOCRでは認識率がどうしても満足いくものではありませんでした。また、利用環境によっても初期のOCRは影響を受けました。特に冬の乾燥期になると静電気の影響で誤読する問題もありました。しかし、最近のAI技術との融合で、手書き文字や活字についても飛躍的に認識率が向上しました。

AI技術と融合したAI OCRは、膨大な文字データを機械学習や深層学習により、学習させることにより読取り精度が継続的に向上し、さらに誤認識を学習することによって文字認識率を向上させるものです。
一方、従来型OCRでは、複数の帳票を取り扱う中で、帳票ごとの書式を定義し、運用時に切替えを行わなければなりませんでした。それに対し、最近では多様な帳票の書式をAIで蓄積学習することによって非定型帳票の自動読取りが可能になり、データ入力業務の効率化が可能となりました。
自動化の分かりやすい適用事例として最近のクラウド型会計ソフトなどでは、非定型のレストランやコンビニそしてタクシーの領収証などをスマホで写真を撮り、それをクラウドに転送してAIを利用した文字認識により自動的に会計仕分けに取り込むといった従来では考えられないことが実現しています。
今後ともAI OCRの利用による業務効率の向上に取引先からの注文書や顧客のアンケート用紙そして医療機関の問診票や診断書さらには教育現場での答案用紙など再入力不要なダイレクトな文字入力が可能となる利用局面は多く考えられます。

飛躍的に認識率が向上しているAI OCRをRPAとも絡めながら事務効率化のDX推進の起爆剤として
今後は期待したいところです。
(参考文献)
・株式会社NTTデータNJKのWEBサイトのメディアドライブ技術解説
https://mediadrive.jp/technology/aiocr.html
・キヤノンマーケティングジャパングループのWEBサイトのビジネストレンド
https://canon.jp/business/trend/ai-ocr
■執筆者プロフィール
ヒーリング テクノロジー ラボ 代表 下村 敏和
ITコーディネータ&インストラクター
電話番号:075-200-2701
e-mail:t-shimomura@zeus.eonet.ne.jp
コメントをお書きください