【Ver.4→Ver.5】AIReadバージョンアップしました!

【Ver.4→Ver.5】AIReadバージョンアップしました!

その他2024.11.08

【Ver.4→Ver.5】AIReadバージョンアップしました!

はじめに


『フリーピッチの手書き文字 / チェックマーク / 丸囲み / バーコード』
AIReadは、これらすべてに対応するAI-OCR製品です。

先日、アライズイノベーション株式会社が提供する「AIRead」に新バージョンがリリースされました。従来のOCRから強化された今回は、より高精度かつ効率的な文字認識が可能になっています。
本コラムでは、AI-OCRについて簡単にご説明した上で、バージョンアップによって利便性が向上した「AIRead Ver.5」をご紹介いたします。

AI-OCRとは

AI-OCRに含まれている「OCR」とは、"Optical Character Recognition/Reader"の頭文字を取ったもので、日本語では「光学的文字認識」と訳されます。
一般的には、イメージスキャナやデジタルカメラによって取り込んだ画像の文字部分を、コンピュータが利用出来るデジタルの文字に変換する機能や仕組みのことを指します。この技術にAIを活用し、読取精度を向上させたものがAI-OCRと呼ばれています。
紙の帳票に記入または印刷された文字をデジタルデータとして業務システムに取り込むことで、それ以降の多様なシステムでもデータを効果的に再利用することが可能となり、業務の効率化に貢献しています。

OCRの道のり

OCRの研究や開発が始まったのは、およそ110年前の1910年代にまで遡ります。
当時は印刷文字を読み取り、データ化するということが目的ではありませんでした。文字列を読み取って電信符号に変換する、印刷物をスキャンすると文字の形状によって異なる音を発するなどの、電信技術の拡張と視覚障害者向け機械の開発が根底としてありました。
1960年代以降になって、ようやくイギリスやカナダなどの郵便局でOCRを利用した自動化が行われるようになり、受取人の名前と住所を読み取って番号順に並べ替えるという用途で使用され始めたそうです。とはいえ、手書き文字の識別技術が未成熟な時代ですので読取精度はかなり低かったとのことです。

日本で初めて国産OCRが製品化されたのは1968年ですが、官公庁や大手企業がOCRを活用するようになる1980年代まで利用が劇的に広まることはありませんでした。
1990年代になると少子高齢化社会が問題視され始め将来的な労働力不足が叫ばれるようになり、2000年を超えて以降は急速なIT化による企業間競争の激化も相まって、次第に高まる業務効率化の圧力がOCRの普及を後押しするようになりました。
ちなみに、漢字、平仮名、カタカナなど多種多様な文字を扱う日本語の文字認識が困難を極めることは想像に難くありませんが、多数の技術者や研究者、および企業の精力的な研究開発によって技術的課題は克服されていき、現在では行政機関や企業の文書管理、書籍のデジタル化など、幅広い分野でOCRが活用されています。

AIReadの魅力

様々なOCR製品が次々と誕生している中で、次のように思う方がいらっしゃるかも知れません。

"他社OCR製品とAIReadのどんなところに違いがあるのか"

そのことを踏まえて、ここからはAIReadの魅力をいくつかご紹介させていただきます。


ポイント①:高精度な文字認識

OCR製品で最も重要なのは、何と言っても認識精度です。
選定するにあたり、その製品が現状どれだけの識字率を有しているのか、また精度向上の見込みがあるのかなどは重要な判断材料です。
AIReadは最新のAI技術を活用して、文字認識の精度を大幅に向上させています。フリーピッチ(文字の間隔が不均一)の手書き文字、チェックマーク、丸囲み、バーコードなどにも対応し、それらを組み合わせた複雑なレイアウトの書類でも高い識字率を誇ります。

ポイント②:柔軟な定義作成

定型帳票のみにしか対応していない製品では、効率の低下やコストの増加が見込まれます。
例えば、異なる形式の書類を処理する際に、わざわざ手動で設定を変更しなければならないとなると非常に手間がかかります。
また、非定型帳票が未対応の場合、業務の柔軟性が損なわれ、結果的に人件費や時間コストの増加につながってしまいます。
AIReadでは定型帳票のみならず、非定型の帳票にも対応した柔軟な定義を作成することが出来ます。

ポイント③:多言語対応

日本語、英語のほかロシア語、中国語(簡体字、繁体字)、タイ語、ベトナム語などの東南アジア圏をはじめ、様々な言語の文字認識が可能になっています。
また、海外(シンガポール)での利用実績もあり、AIReadではグローバルなビジネス展開をサポートすることが出来ます。

ポイント④:様々な環境に対応

オンプレミス、クラウド、LGWANなどの様々なシステムを、目的に合わせて、社内のセキュリティ要件を守りながら利用することが出来ます。
また、LCD(ローコード開発ツール)連携・ETL(データ抽出・変換・加工・ロードツール)連携・RPA(業務プロセス自動化ツール)連携などのオプションもありますので、比較的容易に効率的な業務フローを構築することが可能です。

ポイント⑤:ユーザーフレンドリーなインターフェース

ユーザーが日常的に利用する上で、分かりやすく重要になってくる要素は「使いやすさ」だと思います。
どれだけ読取精度が優れていても、使用方法が難解ではミスが多発するかも知れませんし、それでは円滑で効率的な業務ルーチンとは言えなくなる恐れがあります。
AIReadでは直感的で使いやすいインターフェースにすることで、初めて利用するユーザーでも操作しやすい設計になっています。

グレードアップした機能について

それでは、ここからはグレードアップしたAIRead Ver.5の機能についてご紹介いたします。


①各機能がForm EditorにUI統合

まず、AIReadには以下6つの機能が存在します。

  1. Form Editor
  2. 定型帳票の帳票定義作成・チューニングを行う
    座標を指定し、データを読み取る定義を作成可能
  3. Rule Editor
  4. 非定型帳票の帳票定義作成・チューニングを行う
    キーワード等を指定し、データを読み取る定義を作成可能
  5. Sorting Editor
  6. Form Editor・Rule Editorで作成した定義を使用し、
    帳票仕分けの設定の作成や帳票仕分けを行う
  7. Shortcut Creator
  8. arexファイルの作成・編集を行う
    (arexファイル: AIRead独自の実行用ショートカットファイル)
  9. Viewer
  10. Form Editor・Rule Editorの定義で読み取った帳票データの確認を行う
    また、CSVファイルへの出力が可能
  11. Control Panel
  12. 共通設定ファイルの作成・チューニングを行う

今回リリースされた最新バージョンでは、上記のうち1~4の機能が「Form Editor」として統合されました。

アップグレード①: 各機能がForm EditorにUI統合

管理画面上部には、「フォーム定義」、「仕分け定義」、「ショートカット」の機能へ誘導するボタンが配置されています。

「フォーム定義」にはForm EditorとRule Editorの機能が集約されていて、座標やキーワード等で読取定義の作成が可能になっています。

「仕分け定義」では、Sorting Editorの機能である仕分け定義の作成が出来ます。

「ショートカット」では、Shortcut Creatorの機能であるarexファイルの作成を行うことが出来ます。

②座標指定(定型)とルール指定(非定型)の混合定義

定型帳票に対応したForm Editorと非定型帳票に対応したRule Editorは、元々それぞれが独立した別の機能・ツールだったため、ひとつの定義の中でここは座標指定、こっちはルール指定、というような柔軟な定義は作成出来ませんでした。

アップグレード②: 座標指定(定型)とルール(非定型)の混合定義

ですが、機能統合されたことによって上図のような混合定義が可能になりました。
定型帳票のみで対応していたチェックボックスや丸囲みの読み取りと、非定型帳票のみで対応していたキーワード指定などを混在利用出来るようになったため、以前よりもさらに柔軟な定義が作成出来るようになっています。

③座標指定(定型)のキーワード仕分け

従来、座標指定で定義作成した場合には、「画像仕分け」という仕分け方法しか適用出来ませんでした。

アップグレード③: 座標指定のキーワード仕分け

最新バージョンでは上図のように「キーワード仕分け」を適用した上で、さらに左下の[設定]から探す範囲を絞って振り分けることが出来ます。
また、画像仕分けでは類似帳票の振り分けが難しい場面もありましたが、キーワード仕分けが適用可能となったことで、以前よりも容易に類似帳票を振り分けられるようになりました。

④手書き文字をルール指定(非定型)で読み取り

定型と非定型帳票の混合定義が可能になったため、座標指定のみに対応していた手書き文字の認識もルール指定で読み取り可能になりました。

アップグレード④: 手書き文字をルール指定(非定型)で読み取り

このような機能統合によって読取精度の向上が見込め、多種多様な帳票にも柔軟に対応することが出来ます。

おわりに

本コラムではOCRの背景をご説明した上で、AIRead Ver.5についてご紹介させていただきました。
AIReadは精度向上を目指し日々研究が進められていて、ヒューマンエラーの軽減や業務プロセスの効率化など、今後もあらゆる企業でお役に立つことの出来る製品を目指しています。
OCRのような技術トレンドはその時々の社会環境や情勢と密接に関連して、様々な要因から普及するものもあれば、衰退していくものもあります。
ですが、現時点においてOCR製品が業務の効率化やデジタル化の推進のために非常に有効なツールであることは間違いありません。
もしOCR製品の導入をご検討中の方は、このコラムをきっかけと思っていただいて、選択肢のひとつにそっと「AIRead」を加えていただければ幸いです。