「e.Typist Mobile」のメイン画面

ビジネスの現場では、会議での配付資料やFAXなど、まだまだ紙ベースでの書類のやり取りが健在だ。それらの文書を電子的に保存しておきたいとき、オススメなのがOCR(文字認識)ソフトを利用してテキストをデータ化する方法。電子データ化しておけば、キーワードでファイルを検索することができるし、別の書類への流用も簡単にできる。そのOCR、各社からいろいろな製品が出ているが、忙しいビジネスパーソンにイチ押しは、メディアドライブが提供するスマートフォン向けアプリ「e.Typist Mobile」だ。

●読取り時間は約10秒、認識結果は良好

「e.Typist Mobile」は、スマートフォンのカメラで書類を撮影し、その書類に含まれる文字列をOCRにかけてデータ化するアプリ。外出先で空き時間などを使って、いつでもどこでもOCR処理できるのがいい。iPhoneやiPadに対応した「e.Typist Mobile for iPhone」、Android OSを搭載したスマートフォン向けの「e.Typist Mobile for Android」の2種類があり、価格はいずれも900円。機能は基本的にほぼ同じということで、今回はiPhoneを使って「e.Typist Mobile」を試した。

使い方はいたって簡単。App Storeから「e.Typist Mobile」のアプリをダウンロードし、起動するとメインメニューの表示が出てきて「カメラ撮影後、文字認識を行う」をタップする。カメラが起動するので、OCRにかけたい書類を撮影するだけ。カメラの特性上、光量が足りないとノイズがのってしまい、どうしても読取り精度が落ちてしまうので、できるだけ明るい場所で撮影することがポイントだ。また、被写体に影ができると読取りが難しくなってしまう。屋外では影のできにくい場所、屋内では部屋を明るくして、影になりにくい環境をつくろう。

撮影後は、テキスト化したい部分を選択して処理を開始する。処理範囲にもよるが、10秒ほどでOCR処理の結果を表示。間違って認識していた場合は、その部分を修正すればいい。撮影した画像とテキストデータを同時に参照できるので、簡単に修正することができる。テキストの修正部分にカーソルを合わせると、画像データ内の該当位置を表示してくれるので、画像を参照しやすい。認識結果を保存しておいて、時間のあるときに修正することができるのが便利。保存件数は100件までだ。

気になる認識精度はどうか。フリーマガジン『BCNランキング』11月号の5ページに掲載している「ニュースなデジタル」で試した。横5.5×縦3cmのなかに200文字ほど詰まっている記事の場合、ドロップキャップ(文頭の大きな文字)以外の部分で、すべての文字を正しくテキスト化することができた。

さらに大きなサイズの書類でも試した。メディアドライブが発表した「e.Typist Mobile」のプレスリリースをA4サイズにプリントし、本文に該当する部分をOCR処理した。このプレスリリースは、文字の大きさなど一般的な会議用の資料と同じ。結果は、残念ながら、誤認識の部分が多かった。詳しく傾向をみてみると、ヤクモノ(カギ括弧や丸括弧など)やアルファベットの多い部分で誤認識が目立つ。しかし、日本語が連続する部分の認識精度は良好だった。

撮影の腕の問題か、それともOCRエンジンの問題かを検証するために、プレスリリースをスキャナで読み込み、その画像データをOCRにかけた。画像データのサイズは1653×2291ピクセル。iPhone4で撮影した画像と比べて、ひと回りほど小さいサイズだ。その結果、認識精度は95%以上を記録した。つまり、撮影さえうまくできれば、A4サイズの文書でも問題なく認識できるということだ。

●便利な画像補整機能で認識精度をアップ

書類や画像によっては、うまく文字を認識できないこともある。そのようなときのために、「e.Typist Mobile」は、画像の補整機能を搭載している。例えば、カラー画像をモノクロにすることによって文字認識できる状態かどうかを確認する「白黒表示」や、文書の歪みを補正して文字を見やすくする「長方形補正」などの機能もある。

さらに、「レイアウト解析」機能を利用すれば、雑誌などのように文章があちこちに散らばっている書類も処理することができる。不要なブロックは、OCRの対象から除外したり、認識の順番を設定したりすることもできる。

●読み取った文章をクラウドサービスにアップロード

「e.Typist Mobile」でOCR化したテキストは、元の画像とともにiPhoneに保存するだけでなく、保存したテキストでウェブでのキーワード検索を行ったり、マイクロソフトの「Bing Translator」で日英翻訳をかけたりすることができる。

PDFファイルやテキストファイル、画像ファイルとして、データを保存することもできる。PDFファイルでは、透明テキスト付ファイルを作成することもできる。作成したファイルは、クラウドサービスにアップロードしたり、メールで送信したりできる。対応するクラウドサービスは、「Evernote」「Dropbox」「Sugarsync」(iPhone版のみ)。外出先でOCRにかけた書類を、さまざまな機器で共有することができるのは非常に便利だ。

「e.Typist Mobile」は、精度の高いOCRエンジンを搭載し、うまく撮影しさえすれば、A4サイズ(Android版や英語認識時はA5サイズまで)の書類を正確にテキスト化することができる。さらに、クラウドサービスとの連携で、データの保存や共有がしやすくなる利便性の高いアプリだ。紙文書をテキストデータ化することによって、PCでの書類作成や管理の手間を大幅に削減できる「e.Typist Mobile」は、仕事の効率をアップしてくれる心強いビジネスパートナーになってくれる。(フリーライター・星政明)

・「e.Typist Mobile for Android」をダウンロード