ベストチョイスシンドローム

あらゆることに対して最適化を目指す最良選択症候群

紙の資料をカメラ撮影(JPEG化)しGoogleDoc(グーグルドック)でOCRしてテキストにする方法

Evernote(エバーノート)で名刺管理をしている。カメラで名刺を撮影すると名刺の文字を認識して、後で名前やメルアド検索できるので大変重宝している。([IT」エバーノートで名刺管理 - つまらない日記)保存しておきたい紙の資料をスマホのカメラで撮影しエバーノートに保存するときもあるし、ネットサーフィンで見つけたホームページをエバーノートにクリップしたり、メモ帳代わりに使用したりとエバーノートに頼った生活をしている。

エバーノートの文字認識機能をOCRとして活用できないかと思うのだが、エバーノートは文字検索できるのだが、写真データJPEGからテキスト化してコピーしたりする技が判らない。ネットで調べるとやれば出来そうだが少々ややこしそうである。それで他に「無料」で画像データから文字をテキスト化する方法がないか調べるとGoogleDocを利用する方法が見つかったので試してみた。

1.スマホのカメラで資料を撮影する。この時、画像データは2MB以下が良いらしい。

2.画像データ(JPEG)をGoogleDoc(グーグルドック)にアップロードする。スマホアプリの「アストロファイルマネージャー」を使用してファイルのコピー&ペーストしています。

(以下はパソコン操作)

3.アップロードしたファイルを右クリックし「アプリで開く」で「Googleドキュメント」を選びファイルを開く。

4.編集画面に遷移し画像データが上部に表示され、下部に画像から読み取ったテキストが表示される。(少し時間がかかります。)

5.テキストを範囲指定してコピー等ができる。

3年くらい前から既に知られているテクニックのようだが、私は初めて知った。まだあまり試していないが、読み取り能力は、ほどほどだと思う。画像データの精度が高ければ、割と認識してくれる。手書き文字の認識等は判らない。

久しぶりにグーグルドックを使用してみると、機能アップが図られているようだ。編集画面でメニューバーに「アドオン」があり、「Translete」などのアドオンが使用できる。これを活用すると、外国語の文書をカメラで撮り、その画像データをGoogleドキュメントで読み込み、生成されたテキストデータをコピーして、アドオンの「Tranlate」を使用するとグーグルドック内で全ての処理が完結する。アドオンには、画像編集アプリ「Pixlr」などもあり、自由に追加・変更ができる。

ドキュメントは、未だにマイクロソフトWord、Excelの天下が続いているが、GoogleDocも少し便利になってきている。しかし、グーグルスプレッドシートは、まだExcelの機能とはあまりにかけ離れていて、グーグルの本気度が伝わってこない。Wordの行の文字ずれが起こる度に、Word止めたいと思うのだが、なかなかライバルは進出してこない。ここは「一太郎」に巻き返しを期待したいところだ。