TOP > Google > title - Googleドキュメントが日本語OCRに対応したのですぐさま使ってみた

ITやモバイル機器、iPhone、手帳や本など。
MENU

Googleドキュメントが日本語OCRに対応したのですぐさま使ってみた


いつ搭載されるんだ?と心待ちにしていた機能であるOCRが、とうとうGoogleドキュメントに登場しました。というわけで、さっそくその使用感を確かめてみました。

  
【Googleドキュメントが日本語OCRに対応したのですぐさま使ってみた】  
 1.GoogleドキュメントでOCRをかける方法
 2.OCRの精度は?
 3.ダウンロードしてみるとどうなるか
 4.使用感まとめ





1.GoogleドキュメントでOCRをかける方法
Googleドキュメントが、日本語のOCRに対応したそうなので、さっそく使ってみました。

まず、ファイルを選択します。ドラッグ&ドロップに対応しているのでラクですよね。

次に変換オプションをしていします。ここで、PDFや画像からOCRするかを選べます。デフォルトでは、OCRをかけない設定になっています。
2011030302.jpg


さっそくアップロード!

2011030303.jpg

あっという間に上がります。


すぐにそのGoogleドキュメント上のファイルを開いてみます。
すると…
2011030304.jpg

下の方にOCRで日本語化された文章が載っています。
この間、わずか数秒です。恐ろしく早いです。


2.OCRの精度は?
では、OCRの精度はというと、イマイチ感が漂います。
上での変換精度もアルファベットと混在すると途端に悪くなるような印象です。

上の画像は、やや解像度が小さかったので、もう少し大きな画像をアップロードしてみます。
こんどは、これ。
2011030305.jpg


で、Googleドキュメント上でOCRした結果は、これ。
2011030306.jpg


やはり、アルファベットが入ると、日本語ではないのでダメということなのでしょうね。

ちなみに変換されたテキストは、単なるテキストなので編集することができます。こんな感じ。
2011030307.jpg



3.ダウンロードしてみるとどうなるか
では、OCRしたものをダウンロードするとどういう結果になるのかやってみました。

ダウンロードは、ファイルの一覧の右側にある「操作」をクリックするメニューの中にあります。
2011030308.jpg


ダウンロードを選択すると、形式を選択できるのでPDFでやってみます。
2011030309.jpg


これが、ダウンロードしたPDFです。
2011030310.jpg


もしかして、PDFに日本語が埋め込まれているのでは?
と思ったので、選択してみます。
2011030311.jpg


残念ながら、画像は画像。テキストはテキストという扱いのようです。残念。


4.使用感まとめ
使用してみた感じとしては、以下の通りです。
 ・通常のOCRをする速度としては、驚異的な速度
 ・しかし、OCRの精度はイマイチ
 ・特に日本語とアルファベットが混在するとかなり厳しい
 ・ざっくりと日本語だけを抽出するという用途には向いているかも


一番下にも書きましたが、大量にある画像やPDFから日本語をざっくりと抽出するというときには、力を発揮するかもしれないという印象です。
しかし、Google様なので、きっと日々精度が上がってくる可能性があります。その時には、相当強力なツールになり得るかもしれないと感じました。
もしも変換精度が、高くなったときには、ScanSnapなどではOCRをかけずにPDF化して、OCRはGoogleドキュメントに任せるという使い方もありかもしれないなと思いました。




関連リンク
Googleドキュメント
関連記事

Leave a reply






管理者にだけ表示を許可する

Trackbacks

trackbackURL:http://hokoxjouhou.blog105.fc2.com/tb.php/145-da0e1c82
該当の記事は見つかりませんでした。
SEO
loading
情報管理LOG