TOP > iPhone > title - CamScannerのOCRが、高性能過ぎる

ITやモバイル機器、iPhone、手帳や本など。
MENU

CamScannerのOCRが、高性能過ぎる

2015032600.png

※注:2015年9月28日(月)現在、CamScannerの新しいバージョンでXcodeGhost対策版が出ています。

※注:2015年9月24日現在、CamScannerはXcodeGhostに感染している可能性が高く、インストールするのは控えた方が良いと考えます。以下の記事は、削除せずに残しておきます。


  
【 CamScannerのOCRが、高性能過ぎる 】  

 1.CamScannerとは?

 2.OCR機能がすごい

 3.縦書きもOCRしてみる






checkmark.png 1.CamScannerとは?

CamScanner とは、スキャナアプリです。
斜めから撮影しても、キレイに補正してくれたり、画質なども調整できるすぐれもののiOS・Androidアプリです。

“CamScanner CamScanner Free
価格: 無料
カテゴリ: 仕事効率化, ビジネス




AppStoreで確認




例えば、こんな斜めからでも…
※ちなみに、かなり薄暗い中でやっています。

2015032601.png



自動的にスキャンしたい部分を判断してくれて

2015032602.png



このようになります。

2015032603.png



とても、優秀なアプリで、これだけでも1本記事が書けちゃう感じなのですが、今回はOCRについてです。





checkmark.png 2.OCR機能がすごい

さて、このCamScannerの底力とも言うべき部分としては、OCR機能がすごいことです。
まず、やってみましょう。

1つめは、横書きのものということで、うちの子どもが大好きなカレー職人の原材料の部分をスキャンしてみたいと思います。

2015032604.png



さて、やってみます。
先ほどと同じように、まずはスキャン開始!
スキャンしたい場所が、概ね範囲指定されています。
というか、どうして、そこスキャンしたいって分かった?と思えるほどの以心伝心ぶり。
OKだったら、右下の☑をタップ。

2015032605.png



すると、ほぼ一瞬で補正された画像が出てきます。
今回は、OCRをかけるので、白黒モードを指定しました。
下の方の真ん中にあるOCRという虫眼鏡のアイコンをタップします。

2015032606.png



OCRテキスト認識させるか聞かれるので、OK。

2015032607.png



すると、これもほぼ1、2秒でOCRが完了します。
認識された部分が、どんどん黄色に変わってくるのが、気持ちいいです。

さて、では認識されたテキストを見てみたいと思います。
以下が、認識されたテキストです。

2015032608.png
2015032609.png


ほぼ完璧にテキスト化されているのが分かるでしょうか?

ちなみに、失敗した部分は、
左が、原文。右が、OCR。

じゃがいも → じゃがいb
たん白加水分解物 → たん臼加水分解物
含む → 含43
西淀川区 → 西刑Ⅱ区



これ、先ほども書きましたが、かなり薄暗い中でやっています。
通常のドキュメントスキャナのOCRとは、圧倒的に状況の差があることをふまえると、かなり優秀な方だと思いますよね。






checkmark.png 3.縦書きもOCRしてみる

次に縦書きのものをスキャンしてみたら、どうなるでしょうか?
一般的にOCRは、縦書きに弱いという定説があります。OCRが、英語圏で発展してきたことを思うと、さもありなんですよね。

さて、実際にやってみます。
先ほどの「100の思考実験: あなたはどこまで考えられるか」から、マイケル・サンデルの白熱教室などでも有名になった、踏切でどちらを死なせるのか?という一説をスキャンしてみます。

2015032610.png



さすがに、少し微調節が必要なので、スキャンする部分を指定していきます。

2015032611.png



整ったら、先ほどと同じ手順でスキャン→OCRの流れで行きます。

2015032612.png



気持ちよく、テキスト化されていきます。
テキスト化された部分は、黄色になっています。

2015032614.png



きちんと、何の指定もしていないのに、縦書きの文字だと判断しています(!)。
さらに、精度も見てみましょう。

2015032615.png

左が原文。右が、OCR。

選べるか? → 選べるマ
苦しい選択 → 苦しい還
時間 → 時問
向かってくる。 → 向がってくる
遠い先で → 還い先で
四0人の → 四0人の
作業をしている → 作業をしてぃる
失われる → 失ゎれる
確実だ → 硫実だ


句読点が失われがちなのと、一昔前の女子高生的な感じの表現(笑)っぽい感じになりがちでした。
しかし、これもなかなか優秀な感じだと思います。
そもそも、縦書き認識しないものも多いし。



ちなみに、テキスト化されたものは、このようにクリップボードにコピーしたり、メールで送ることもできます。
また、「開く方式」というのは、App Extentionのことです。ここから、様々なアプリにテキストを渡すことができます。

2015032616.png




 eyeglass2.png 情報管理LOGの眼
 とっさの時のOCR

日常でOCRを使う場面というのは、そうそう多くは無いと思います。私もたまに使うぐらいです。
しかし、「文字の打つのめんどくさいし…」というときに、サッとテキスト化できると気分的にかなりラクになれます。
少なくとも、頭の片隅に「困ったときのCamScannerのOCR」と覚えておけば、きっと助かるはずです。


今回の記事にもちょっと登場した、現在読んでいる「100の思考実験: あなたはどこまで考えられるか」は、頭の体操にちょうどいい感じの本です。
様々な思考実験が載っているのですが、若干こじつけ?と思わなくもない部分もあるのですが、堅くなった脳みそを解きほぐしてくれますよ。





あと、関連本として、マイケル・サンデルの「これからの「正義」の話をしよう 」のKindle版が、すごい安くなっていて驚いたわ…。ナニコレ。





関連記事

Leave a reply






管理者にだけ表示を許可する

Trackbacks

trackbackURL:http://hokoxjouhou.blog105.fc2.com/tb.php/241-2cdb51d8
該当の記事は見つかりませんでした。
SEO
loading
情報管理LOG