TOP > iPhone > title - Office LensとSccanerProのOCRの性能を比較してみた

ITやモバイル機器、iPhone、手帳や本など。
MENU

Office LensとSccanerProのOCRの性能を比較してみた

2016050500.png


情報管理LOGの@yoshinonです。
先日、ScannerProが日本語OCRに対応したという記事を書きました。今回は、日本語OCRができるアプリとして名高い、Office LensとScannerProを比較してみました。さて、どちらが現状としてOCRの能力が高いでしょうか?

  
【 Office LensとSccanerProのOCRを比較してみた 】  

 1.比較のための画像

 2.横書き2本勝負

 3.縦書き1本勝負

 4.斜めでは?


 
5.総評





checkmark.png 1.比較のための画像

まず、公平を期すために、同一の画像を準備します。
どちらのアプリも画像のインポートに対応しているので、同一の画像を読み込ませてのOCR対決とします。

今回用意したのは、このような画像です。
※実際は、ピクセル的には、130picぐらいを使用しています。

<横書き1>
一本目に用意した画像は、ミスターイトウのチョコチップクッキーの原材料から。ベーシックだけど、美味しいよね。
2016050501.png


<横書き2>
二本目は、部屋にあった適当な箱から。フルーチェMIXのマンゴー&オレンジ味らしい。

2016050504.png




<縦書き>
今回の比較に使ったのは、先日お亡くなりになられた吉野朔実さんの著作である「こんな映画が、―吉野朔実のシネマガイド」から。吉野朔実さんが、亡くなったのはショックすぎです…。
2016050505.png





<斜め>
レベル1
※やや傾いているかな?ぐらいな感じ。
2016050502.png



レベル2
※明らかに傾いていることが分かるレベル。
2016050503.png







checkmark.png 2.横書き2本勝負

まずは、横書きの文字を読み込ませてみます。

<1本目>
2016050501.png

1.Office Lens
o名称:クッキー0原材料名:小麦粉、ショートニング砂糖、チョコレートチップでん粉、鶏卵、ココ刀ヾ、食塩、スパイス、膨脹剤、乳化剤、香料、 (原材料の一部に乳成分、大豆を含む) 0内容量5枚0賞味期限:枠外右側面に記載0保存方法:直射日光・高温多湿をおさけください。
・製造者:イつ製菓株式会社32
〒114ー0014東京都北区田端6丁目1番1号田端ASUKAタワー8階

ほぼ正確に読み取れている感じですね。


2.ScannerPro
〇名称ッキ一〇原材料名ニ丿」丶麦粉、ショー卜二 ング砂糖、チコレ一卜チップ、でん粉、鶏卵、ココノ寶丿丶〝ウ夕~`“、食塩、投牌入膨脹剤淫凵ヒ剤、香料、(原材料の...部に学L成分、大豆を含む) 〇内容 量ニー5枚〇賞味期限枠外右側面に記載 〇保存方法直射日光高温多湿'をおさけください。〇製造者ニダ疇ワ製菓株式会社ーー4~。。ー4 東京都北区田端6丁号田端ASUKA夕ワー8階

かなり、赤くなっています。OCRとしては、厳しいですね。

というわけで、1本目は、Office Lensが勝利!


<2本目>
2016050504.png

1.Office Lens
o 品名デザートべース0原材料名みかんさのうシロップ漬け、果糖ぶどう糖液糖、砂糖、砂糖調製品、マンゴーピューレ、果糖、オレンジ濃縮果汁、食塩、ゲル化剤(ペクチン)、 pH調整剤、甘味料(ソルビトール)、酸味料、カロテン色素、香料、(原材料の一部にりんごを含む) 0内容量 200g 0賞味期限 欄外下に別記
o 販売者ハウス食品株式会社AKC〒577-8520大阪府東大阪市御厨栄町1 - 5 - 7

文字の前についている○が、0(ゼロ)と読み違っているだけで、ほぼパーフェクトですね。

2.ScannerPro
品名 デザ一卜べ一ス 原材料名 みかんさのうシロップけ、 果糖ぶどう糖液糖丶砂糖、 砂糖調製品、 マンゴピュレ、 果糖、 オレンジ濃縮果汁、 食塩、 ゲル化剤 (ぺクチン)、pH調整剤甘昧料 (ソルヒ"卜ール)、 酸味料、 カロテン色素 香料、 (原材料の一部にりんごを含む) `内容量 2。。g 賞期限 外下に別記 販売者 ハウス食品株式会社AKC 〒5フフ-852 大阪府東大阪市御厨栄町ー一5-7

これぐらい読み取って欲しいなという数字部分とかでも、間違いがありますね。うーん。

2本目もOffice Lensが勝利!



checkmark.png 3.縦書き1本勝負

実はScannerProは、現状としては、縦書き文字のOCRに対応していません(2016/04/29)。したがって、この勝負は全く持ってアンフェアです。でも、まぁ勝負の世界は厳しいと言うことで…。

2016050505.png



1.Office Lens
奇跡の海
B「04k一ミThe
私日く、 これは 『べティ・プレー』 『ビアノ・レッスン』 に続いてカンヌ映画祭グランプリを取った三大恋愛映画の3本目の映画す。それぞれ、 まったく異なったタイプの女と男による究極の愛の物語なの、出来れば3本とも見て比較していただくとよりお楽し 、こだけるかと田5います。どれも凄まじく て圧倒されます。 もって、どれに一番打たれるか今の自分の恋愛観とか願望とかがわかります。

「で」が、ことごとく「て」になっていますね。「思」という字が読み取れなかったのも意外です。フォントの問題かな?
でも、縦書きなのに英文が、ところどころ読み取れているのに逆に驚きました。


2.ScannerPro
奇亦の、、 閃幕〝献...填 升實 妄昆竄

私曰く、 これは 『ベティ・プルー』 『ピアノ ・ レ ッ スン』 に続ンヌ映画祭ぞグランプリを取った三大恋愛映画の3本目の映画ゼす。それぞれ、異なったタイ。フ の女と男による究極の愛の物語なの〝て、 出来れぱ3本とも見て比較していただとより楽しまった<みいただけるかと思います。どれも凄まじ〈て庄倒れます。 〝てもって、 どれに 一番打たれるかゼ今の自分 の恋愛観とか願望とかがわかります。

ScannerProが、思ったよりも健闘しています。所々昔の女子高生風になっているのが、ご愛敬ですね。それと、こちらも「で」などの濁音部分がうまく読み取れていませんね。OCRで濁音って難しいのかな?

誤字判定から、これもOffice Lensが勝利。



checkmark.png 4.斜めでは?

最後は、微妙に斜めっている画像を用いての対決です。角度によって、認識が変わってくると思われるので、2種類準備しています。

<レベル1>
心持ち斜めになっている画像です。

2016050502.png


1.Office Lens
o名称:クッキー0原材料名:小麦粉、ショートニング砂糖、チョコレートチップでん粉、鶏卵、ココ刀けタ、食塩、スパイス、膨脹剤、乳化剤、香料、 (原材料の一部に乳成分、大豆を含む) 0内容量5枚0賞味期限:枠外右側面に記載0保存方法:直射日光・高温多湿をおさけください。o製造者:イ・つ製菓株式会社32〒4ー0014東京都北区田端6丁目1番1号田端ASUKAタワー8階

ほんの5°ほど傾けた画像なのですが、認識に差が出てきました。特に数字部分に現れていますね。


2.ScannerPro
〇名称ッキー 〇原材料名・'丿j丶麦粉、ショー卜二 ノ`グ、`砂糖、チョコレー卜チップ、て"ん粉、鶏卵、ココ

~認識せず~

存方法直射日光高温多湿,をおさけください。
〇製造者ニ ~認識せず~ーー4ー。。ー4
東京都北区田6丁目号 田端ASUKA夕ワー8階

もはや、比較するのも酷というレベルです。かなり認識していない部分があります。

というわけで、圧倒的にOffice Lens。



<レベル2>
さっきよりも明らかに斜めになっていることが分かります。OCRの限界に挑戦です。

2016050503.png


1.Office Lens
o名称:クッキー0原材料名:小麦粉、ショートニング砂糖、チョコレートチップでん粉、鶏卵、ココ刀けタ、食塩、スパイス、膨脹剤、乳化剤、香料、 (原材料の一部に乳成分、大豆を含む) 0内容量5枚0賞味期限:枠外右側面に記載0保存方法:直射日光・高温多湿をおさけください。
o製造者:イつ製菓株式会社32
40014東京都北区田端6丁目1番1号田端ASUKAタワー8階

予想以上の大健闘です。ほぼ先ほどのレベル1と遜色ない認識率です。


2.ScannerPro
~認識せず~


いっさい文字として認識されませんでした。

これも、Office Lensが勝利。





checkmark.png 5.総評

優劣の面では、語るまでもなくOffice Lensの圧勝でした。
しかし、OCRをどこで処理しているかという部分で考えると、その方法に2つのアプリは全く違う手法をとっていることがわかります。

まず、Office Lensは、一度OneDrive上に送り、サーバー上でOCRをしていると考えられます。

2016050506.png


しかし、それに対してScannerProは、iPhone内で全てのOCR処理をしています。
たぶん、そういう点で大きなハンデがあるように思いました。

2016050507.png


OCRするときに、Microsoftとはいえ、外部のサーバーにデーターが送られるのが嫌ならば、Office Lensはオススメできませんね。
でも、別に気にしないならば、OCR精度の高さは、素晴らしいです。




eyeglass2.png 情報管理LOGの眼
 日本語OCRは奥が深い領域なのです

情報管理LOGでは、たびたび日本語OCRについて取り上げています。この領域は、なかなか奥が深くて、ちょっとしたことで精度が変わったりするんですよね。そして、アルファベットと違い、かなり判定するのが難しいだろうなとも思います。それでも、日進月歩で、どんどん良くなっているのは、実感できます。
2バイト文字文化の宿命としては、解析までに時間がかかってしまうところですが、ディープランニングでなんとかならないかなぁと甘い期待を寄せています。


関連記事

Leave a reply






管理者にだけ表示を許可する

Trackbacks

trackbackURL:http://hokoxjouhou.blog105.fc2.com/tb.php/578-a28a00dc
該当の記事は見つかりませんでした。
SEO
loading
情報管理LOG