FC2ブログ
TOP > アプリ > title - Office Lens VS Google KeepのOCRガチンコ対決!

ITやモバイル機器、iPhone、手帳や本など。
MENU

Office Lens VS Google KeepのOCRガチンコ対決!

2018012000.png


情報管理LOGの@yoshinonです。
前回、「Google Keepでいつの間にか日本語のOCRもできるようになってた!」という記事の中でGoogle KeepのOCRは、かなり優秀だという書きました。
それでは、どれぐらいの実力があるのか、MicrosoftのOCRの雄であるOffice LensとGoogle KeepというMicrosoft VS Googleの仁義なきOCRによるガチンコ対決!(三番勝負)です。




  
【 Office Lens VS Google KeepのOCRガチンコ対決! 】  

 1.対決方法

 2.第一戦目

 3.第二戦目

 4.第三戦目

 5.総評







checkmark.png 1.対決方法

まずは、対決方法です。

・対戦は、三番勝負です。勝ち数が多い方が勝ちとします。
・Office LensもGoogle Keepもカメラ機能がありますが、カメラ機能の優劣でOCR精度にばらつきが出ると困るので、事前に他のカメラで撮影した画像を使用します。それを、インポートして、OCRさせます。
・なるべく様々な用途を想定した画像とします。


準備した画像は、以下の通りです。
※実際の解像度は、もっと高めです(2000pix以上)。

昨日、使用したPARMの成分表です。
※画像のノイズ高め、色あり、枠あり、フォント複数種あり。




そして、絵や枠なども入っているティッシュの商品説明。
※画像ノイズ少なめ、挿絵あり、枠あり、フォント複数種あり。

2018012001.png



最後は、「吾輩は猫である」の縦書きルビあり文章。
※画像ノイズ低、縦書き、ルビあり。

2018012002.png



さて、どうなるか!?




checkmark.png 2.第一戦目



<Office Lens>
種類別アイスクリーム
無脂乳固形分 7. O% 乳脂肪分 8. O %
植物性脂肪分 0.3 % (ナツツ加工品) チョコ脂肪分 1 .0%
原材料名乳製品、準チョコレート、砂糖、ココア、チョコレート、水あめ、カカオマス、ナツ
ツ加工品(アーモンドプラリネペースト)、デキストリン、卵黄、乳化剤、安定剤 (増粘多糖類、
ゼラチン、加工でん粉)、香料、(原材料の一部に卵、大豆を含む) 内容量 55 x 6 本
販売者東京都港区芝 5-33-1 森永乳業株式 2 社
製造者静岡県駿東郡長泉町納米里 1 8 冨士乳業株式会社三島エ場


「.」の後にスペースが挿入されています。
数字が、半角全角が混じっています。
変なところでスペースが入ったり、入らなかったりという部分が見られます。
フォントが、特殊な部分が読み取られていない部分(「会」)があります。
しかし、原材料名の部分は、一連の流れという認識ということで解釈しているのが、すごいです。



<Google Keep>
1種類別アイスクリーム
無脂乳固形分 7.0%
乳脂肪分 8.0%
植物性脂肪分
チョコ脂肪分
0.3%)ナッツ加工品)
1.0%

原材料名 乳製品、準チョコレート、砂糖、コ
コア、チョコレート、水あめ、カカオマス、
ナッツ加工品(アーモンドプラリネペース
ト)、デキストリン、卵黄、乳化剤、安定剤
(増粘多糖類、ゼラチン、加工でん粉)、
香料、(原材料の一部に卵、大豆を含む)
内容量
販売者
55ml×6本
東京都港区芝5-33-1

森永乳業株式会社
製造者静岡県駿東郡長泉町納米里18
冨士乳業株式会社三島工場



前回もやったので、重複する部分もありますが、
枠を「1」と認識している。
大きくスペースの空いている部分を別段落として扱っているのか、おかしな部分に改行されている。
しかし、フォントが大きく変わっても、きちんと認識されている部分はすごい。





checkmark.png 3.第二戦目

2018012001.png

<Office Lens>

ワンタッチの開けやすい取り出し


指穴の部分を押し、指先をか
けて引き上げてください。上
ぶたは簡単に取り除くことが
できます。


*パルプ 100 %でつくられています。

*ペーパーの色はホワイトで

*蛍光染料は使用しておりません。

*トイレの詰まりを防止するため

に 水洗トイレに流さないでくだ

さい。


*水ぬれにご注意ください。

ティシューが取り出しにくくなることがありま
す。

*においの強い物の側に保管すると、においが移
ることがありますのでご注意ください。
家庭用品品質表示法による表示

たて寸法201mmx こ 215mm
枚数3 2 0 枚( 160 組)

◆大王製紙株式会社

〒16 -0042 東京都新宿区早稲田町 70-1

@Registere< Trademark—登録商標 MADE JAPAN


変なところでの改行が、見られる。
「です」→「で魂」に誤変換。
「ょこ」の「よ」が小文字。
全角数字と半角数字が入り混じっている。
郵便番号の「2」が、「巨」になっている。
一番下の「d」→「<」になっている。
変な改行さえなければ、そこそこ優秀かと思います。



<Google Keep>

ワンタッチの開けやすい取り出し口
指穴の部分を押し、指先をかけて
引き上げてください。上ぶたは
簡単に取り除くことができます。
*パルプ100%でつくられています
*ペーパーの色はホワイトです
*蛍光染料は使用しておりません
*トイレの詰まりを防止するために
水洗トイレに流さないでください。
ティシューが取り出しにくくなることがあります。
ことがありますのでご注意ください。

*水ぬれにご注意ください。
*においの強い物の側に保管すると、においが移る
家庭用品品質表示法による表示
寸法
たて201mm×よこ215mm 320枚(160組)
枚数
大王製紙株式会社
〒162-0042東京都新宿区早稲田町70-1
®Registered Trademarkー登録商標
MADE IN JAPAN


句読点「。」「、」の抜け(7、8行目)
文章の位置のズレ。(10、11行目)
OCRに関しては、ほぼ正確なのですが、文章のズレが、ものすごく気になります。




checkmark.png 4.第三戦目

縦書き文章でかつ、小さなルビがどれほどの影響を与えるかの実験になります。

2018012002.png

<Office Lens>

がは輩いは猫である。名前はまだ無い

どこで生れたかとんと見け・ん当ーこ、つがっかぬ。何でも薄暗いじめじめした所でニャーニャー泣
いていた事だけは記憶している。吾輩はここで始めて人間というものを見た。しかもあとで聞くと
それは書生という人間中で一番獰悪ど、つ亠の′、な種族であったそうだ。この書生というのは時々我々を
捕つかまえて煮て食うという話である。しかしその当時は何という考もなかったから別段恐しいとも

思わなかった。ただ彼の掌てのひらに載せられてスーと持ち上げられた時何だかフワフワした感じが

あったばかりである。掌の上で少し落ちついて書生の顔を見たのがいわゆる人間というものの

見始みはじめであろう。この時妙なものだと思った感じが今でも残っている。第一毛をもって装飾さ

れべきはずの顔がつるつるしてまるでやかんかたわ

て実に弱った。これが人間の飲む煙草というものである事はようやくこの頃知った

この書生の掌の裏でしばらくはよい心持に坐っておったが、しばらくすると非常な速力で運転し

むやみと、ってい始めた。書生が動くのか自分だけが動くのか分らないが無暗に眼が

廻る。胸が悪くなる。到底助からないと思っていると、どさりと音がして眼から火が出た。それ

までは記憶しているがあとは何の

薬缶だ。その後猫にもだいぶ逢ったがこんな片輪には一度も出会わした事がない真

中があまりに突起している。そうしてその穴の中から時々ぶうぶうと煙を吹く

のみならず顔





うも咽せぼく



ルビの部分が、壊滅的にOCRできていないのがわかります。
また、文章の位置も大幅にズレている部分があります。
実用には、耐えられない感じかな?



<Google Keep>


吾輩は猫である
6:34

章を読み終えるまで6分
1%
わがはい
吾輩は猫である。
名前はまだ無い
けんとう
どこで生れたかとんと見当がつかぬ。何でも薄暗いじめじめした所でニャーニャー泣いていた事
だけは記憶している。吾輩はここで始めて人間というものを見た。しかもあとで聞くとそれは書生
という人間中で一番獰悪な種族であったそうだ。この書生というのは時々我々を捕えて煮て食うと
いう話である。しかしその当時は何という考もなかったから別段恐しいとも思わなかった。ただ彼
の掌に載せられてスーと持ち上げられた時何だかフワフワした感じがあったばかりである。掌の上
で少し落ちついて書生の顔を見たのがいわゆる人間というものの見始であろう。この時妙なものだ
と思った感じが今でも残っている。第一毛をもって装飾されべきはずの顔がつるつるしてまるで
薬缶だ。その後猫にもだいぶ逢ったがこんな片輪には一度も出会わした事がない。のみならず顔の
真中があまりに突起している。そうしてその穴の中から時々ぶうぶうと煙を吹く。どうも咽せぽく
て実に弱った。これが人間の飲む煙草というものである事はようやくこの頃知った。
どうあく
つかま
てのひら
みはじめ
やかん
かたわ
けむり
この書生の掌の裏でしばらくはよい心持に坐っておったが、しばらくすると非常な速力で運転し
始めた。書生が動くのか自分だけが動くのか分らないが無暗に眼が廻る。胸が悪くなる。到底助かる
らないと思っていると、どさりと音がして眼から火が出た。それまでは記憶しているがあとは何の
むやみ
とうてい


私自身気づいていなかったのですが、上下に横書きの文字が入っていました。それも、OCRできているのは、すごいです。
ルビに関しては、別行に入れるということで、文章が破綻することを防いでいることがわかります。




checkmark.png 5.総評

誤字に関しては、総じてOffice Lensの方が、多く見られました。文字の認識率ということに関しては、Google Keepの方が高いように思えました。
OCRされた文章の位置のズレに関しては、どちらのアプリにも見られました。多少の誤字は、あとで校正で直せますが、文章の位置のズレは、全体の文脈を理解しながら見ないといけないので、やや大変だなというか、かなり致命的な部分だなと思いました。

OCRの速度的には、処理にかかる時間に関しては、Google Keepの方が若干レベルで速かったです。また、OCRに費やす手順という意味では、Office Lensの場合、OneDriveにアップロード後にさらにWordで立ち上げなくてはいけないという手間がかかるのが気になりました。そういう意味では、Google Keepは1本だけで済むという気楽さはあります。

今回の三番勝負では載せていませんが、普通の縦書きや横書きの装飾の少ない文章であったならば、どちらも100%に近い認識率でした。したがって、今回はわざとハードルを高めに設定しての対決だったわけです。したがって、日常使いという面で言えば、どちらを使用しても問題ないレベルかと思います。

では、自分だったらどちらを使うかというと、気軽に使えるGoogle Keepかな?と思っています。




 eyeglass2.png 情報管理LOGの眼
 こういう技術はどんどん発展していってほしい

音声認識の技術もそうですが、こういう技術が発展していけば、確実にキーボードという軛から開放してくれるような気がします。もちろん私は、キーボードというデバイスは、なくなることは無いだろうとは思っていますが、その活躍の場は、徐々に狭くなっていくだろうなとは考えています。
ぜひとも、MicrosoftもGoogleも他のテック企業も、競い合って、この分野の技術を発展させていって欲しいなと思います。


漫画 君たちはどう生きるか」の作者のマンガが、100円セールしてますね。





関連記事

1 Comments

yoshinon says..."Re: 「第三戦目」が"
> 「第四戦目」になっちゃってます〜。
あわわわわ。
修正しておきます!!!
ありがとうございます。
2018.01.17 14:15 | URL | #- [edit]

Leave a reply






管理者にだけ表示を許可する

Trackbacks

trackbackURL:http://hokoxjouhou.blog105.fc2.com/tb.php/1081-c701a437
該当の記事は見つかりませんでした。
SEO
loading
情報管理LOG