FC2ブログ
TOP > アプリ > title - 「文字起こし ばりぐっどくん」vs LINE OCRの性能対決をしてみた

ITやモバイル機器、iPhone、手帳や本など。
MENU

「文字起こし ばりぐっどくん」vs LINE OCRの性能対決をしてみた

2019071900.png


情報管理LOGの@yoshinonです。
「文字起こし ばりぐっどくん」というベンチャー企業が始めたLINE上でOCRができるサービスが、話題を呼んでいます。情報管理LOGでも、早速使ってみたところ、非常に高精度にOCRしていて、正直かなり驚きました。このあたりのことは、最近記事に書きましたので、参照していただければと思います。

「文字起こし ばりぐっどくん」を使ってみたら、なかなか驚異的だったよ

さて、今回は、LINE上での一騎打ち。「文字起こし ばりぐっどくん」とLINE OCRを条件を変えて比較してみたいと思います。




  
【 「文字起こし ばりぐっどくん」vs LINE OCRの性能対決をしてみた 】  

 1.「文字起こし ばりぐっどくん」 とは?

 2.LINE上でもOCRできる

 3.対決その1

 4.対決その2

 5.対決その3

 6.結論







checkmark.png 1.「文字起こし ばりぐっどくん」 とは?

まず、「文字起こし ばりぐっどくん」とは、LINE上で友達になり、画像を送ると、ほぼ数秒以内に文字起こし(OCR)をしてくれるというサービスです。
1年ぐらい前にも、そういうサービスがあったのですが、多くの人が殺到してすぐに使えず、さらに今はすでにサービスがお亡くなりになっていたという…。




「文字起こし ばりぐっどくん」をお友達追加するには、このQRコードを読んでください。




または、以下のリンクをタップしてください。

「文字起こし ばりぐっどくん」 を追加


そうすると、「文字起こし ばりぐっどくん」がお友達追加されるので、あとは文字起こししたい画像を送るだけです。




checkmark.png 2.LINE上でもOCRできる

さて、「文字起こし ばりぐっどくん」の話題ばかりだと不公平なので、LINE自体のことも触れていきます。
実は、あまり知られていなさそうなのですが、LINE自体でOCRできるのですよ。
これに関しては、先日記事にしました。

LINEのトーク画面に投稿した(された)画像をタップします。




そうすると、このように画像が表示されますよね?で、右上の「T」という文字をタップすると…




こんな感じで、文字が認識されるのです。
認識された文字は、なぞるとテキスト化されます。




あと、LINEカメラでもOCRできるのです。




まあ、詳細は上の記事で読んでください。




checkmark.png 3.対決その1

さて、では対決開始です。
今回の対決は、条件を揃えるために、事前に用意した画像を読み込ませて、OCRをかける形にします。

まずは、この画像から。

2019071901.jpg


LINE OCRの結果
ほぼ完璧な結果です。0(ゼロ)をO(オー)で認識しているのが、1件です。

2019071902.png



snow peak
SOLID SERIES
ペグハンマーPro.C銅ヘッド
PEG HAMMER COPPER HEAD
確実に打ち込むペグ専用ハンマー。
打撃部分に採用した銅ヘッドが手への衝撃を
効果的に吸収し、打ち込む力を無駄なく伝える。
N- O 01


「文字起こし ばりぐっどくん」の場合
こちらが、「文字起こし ばりぐっどくん」の結果です。語句の順番は違いますが、上から順番に認識したと考えて良いです。LINE OCRが、完璧かと思われたのですが、よく見ると「snow peak」のロゴの文字の下に、小さく文字があるではないですか!それさえも、認識しているのが、すごいですね。ただし、若干誤変換があります。「ぺ」→「べ」の誤変換1件。

2019071903.png



SOLID SERIES
ペグハンマーPro.C 銅ヘッド
snow peak
PEG HAMMER COPPER HEAD
nce1958
dortyle cn
確実に打ち込むグ専用ハンマー。
打撃部分に採用した銅ヘッドが手への衝撃を
効果的に吸収し、打ち込む力を無駄なく伝える。
N-001




checkmark.png 4.対決その2

次は、近くにあったダイレクトメールを写真に撮って、OCRしてみました。色文字あり、写真との重なりあり、斜め文字ありと、まあまあ難易度があります。
※青文字は、認識されなかった文字

2019071304.jpg



LINE OCRの結果
とにかくレイアウトが、複雑で文字の順番が、バラバラになりがちなのは、どちらも同じ感じです。LINE OCRは、まあまあ認識しているものの、文字が小さくなると途端に認識率が下がります。これに関しては、先ほどのSnowPeekのスキャン結果とも符合します。


夏モノ満開!!
セール本番!!
Perfect Suit JOY
FINAL
SALE!
ファイナルセール!
2019年
8月18日(日)
まで
スーツ
ジャケット
ワイシャツ
レディス商品

MAX
OFF
特設コーナーにて
COUPON
春夏メンズ商品やら
半額
お一人様
43,900+税以上の品
最大10点
まで
本ハガキご持参で割引前価格より
\2,900+以上のレディス商品は30%0FF
※特別セールの、他の割引勢.割引特典及びクーン券、下取りセール、セットセール、バースデー特典、
ゴールドメンバー会員箱奥、タイヤモンドメンバー会員神員名開企業提携典との併用
t/9-シオータ- EDWINL TACTLItR25 -HHO NGRSNこさいB9,$#の射S 第DUB, 前Rとの,中前社6,・会に場らにいていっ負みはが外




「文字起こし ばりぐっどくん」の場合
かなり良い線いっていると思いますが、それでもご認識がところどころありますね。小さい文字(今回の場合は、さらに若干ピンボケ気味)になるとやはり苦しいところがありますが、それでもかなり健闘している感じがします。


夏モノ満開!!
セール本番!!
Perfect Suit JOY
FINAL
SALE!
2019年
8月18日(日)
まで
ファイナルセール!
スーツ
ジャケット
ワイシャッMAX
70%
OFF
レディス商品
特設コーナーにて
COUPON
¥3,900+税以上の品
春夏メンズ
商品
半額9
お一人様
最大10点
まで
本ハガキご持参で割引前価格より
¥2,900+税以上のレディス商品は30%OFF
※特別セールの為、他の割引券、割引特典及びクーポン券、下取りセール、 セットセール、バースデー特典、
ゴールドメンバー会員特典、 ダイヤモンドメンバー会員特典、 各種企業提携特典との併用不可。
バターンオーダー、EDWIN.texcylure品等、一度対象外の商がございます。他の割引券及び引特典との併用不可。 既にされている商品は対象外。




checkmark.png 5.対決その3 

さて、最後は縦書きです。
意外にOCRにとって、縦書きというのは、鬼門だったりするのです。文字の並びから、それが縦書きであると判断するという一手間が必要だったりするので、難易度が何気に高いのですよね。

2019071904.png



LINE OCRの結果
さすがに縦書きは、何度が高かったみたいですね。認識されていない部分が多めです。

第一章人情の碗
茶は薬用として始まり後飲料となる。シナにおいては八世紀に高雅な遊びの
つとして詩歌の域に達した。十五世紀に至り日本はこれを を高めて一種の審美的宗
教、すなわち茶道にまで進めた。
茶道は0日常生活の俗事の中に存する美しきもの
を崇拝することに基づく一種の儀式であ
って、純粋と調和、相互愛の神秘、社会
秩序のローマン主義を諄々と教えるもものである。茶道の要義は「不完全なもの」
を崇拝するにある。いわゆる人生という
この不可解なもののうちに、何か可能な
ものを成就しようとするやさしい企てであるから。



「文字起こし ばりぐっどくん」の場合
上の小さな文字も逃さずやっているのは、スゴイと思いました(縦横混在だしね)。
しかし、やはり認識されていない部分やところどころ見られます。やはり、縦書きはOCR界隈の鬼門というのは、その通りですよね。ただし、LINE OCRよりは、認識率は高めと思って良いと思います。


茶の本 04 茶の本
7/134
第1
人情の碗
茶は薬用として始まり後飲料となる。
シナにおいては八世紀に高雅な遊びの一
つとして詩歌の域に達した。十五世紀に至り日本はこれを高めて一種の審美的宗教、すなわ茶道にまで進めた。
茶道は日常生活の俗事の中に存する美しきもの
を崇拝することに基づく一種の儀式であって、純粋と調和、相互愛の神秘、社会
じゅんじゅん
秩序のローマン主義を誇々と教えるものである。茶道の要義は
「不完全なもの」
を崇拝するにある。いわゆる人生というこの不可解なもののうちに、何か可能な
ものを成就しようとするやさしい企てであるから。





checkmark.png 6.結論

さて、結論ですが、総じて「文字起こし ばりぐっどくん」の方が、若干OCR精度的には、上回っていると考えて良いかと思います。特に小さい文字(やややピンボケした文字)での認識に関しては、「文字起こし ばりぐっどくん」に分があるようです。

また、LINE OCRは、文字をテキストボックスのような形で認識するので、テキスト化するときに、一気にボックスを範囲選択できなくて、ちょっと手間だったりします。このあたりが改善されると、手軽さという面では、有利に働くかもしれませんね。

そういうわけで、情報管理LOG的には、今回の勝負に関しては、「文字起こし ばりぐっどくん」が、優勢であったと考えました。




eyeglass2.png 情報管理LOGの眼
 どちらも手軽で手堅いです

今回、どちらも使って比較してみましたが、非常に手軽です。特にLINE OCRは、普通のトーク画面だったら、すぐに使えるので、精度とかをそれほど気にしなければ、サクッと文字おこしできて楽かもしれません。個人的感想ですが、トーク画面のスクショのOCRは、かなり完璧に近いです。たぶん、そういう用途を見越しての機能なのかな?と思っています。「文字起こし ばりぐっどくん」は、特化しているだけあって、高精度でした。これを小さなベンチャー企業が作っているというのですから、スゴいなと思います。
注意しなくてはいけないのは、どちらもサーバー側にデータを渡して、そこで解析してから送り返している仕様である点です。なので、機密情報などは向かないです。その点は、ご留意ください。



買ってしまった。

Nature Remo mini 家電コントロ-ラ- REMO2W1
Nature, Inc.
価格: ¥6,458




関連記事

Leave a reply






管理者にだけ表示を許可する

Trackbacks

trackbackURL:http://hokoxjouhou.blog105.fc2.com/tb.php/1452-53f87a79
該当の記事は見つかりませんでした。
SEO
loading
情報管理LOG