FC2ブログ
TOP > Google > title - Google Keepでいつの間にか日本語のOCRもできるようになってた!

ITやモバイル機器、iPhone、手帳や本など。
MENU

Google Keepでいつの間にか日本語のOCRもできるようになってた!

2018011000.png


情報管理LOGの@yoshinonです。
私は、かなり日本語OCRに関心が高いです。
昨日の読書メモでもOCRについて触れていますが、OCRが高機能化すると、様々な面で応用可能なんですよね。そういうわけで、時々OCRの性能比較実験とかしているのは、そういうわけです。
さて、Google KeepというGoogle謹製のメモアプリがあるのですが、いつの間にか日本語OCRができるようになっていました。というわけで、今回はそのレポートです。


  
【 Google Keepでいつの間にか日本語のOCRもできるようになってた! 】  

 1.英数はOCRできていた

 2.日本語のOCRがいつの間にかできるように!

 3.性能実験







checkmark.png 1.英数はOCRできていた

Google Keepといえば、言わずと知れたGoogle謹製のメモアプリです。




私は、けっこう好きで、ちょっとしたメモなどはGoogle Keepでとることも多いです。
当たり前だけど、Googleドキュメントとの相性がすごく良いのですよね。

Bookmarklet: instantly generate a Card for any web page. | Embedly


こんな感じで、メモしたものをホイホイと、Google KeepのメモをGoogleドキュメントにドラッグしていくだけで、ドキュメントとかができちゃう。メモからの文章作成に向いているんですよね。





そして、極めつきはOCRができるです!
しかし、残念なことに以前は、英数でしかOCRできませんでした。要するに日本語非対応だったのです(2015年11月確認)。

Bookmarklet: instantly generate a Card for any web page. | Embedly


以前は、こんなんだった。






checkmark.png 2.日本語のOCRがいつの間にかできるように!

ところが、先日、

そういえばGoogle KeepのOCRってどうなっているだろう?

と思い、確認してみたところ、著しい進化が見られました。なんと、日本語対応しているではありませんか!これは、素晴らしい!
っていうか、色々調べてみたのですが、いつからなのか分からないのですよね。分かる方いらっしゃいますか?

なるべく、アップデートがあった時は、更新履歴を読むようにしていたんですけどね。うむむ。

やり方ですが、このようにやっていきます。
今回使うのは、コレです。PARM(パルム)美味しいですよね。冬でも思わず食べてしまう。コレの成分表の写真を使います。



2018011003.png



Google Keepの右下のカメラアイコンをタップすると

2018011001.png



「写真を撮る」か「画像を選択」が出てきます。どちらでも良いですが、今回は「画像を選択」を選びました。

2018011002.png



そうして、先ほどの画像(画素数はもう少し高い)を選ぶとこのようになります。
この状態で取り込まれた画像をタップしましょう。

2018011004.png



そうすると、画像の編集画面になるので、右上の「…」をタップ。

2018011005.png



サブメニューが出てきますので、その中の「画像のテキストを抽出」をタップ。

2018011006.png



すると…ほぼ瞬間的に、OCRが完了しました。このあたりの性能は、やはりGoogle強しですね。そして、待望の日本語OCRもできていますね。

2018011007.png




checkmark.png 3.性能実験

さて、それでは情報管理LOGでは、お馴染みのOCRの性能実験をしてみたいと思います。

<OCRされたテキスト>
1種類別アイスクリーム
無脂乳固形分 7.0%
乳脂肪分 8.0%
植物性脂肪分
チョコ脂肪分
0.3%)ナッツ加工品)
1.0%

原材料名 乳製品、準チョコレート、砂糖、コ
コア、チョコレート、水あめ、カカオマス、
ナッツ加工品(アーモンドプラリネペース
ト)、デキストリン、卵黄、乳化剤、安定剤
(増粘多糖類、ゼラチン、加工でん粉)、
香料、(原材料の一部に卵、大豆を含む)
内容量
販売者
55ml×6本
東京都港区芝5-33-1

森永乳業株式会社
製造者静岡県駿東郡長泉町納米里18
冨士乳業株式会社三島工場


ほぼ、正確な感じでOCRされていますね。スペースが入っているところの部分が、別段落と判断されたのか、変な位置に入っているのもあるようですが。素晴らしいの一言です。これは、OCRできるアプリの中でも上位に食い込めるレベルだという認識で良いかと思います。
※追記:文字の位置がずれている部分を青色でマークしました。



eyeglass2.png 情報管理LOGの眼
 Google恐るべし

2年前にGoogle KeepにOCR機能が付いた!というニュースがあった時は、英数のみで肩すかしを食らいました。しかし、Googleのことだからいずれは、きっと日本語OCRにも対応するだろうと楽観的に予測していたのですが、まさにその通りになりましたね。しかも、さらりとレベル高めで実現しているし。
こういうあたりにGoogleの技術力の高さが表れるなと思います。


「メイキング~」の方が、Kindle版が500円になっていますね。



関連記事

Leave a reply






管理者にだけ表示を許可する

Trackbacks

trackbackURL:http://hokoxjouhou.blog105.fc2.com/tb.php/1080-88f193fb
該当の記事は見つかりませんでした。
SEO
loading
情報管理LOG