情報管理LOG
yoshinon

ITやモバイル機器、iPhone、手帳や本など。

ScreenpressoのアップデートでOCRによる文字認識が簡単になったよ

2022年07月20日
ソフト 0
2022071900.png



情報管理LOGの@yoshinonです。
Screenpresso使ってますか?
画像注釈を1日1回以上するような方だったら、ぜひとも導入すべきソフトです。非常に優秀な画像注釈ソフトなのですが、そのScreenpressoがアップデートでOCRによる文字認識が超優秀になり、使えるレベルになりました。今までは、単に優秀な画像注釈ソフトでしたが、これからは「画像からテキストを抜き出したいな」という時にも手間を掛けずに、サクッと使えますので非常に楽になりそうです。
というわけで、今回はScreenpressoのOCRによる文字認識について書いていきます。



  
【 ScreenpressoのアップデートでOCRによる文字認識が簡単になったよ 】  

 1.アップデートによってライセンスが

 2.ScreenpressoのOCRを試してみる

 3.翻訳もできる








前回の記事でも触れましたが、Screenpressoのアップデートでなんと一種のサブスクのようになってしまいました。



まあ、1年毎に2000円ぐらいなら自分の活用状況としては全然ありだし、もし嫌ならサポートは受けられなくなるけど、ソフト自体は使い続けることが可能だしと割り切りました。
私のようにブログを毎日書くとか、画像注釈を頻繁にするというひとならば、圧倒的におすすめできるソフトですが、そうではない人にとっては、まあ強引にお勧めはしません。

と、前回の記事をこんな感じで締め括って終わりにしようと思っていたですよ。

しかし、しかしですよ!

画像のOCRが、できるようなったというならば、少し話は変わってきます。実は、以前からScreenpressoでOCRはできていました。しかし、全く使い物にならないがらくたレベルのどうしようもない感じの出来のOCRだったので、あえて情報管理LOGでは触れずにきていました。ところが、実際に使ってみたら、以前とは比較にならないぐらいに使い勝手が向上していたのです。
というわけで、以下でその点について書いていきます。




Screenpressoの価格設定で、OCRについて書いてありました。

2022072001.png



ほぉ、これは興味深い。
実は、Screenpressoの新バージョンの方に切り替えたのも、このOCR機能が充実したからというのも理由の一つだったりします。

というわけで、さっそくやってみることに。

情報管理LOGの文章をそのままScreenpressoでスクショを撮って、OCRをかけます。
こちらの記事ですね。



2022072002.png



「テキスト認識」でできます。

2022072003.png



さて、結果はいかに!
こちらが、OCRされたテキストです。

人 間 は 、 3 つの 点 を 見 る と それ を 顔 と し て 認識し て し まい が ち に な っ て し まう 現象 を 「 シ ミュ ラク ラ 現 象 」 と いう の で す 。
この 現象 に つい て の 理解 は し て いた の で 、 子 ども が 生ま れ て 間 も な い 頃 に 3 つの 点 を 書い た 絵 を 見 せ た ら どん な 反応 を する
の か や っ て みた ら 、 本 当 に 顔 だ と 思っ た よう で 、 ニ コ ニコ し た り 手 で 触 ろ うと し た りす る な どの 反応 が 見 られ まし た 。 ぜ
ひ 、 赤 ちゃ ん の いる 庭 は 、 試 し て みて 欲し いと 思い ます 。

※赤は、誤字または誤認識。青は、失われた文字列。

まあまあなテキスト認識ではないでしょうか?
残念な部分があるとしたら、文字と文字の間にスペースが入りがちなところですね。

先ほどのは、実際の文字列のスクショを用いましたが、普通に画像に含まれる文字列をScreenpressoでスクショを撮ってやってみましょう。

先ほどの記事のトップ画の画像を使ってみましょう。




(認識された文字列)
最近 知っ た 言葉 た ち を
淡々 と 挙げ つつ 説明 し て みる


やはり余計なスペースが生じてしまいますが、文字認識としてはパーフェクトですね。
今のところ日本語と英語が混在すると難しかったりと、まだまだ改良の余地がありそうな感じではありますね。





実は、さらにテキスト認識した文字列を翻訳すらできます。
ただし、翻訳エンジンは、Google翻訳なのでたかが知れていますが、それでも

スクショ→OCRによるテキスト認識→翻訳

が、全て1つのフローの中でできるというのは、割と使い勝手が良いような気がしませんか?
例えば、海外製のソフトウェアを使っていて、英語とかでよくわからんみたいな時に、スクショしてOCR→翻訳ってすぐできるので、いちいちブラウザにコピペして翻訳とかの手間が全くかからないって素晴らしいとしか言いようがありません。

というわけで、まずは日本語→英語で。
スクショを撮って、OCR。

2022072005.png


そして、翻訳。

2022072006.png


結果としては、まあまあではないでしょうか?

I will explain the words I recently learned while giving them a simple explanation.



では、次に英語→日本語で。
スクショを撮って、OCR。
NY Timesの見出しから

2022072007.png



認識も英語だとほぼ完璧ですね。

Britain Hits Heat Record, on
lts Second Day of
Extraordinary Temperatures


そして、日本語に翻訳。

英国がヒートレコードを打つ
lts2日目
異常な温度


まあまあ…な出来ですよね?まあ、Google翻訳のエンジンなので、そこそこレベルですが、大意を掴むぐらいだったら十分かなと。満足しないなら、OCRからのDeepLに投げるのもありだしね。
画像からテキストをいとも簡単に取り出せるようになっただけでも、自分として十分なのです。




 eyeglass2.png 情報管理LOGの眼
 画像からのテキスト認識の敷居が下がりまくり

ここ1、2年のOCRの進歩は凄まじく、私自身追いかけるのが大変なぐらいに日進月歩で様変わりしています。先日は、ChromeでGoogleレンズが普通に使えるようなったり、スマホではOCRできるのがOSレベルでできるのが当たり前ぐらいになったりとか(iOS16では、いよいよ写真での日本語の文字認識ができるようになります)、画像だからテキストを抜き出すことが難しいというのは、今や昔となりつつあります。
高度に発達した科学技術は、魔法と見分けがつかないというやつですね。





緑の歌 - 収集群風 - 上 (ビームコミックス)
高 妍(著)

5つ星のうち4.5
772円


関連記事

コメント0件

コメントはまだありません