ScreenpressoのアップデートでOCRによる文字認識が簡単になったよ

情報管理LOGの@yoshinonです。
Screenpresso使ってますか?
画像注釈を1日1回以上するような方だったら、ぜひとも導入すべきソフトです。非常に優秀な画像注釈ソフトなのですが、そのScreenpressoがアップデートでOCRによる文字認識が超優秀になり、使えるレベルになりました。今までは、単に優秀な画像注釈ソフトでしたが、これからは「画像からテキストを抜き出したいな」という時にも手間を掛けずに、サクッと使えますので非常に楽になりそうです。
というわけで、今回はScreenpressoのOCRによる文字認識について書いていきます。
【 ScreenpressoのアップデートでOCRによる文字認識が簡単になったよ 】 1.アップデートによってライセンスが 2.ScreenpressoのOCRを試してみる 3.翻訳もできる |
前回の記事でも触れましたが、Screenpressoのアップデートでなんと一種のサブスクのようになってしまいました。
Screenpressoの新バージョンでサブスク化した
情報管理LOGの@yoshinonです。Screenpressoが、4月ぐらいから頻繁にアップデートを促すようになりました。自分には、関係の無いアップデートだと無視し続けていたのですが、どうやらそういうわけではなかったようです。今回は、超優秀な画像注釈ソフトであるScreenpressoの新バージョンについて書いていきます。たぶん、悲報だと思います。 【 Screenpressoの新バージョンでサブスク化した 】 1.アップデートが促され...
まあ、1年毎に2000円ぐらいなら自分の活用状況としては全然ありだし、もし嫌ならサポートは受けられなくなるけど、ソフト自体は使い続けることが可能だしと割り切りました。
私のようにブログを毎日書くとか、画像注釈を頻繁にするというひとならば、圧倒的におすすめできるソフトですが、そうではない人にとっては、まあ強引にお勧めはしません。
と、前回の記事をこんな感じで締め括って終わりにしようと思っていたですよ。
しかし、しかしですよ!
画像のOCRが、できるようなったというならば、少し話は変わってきます。実は、以前からScreenpressoでOCRはできていました。しかし、全く使い物にならないがらくたレベルのどうしようもない感じの出来のOCRだったので、あえて情報管理LOGでは触れずにきていました。ところが、実際に使ってみたら、以前とは比較にならないぐらいに使い勝手が向上していたのです。
というわけで、以下でその点について書いていきます。
Screenpressoの価格設定で、OCRについて書いてありました。

ほぉ、これは興味深い。
実は、Screenpressoの新バージョンの方に切り替えたのも、このOCR機能が充実したからというのも理由の一つだったりします。
というわけで、さっそくやってみることに。
情報管理LOGの文章をそのままScreenpressoでスクショを撮って、OCRをかけます。
こちらの記事ですね。
最近知った言葉たちを淡々と挙げつつ説明してみる
情報管理LOGの@yoshinonです。先日、「分からない言葉はScrapboxに入れると良いよ」という記事を書きました。実は、数年前からずっと続けていた習慣だったのですが、思いのほか刺さった方がいたようでした。Scrapboxの使い方としては、まあ標準的な使い方だと思うのですが、本人が当たり前と思っていることが、他の人にとって新しい何かのきっかけになることって私も多々あるので書いた私も嬉しかったですさて今回は、そんなScrapb...

「テキスト認識」でできます。

さて、結果はいかに!
こちらが、OCRされたテキストです。
人 間 は 、 3 つの 点 を 見 る と それ を 顔 と し て 』 認識し て し まい が ち に な っ て し まう 現象 を 「 シ ミュ ラク ラ 現 象 」 と いう の で す 。
この 現象 に つい て の 理解 は し て いた の で 、 子 ども が 生ま れ て 間 も な い 頃 に 3 つの 点 を 書い た 絵 を 見 せ た ら どん な 反応 を する
の か や っ て みた ら 、 本 当 に 顔 だ と 思っ た よう で 、 ニ コー ニコ し た り 手 で 触 ろ うと し た りす る な どの 反応 が 見 られ まし た 。 ぜ
ひ 、 赤 ちゃ ん の いる 宗 庭 は 、 試 し て みて 欲し いと 思い ます 。
※赤は、誤字または誤認識。青は、失われた文字列。
まあまあなテキスト認識ではないでしょうか?
残念な部分があるとしたら、文字と文字の間にスペースが入りがちなところですね。
先ほどのは、実際の文字列のスクショを用いましたが、普通に画像に含まれる文字列をScreenpressoでスクショを撮ってやってみましょう。
先ほどの記事のトップ画の画像を使ってみましょう。

(認識された文字列)
最近 知っ た 言葉 た ち を
淡々 と 挙げ つつ 説明 し て みる
やはり余計なスペースが生じてしまいますが、文字認識としてはパーフェクトですね。
今のところ日本語と英語が混在すると難しかったりと、まだまだ改良の余地がありそうな感じではありますね。
実は、さらにテキスト認識した文字列を翻訳すらできます。
ただし、翻訳エンジンは、Google翻訳なのでたかが知れていますが、それでも
スクショ→OCRによるテキスト認識→翻訳
が、全て1つのフローの中でできるというのは、割と使い勝手が良いような気がしませんか?
例えば、海外製のソフトウェアを使っていて、英語とかでよくわからんみたいな時に、スクショしてOCR→翻訳ってすぐできるので、いちいちブラウザにコピペして翻訳とかの手間が全くかからないって素晴らしいとしか言いようがありません。
というわけで、まずは日本語→英語で。
スクショを撮って、OCR。

そして、翻訳。

結果としては、まあまあではないでしょうか?
I will explain the words I recently learned while giving them a simple explanation.
では、次に英語→日本語で。
スクショを撮って、OCR。
NY Timesの見出しから

認識も英語だとほぼ完璧ですね。
Britain Hits Heat Record, on
lts Second Day of
Extraordinary Temperatures
そして、日本語に翻訳。
英国がヒートレコードを打つ
lts2日目
異常な温度
まあまあ…な出来ですよね?まあ、Google翻訳のエンジンなので、そこそこレベルですが、大意を掴むぐらいだったら十分かなと。満足しないなら、OCRからのDeepLに投げるのもありだしね。
画像からテキストをいとも簡単に取り出せるようになっただけでも、自分として十分なのです。

画像からのテキスト認識の敷居が下がりまくり
ここ1、2年のOCRの進歩は凄まじく、私自身追いかけるのが大変なぐらいに日進月歩で様変わりしています。先日は、ChromeでGoogleレンズが普通に使えるようなったり、スマホではOCRできるのがOSレベルでできるのが当たり前ぐらいになったりとか(iOS16では、いよいよ写真での日本語の文字認識ができるようになります)、画像だからテキストを抜き出すことが難しいというのは、今や昔となりつつあります。
高度に発達した科学技術は、魔法と見分けがつかないというやつですね。
- 関連記事
-
- 今さらながらClaunchを使い始めた
- ScreenpressoのアップデートでOCRによる文字認識が簡単になったよ
- Screenpressoの新バージョンでサブスク化した