TOP > Webサービス > title - 自動文字起こしもできる!Speechnotesがスゴイ!

ITやモバイル機器、iPhone、手帳や本など。
MENU

自動文字起こしもできる!Speechnotesがスゴイ!

2018040300.png


情報管理LOGの@yoshinonです。
このところ自動で文字起こしというのが、自分の中で流行っているのですが、一長一短それぞれあるのですよね。その中でも、2月に記事にした「Windowsでも自動文字起こしができる!議事録はGoogleドキュメントに任せろ」という記事が大きな反響があり驚きました。皆さんきっと同じ悩みを持っているのでしょうね。
今回は、前回のGoogleドキュメントを用いた文字起こしよりも、さらにもう少しワンランク上の自動化ができるぞ!というSpeechnotesについてご紹介します。


  
【 自動文字起こしもできる!Speechnotesがスゴイ! 】  

 1.Googleドキュメントによる自動文字起こしとは?

 2.Speechnotesの紹介

 3.実際に自動文字起こしをやってみる







checkmark.png 1.Googleドキュメントによる自動文字起こしとは?

2月に書いた「Windowsでも自動文字起こしができる!議事録はGoogleドキュメントに任せろ」という記事が、割とバズり、様々なところで取り上げていただきました。ありがたいことです。

Bookmarklet: instantly generate a Card for any web page. | Embedly

さて、この記事ではどういうことを書いていたのかというと、会議の議事録などの文字起こしって、ものすごくだるい仕事の一つですよね。それをある程度自動化できないか?ということで、Googleドキュメントの音声入力を用いて、文字起こしを自動化してみました。これが、想像以上にしっかりと文字起こしができて、実用レベルという。しかも、無料だという。Google様々ですね。

やり方の詳細に関しては、上記の記事を参照していただくとして、概要のみ説明しておきます。

まず、原理について。




このツィートで示されているように、音声の出力と入力をつなぎ、それをGoogleドキュメントの音声入力で認識させれば良いのでは?というのが、原理です。

で、WindowsPC上の音声の出力と入力をつなぐ方法としては、Virtual Audio Cableというフリーソフトを使います。

VB-Audio Virtual Apps
VB-Audio Virtual Apps





これにより、仮想的にPCの音声の出力と入力をつないでしまうのです。
ちなみに、MacだとSoundflowerというのが、良いらしいです。Macユーザーではないので、その点は聞かないでください。

Soundflower for Mac - ダウンロード
Soundflower for Mac - ダウンロード





1.音声の出力と入力を仮想的につなぐ
Virtual Audio CableでPC内で鳴る音の出力と入力を仮想的につないでしまいます。
※詳細なやり方は、上記記事を参照してください。











2.Googleドキュメントで音声入力をする
Googleドキュメントにアクセスして、

ツール→音声入力

で、音声入力ができるようにします。




そして、マイクアイコンをクリックすると、音声入力が始まります。




この動画を観ると、その威力の程が分かっていただけるかと思います。




checkmark.png 2.Speechnotesの紹介

Speechnotesというのは、Googleの音声認識APIを用いたフリーアプリ&Webサービスです。
オンライン版は、こちら。今回は、こちらを使います。

Speechnotes |ディクテーションメモ帳
Speechnotes |ディクテーションメモ帳





Android版は、こちらです。iPhone版は、ないでござる。

Speechnotes スピーチノート - 音声から文字へ - Google Play のアプリ
Speechnotes スピーチノート - 音声から文字へ - Google Play のアプリ





さて、Speechnotesにアクセスすると、非常にシンプルな外観に驚くはずです。
しかし、その実良くできたUIだなと思いました。簡単に画面の解説。

2018040301.png



ファイルのアップロード&ダウンロードが、分かりづらいので、説明用に画像を置いておきます。こんな感じ。
テキスト直接ダウンロードもできます。

2018040302.png



Speechnotesは、さらにGoogleドキュメントの音声入力ではできなかった改行などもできたりします。
これ、普通の音声入力でもかなり使えそうな気がしますね。

2018040303.png



checkmark.png 3.実際に自動文字起こしをやってみる

さて、では実際にSpeechnotesで自動文字起こしをやってみたいと思います。
今回も佐々木正悟氏と倉下忠憲氏が、YouTubeでやっているのきばトークをつかってやってみたいと思います。
今回利用させていただいたのは、こちらの動画です。




やってみると、こんな感じになりました。
スルスルとされているのが分かりますね。

https://gyazo.com/c48d5af9d26d2c38f9650a0573024e90


気のせいかGoogleドキュメントよりも変換精度が良いように感じるのですがいかがでしょうか?
とはいえ、基本的にはGoogleの音声認識APIを用いているので、ほぼ同じなハズなんですが、何らかのチューニングを施しているのかもしれませんね(改行とかできるし)。

とはいえ、Googleドキュメントでもそうでしたが、少し残念な点も無いわけではありません。

・音かぶりがあると認識しない
・ある程度したら音声認識が止まってしまうことがある


というわけで、完全な自動化とはいきませんが、それでもかつての面倒から開放されることを考えると、自動化万歳ですね。




 eyeglass2.png 情報管理LOGの眼
 こうやってどんどん自動化プロダクトできてほしい

Speechnotesは、Googleの音声認識APIをつかって独自の機能を盛り込んでいましたが、こうやってさらに様々な形で音声入力ができるプラットフォームが広がってくれると活用の幅が広がりますよね。
そして、自動文字起こしを始めとして、自動化がどんどん図られて欲しいなと思っています。




関連記事

Leave a reply






管理者にだけ表示を許可する

Trackbacks

trackbackURL:http://hokoxjouhou.blog105.fc2.com/tb.php/1144-972d2789
該当の記事は見つかりませんでした。
SEO
loading
情報管理LOG