Windowsでも自動文字起こしができる!議事録はGoogleドキュメントに任せろ

情報管理LOGの@yoshinonです。
ここ最近は、「自動化」「音声入力」といったキーワードが、賑わっていますね。情報管理LOGでも、かなりこれについては激推ししています。さて今回は、文字起こしの自動化についてやってみたいと思います。文字起こしの自動化については、Macが先行していてWindowsの情報があまり見られなかったので、今回はWindowsについて深く掘り下げてみたいと思います。文字起こしの自動化が出来るようになると、議事録の作成などがほぼ自動化できるので、今まで苦痛だった仕事がとても楽になりますよ。
※追記:Virtualが、Visualになっていましたので、修正しました…(恥ずかしい)。
【 Windowsでも自動文字起こしができる!議事録はGoogleドキュメントに任せろ 】 1.Macでの自動文字起こしの事例 2.物理的な解決方法 3.Virtual Audio Cableで音声の出力と入力をソフトウェア的につなぐ 4.Googleドキュメントで自動文字起こしを実現する |
ここ最近の自動文字起こし界隈(?)では、Mac勢がかなり優勢で盛り上がりを見せています。ここ最近の記事をいくつかご紹介します。
「神なの?」文字起こしが自動になる未来がやってきたとライター界隈が騒然 | 男子ハック
SoundFlowerとGoogle Docsで自動文字起こし機 - walkingmask’s development log
21世紀の文字起こし - the code to rock
なるほど、こりゃすごい。
感動しすぎてインスタのストーリーに投下しちゃったんだけど、音源入力と出力をsoundflowerにして、Googleの音声認識と連動させると勝手に文字起こししてくれるんだ…これマジで「寝てる間に小人さんが仕事してくれる」未来やってきたぞ… pic.twitter.com/1goVh08ATK
— 大矢幸世 / OYA Sachiyo (@saci_happiness) 2018年2月12日
SoundFlowerって何だ??と思ったら、どうやら音声の出力と入力をソフトウェア的に接続できるMac用ソフトのようです。
Soundflower for Mac - ダウンロード
これを、Googleドキュメントの音声入力で認識させて、自動で文字起こしを実現するという流れのようです。
でもこれ、どれもMacの情報なんだよな…。
というわけで、Windowsユーザーの皆さん!
Windowsでもやれるってことを証明しようじゃありませんか!
やり方は、2つあります。
1つ目は、泥臭い方法です。物理的に出力と入力をケーブルでつないでしまう方法です。この図は、Macの先ほど取り上げたSoundFlowerによる解説画像ですが、やることは同じです。
これは、なるほど!と思わざるを得ない。
— yoshinon@情報管理LOG (@yoshinon) 2018年2月14日
“SoundFlower” https://t.co/qrmxJ3BeF1 pic.twitter.com/QHT1mEgfPS
イヤフォンの端子とマイク端子を物理的につなげば、できるのではないか?
というわけです。
議事録ならば、ICレコーダーなどで録音していたりするので、それをPCのマイク端子につなげば、理論上は上手くいきそうですよね。
とはいえ、自動化上等!と思っている身としては、そういう泥臭いやり方はあまり好きではありません。MacにおけるSoundFlowerのようなソフトウェア的な解決方法で実現したいと思います。
ちなみに、Windowsにはこの手のソフトは、案外たくさんあるんですよね。
むしろ、Macより多いような気がします。
今回紹介するのは、「Virtual Audio Cable」というソフトです。
これは、まさにソフトウェア的に音声の出力と入力をつなぐことができるソフトなのです。まあ、これを使えば、色々ごにょごにょもできるのですが…今回は、文字起こしの自動化なので、皆さんも色々このソフトの可能性を試してもらいたいと思います。
まずは、ここからダウンロードします。
VB-Audio Virtual Apps
ここからダウンロードしましょう。

ダウンロードしたzipを解凍します。
お使いのPCが、64ビットならば「VBCABLE_Setup_x64.exe」を、そうでなければ「VBCABLE_Setup.exe」を管理者権限で実行しましょう。

「Install Driver」をクリック。

迷わずOK。

インストールします。

はい!できました。

インストールが完了したら、次に音声の出力と入力をつなぐ作業をします。
タスクバーのボリュームアイコンを右クリックし、「再生デバイス」をクリック。

その一覧の中に「CABLE Input」というのが、あるでしょうか?

CABLE Inputを右クリックして、「規定のデバイスとして設定」します。
※「規定の通信デバイスとして設定」ではなく、「規定のデバイスとして設定」でした。修正しました。

次に「録音」タブをクリックします。

これも、同様に「CABLE Output」を「規定のデバイスとして設定」します。
※「規定の通信デバイスとして設定」ではなく、「規定のデバイスとして設定」でした。修正しました。

これで、ソフトウェア的に出力と入力をケーブルでつないだことになりました。
では、Googleドキュメントで自動文字起こしをやっていきます。
すでに様々のところで話題に上がっているので知ってる方も多いと思いますが、Googleドキュメントでは音声入力ができるのです。
なぜGoogleドキュメントで文字起こしをするのかというと、iPhoneでは60秒制限があるからです。アプリによっては60秒を超えて音声認識ができますが、それでも1時間以上にわたる文字起こしには向いてはいません。その点、Googleドキュメントだと音声入力を時間制限なしでできるのです。議事録だと、どうしても長時間にわたった録音になってしまうので、Googleドキュメントの方が向いているのです。
では、やってみましょう。
さすがに、仕事上の議事録をこの場で見せるわけにはいかないので、YouTubeの動画を使ってやってみます。
使うのは、この動画です。
佐々木正悟氏による「のきばトーク」という面白い対談動画です。
この動画とGoogleドキュメントを横に並べておきます。今回は、説明画像なので動画もGoogleドキュメントも小さめですが、実際は画面の半分半分ぐらいで良いですね。ちなみに、音声の鳴るものであったら、VLC PlayerでもGOM PlayerでもWMPでもなんでもいけます。

Googleドキュメントでは、
ツール→音声入力
で音声入力ができるようになります。

まずは動画を再生して、すぐさまGoogleドキュメントのマイクのアイコンをクリックします。そうすると、すぐさま音声入力が始まります。こんな感じで、どんどん音声入力されていきます。まあところどころ誤字などもありますが、おおむね合ってますよね。

ここまでできるならば、もはや文字起こしという作業はほとんど簡略化できるのではないか?と思えますね。さらに、こういうソフトを組み合わせると、かなりの部分が、さらに自動化できるのではないかと思いますよ。
このソフトは、誤字・脱字や表記ゆれなどを自動で校正作業してくれるのです。
人間は、最後のチェックのみでよくなりますね。

退屈な作業をさらば!
私は、文字起こしという作業はかなり苦痛です。しかし、どうしてもやらなくてはいけない時というのもあるので、しかたがなくやっていましたが、これでほぼ自動化できそうな見通しが立ってきました。
それと、今回やってみて、これは耳が不自由な方にも有効なツールだと思いました。テレビなどをこれで流しておいて、自動で字幕が生成されるみたいな使い方としてできそうですよね?
少なくとも未来は、少しずつ良くなってきています。
- 関連記事
-
- Google画像検索に「画像を表示」ボタンを復活させる方法
- Windowsでも自動文字起こしができる!議事録はGoogleドキュメントに任せろ
- YouTubeの収益化条件が厳しくなったことについて