Mountain Lionの音声入力は英語学習に使えるのではないか

広告

Mac OS X Mountain Lionをインストールしてみて、あんまり変わらなくてつまんないなーと思ってあれこれしていますが、音声入力は意外と使えるかも知れません。特に英語学習で。

まずスティーブ・ジョブス スタンフォード大学卒業式辞の動画を見てみます。

比較的明瞭な発音で聞き取りやすいスピーチだと思いますが、英語が苦手な人だと何を言っているかわからない部分もあるでしょう。このスピーチは有名だからtranscriptもあるけど、Mountain Lionの音声入力のテストをしてみます。

スクリーンショット 2012 07 25 23 58 07

音声入力の設定で言語をアメリカ英語にします。そして動画を再生しながら音声入力を開始すると

I’m honored to be a candidate for your commencement from one of finest university world truth be told I never graduated from college and this is the closest I’ve ever gone to college graduation today I wanted tell you three stories from my life that’s it

時間制限が来たから途中で途切れているけど、なかなか見事な認識率だと思います。一部おかしいところはあるけど。たとえば I wanted tell you は wanted to じゃないとおかしい。

続いてオバマ大統領の勝利演説

Hello Chicago if there’re is anyone out there who still doubts that America is the players were all things are possible

Mountain Lionの音声入力は「わー」とか「きゃー」とかの声援は一切無視してちゃんと人の会話だけを正しく聞き取ってくれることがわかりました。これはすごい。

アメリカ英語以外はどうか

日本語モードに切り替えて日本のニュース番組から何か入力してみると(プロのアナウンサーだから滑舌はいいはず)「長谷川幸市→ショタ原子炉少々疲れ様です。日本人女性がいます」なにこれ?もう一度「大規模複合趣味が大好きですや国民が今どんな思い出を話すなっとういちにおいているでしょうか原子炉少々疲れ様で見つめる日本人女性がいます」。ちょっといまいちな結果。「アナウンサーの発音でこの程度しか聞き取れないのだから普通の人がしゃべったら悲しくいいんじゃないかな」←おいらの発音

次にアメリカ英語モードでTopGearから入力してみると

A stripper Filmation’s short target to celebrate fizzles most milestone but unfortunately the chances of talking to something is nothing to celebrate Kozbial was a miserable disaster and everything they have a baseball rubbish

かなりぶっ壊れています。イギリス英語に切り替えて同じパートをやると

Formers obviously thought it would be a brilliant idea to celebrate his automotive milestone but unfortunately the producers of top gear server was nothing to celebrate Kozbial was a miserable disaster and everything lemonade Walt rubbish

だいぶ認識率が改善しますが、まだ変な部分はあります。ジェレミーの発音がぶっ壊れているのかも知れないけど。

ともあれ、アメリカ英語モードではネイティブスピーカーであるイギリス人の発音ですらかなり怪しいので、日本人の発音できちんと入力できたら誇ってよいと思います。

英語のリスニングに活用する

英語のリスニングを鍛えるにはディクテーションがよいと言われています。つまり誰かのスピーチを聞きながら、なんと言っているか一語一語きちんと書き起こす訓練をします。つづいて音読をすることが重要です。最終的にそのスピーチと同じスピードで音読できるようになれば、そのスピーチの言っていることは明瞭に聞き取れるようになっているはずで、そうした練習の積み重ねをするとヒアリング能力が上がるというわけです。

で、原稿があるような有名スピーチならばいいけれど、そうでないものはどうしたらいいか。普通ならば何度も何度も聞いて理解するしかないけど、何度聞いても何を言っているかわからない部分はどうしてもあります。そのときに、これだけの認識精度があるMountain Lionの音声認識ならば結構使えるのではないかな、と思った次第です。