こんにちは、中途失聴の英語学習者Ashley(アシュリー)です。
このブログの方針などはこちらをご覧ください。
今回の記事は聴覚障害支援ツールのご紹介です。
Androidの音声文字変換
このブログでも時々ご紹介していますが、
私は聴者との会話では主にAndroidタブレットの音声文字変換サービスを使っています。
マイク感度はスマホよりもタブレットの方が広範囲に拾えるので、
屋外での使用、複数人との会話、話者と距離のある会場で声を拾いたい、
などの想定で使いたい場合はタブレットをお勧めします。
この機能(※新しい端末で使用する場合はアプリとしてダウンロードする必要がある場合もあります)では
・文字への変換がかなり早い(他の聴覚支援アプリとは一線を画す速さ)
・変換画面を開いたらすぐに変換が始まる
・多言語に対応している(日本語も対応。英語では英米豪印の4つの選択肢あり)
・システムの改善が早い(Googleが共同開発)
・声だけでなく、環境音も幅広く教えてくれる(犬の声、電子音、群衆音、など)
・オフラインでも使用できる※言語ダウンロードなど少し設定が必要
・一回変換画面を立ち上げると、自分で停止操作をするまで、ずっと音を拾い続けてくれる。(聴者には伝わりにくいメリットですが、
これも他の聴覚障害向けアプリとは一線を画す便利機能)
このような使いやすさがあります。
誤変換が多かったり、話者の癖次第では声として認識されにくいなど
精度面では完全ではないのですが、
聴者の会話スピードについていきたい場合、
この音声文字変換並みの文字化速度がないとかなり難しいです。
実際にこの機能を使っている人のレビューを検索すると、
聴覚障害当事者以外でも、国際会議などで英語リスニングの補助として内容理解に使っているという聴者の意見がちらほらありました。
※話者が英語ネイティブの場合は「英米豪印」の中から話者の言葉に近いものを選択した方が誤変換が少ないです(特にカジュアルな会話では)。非ネイティブの英語はイギリス英語orアメリカ英語どちらかにしておくと拾いやすいです。(変換精度は英米どちらでも同じくらい)
※雑踏の中ではほとんど文字化できない等、条件によって使いにくくなる場面もあります。
AppleのLive Captions
Apple製品も、バリアフリー機能の進化が素晴らしいです。
聴覚障害に限らず、さまざまな障碍に対応する機能が進化しています。
(リンク)
Appleからは、アプリではなく機能の一部として
”Live Captions”という文字化サポートがあります。
※2025年4月23日現在、英語のみの対応機能です。
(使う時は端末の言語設定も英語にする必要あり)「setting 」>「accessibility」>「live captions」から簡単に設定できます。
今は英語しかないですが、Live Captionsがとても優秀なので
Appleに「ぜひ日本語も対応してほしい」とリクエストを送りました(笑)
私は電話できないのでiPhoneフィードバックからリクエストを送っています。
(多言語自動翻訳を使ってるとは思いますが、念のため英語で)
電話の場合、アクセシビリティお問い合わせは英語か北京語のみの対応みたいです。
※Andoroidの音声文字変換も、問い合わせ窓口はGoogleのディスアビリティ・サポートチームなのですが、日本語や日本時間では対応していないです。(Googleはアメリカ手話には対応しています。)
Live Captionsの凄いところは
・文字化がかなり早い(Android音声変換と同等以上)
・周辺の声を拾うだけではなく、アプリの音声も文字化できる
※字幕対応していない動画を消音字幕で見たい聴者も使えそう
※「電話」「FaceTime」も文字化
・文字変換を開始すると、しばらくは何も操作しなくても声を拾い続けてくれる。
(※音→文字化サービスの持続時間はAndroidの方が長いです)
・非ネイティブの訛りデータを大量学習しているため、ネイティブ以外の英語も高精度に変換しやすい
・iPhoneでも変換のクオリティが高い(Androidスマホではタブレットよりも変換クオリティが物足りない感じ)
こういう感じで、かなり使いやすいです。
Live Captionsの気になるポイントとしては
・英語以外の言語に対応していない
・アプリ音と周辺の声を同時に文字化できない
・声以外の環境音を知らせる機能はない
・文字化画面をスクリーンショットできない(?)
この記事の説明用にスクリーンショットを撮りたかったのですが、なぜか文字化画面は消えるみたい?
・ネイティブ音声(イギリス大手メディアのpodcastであっても)の誤変換がAndroidよりやや目立つ
※「誤変換がありえそう」な部分はAppleの場合、下線が引かれます。
(アンドロイドの文字変換や他の聴覚アプリではこの表示なし)
なんでLive Captionsの変換速度はとても速いのか?
ChatGPTに聞いてみたら、
「一般的な”音声→文字”変換システムは、稼働しているAIがクラウドにあるので、
”端末で音声を拾う→クラウドでシステム処理→端末に文字化データを送る”というタイムラグが発生する。AppleのLive Captionsの場合、端末の中のAIが処理しているのでクラウド経由よりも処理が速い」
とのことでした。
同じ理由で
「Androidの音声変換も
『オフライン音声認識』に設定されると端末内で処理されるから早い」
そうです。
※Androidの音声変換をオンライン認識で使用すると
(速度は少し落ちるけど)精度は向上するみたいです。
(邪道)機械はどれくらい日本人英語を読み取れるのか?
まじめな英語学習者から怒られそうな試みですが、
Android文字変換にしても、AppleのLive Captionsにしても、
そのほか最近たくさん出てきている発音訓練アプリにしても、
日本語訛りの強い英語でもかなり文字化されます。
特にLive Captionsは訛り英語のカバー力が強く、
陽気な家族がコテッコテの日本訛り英語で試したところ、
・リンキング皆無でも文章が文字化される
・~ingを「~イング」と日本流発音しても文字化される
・ローマ字読み状態でも英語になる単語が多い
・LとRを完全に日本語の「ら行」で発音しても、意図した単語に変換されるものが多い
etc…
と、日本人の発音ハードルを下げてくれそうです。
非ネイティブ同士で会話しないといけない場面(商談とか学会とか)でも役立ちそう。
一方、
日本語発音のままでは変換されない・されにくいのは
【running】
・・・「ランニング」「ラーニング」ではlearningに変換される。
(AI蓄積データが、文脈上learningでありえる文が多いという理由もあるそうです)
これは「R」を頑張るしかない。
【right】
・・・lightやwhiteに変換されやすい。これも「R」を頑張るしかない
などなど、
発音を意識しないと変換されない単語もあります。
コメント