Google Meetが音声同時通訳に対応 話者の声に似た音声でほぼリアルタイム翻訳が可能に:ただし、直訳なので「面白い誤解」を招く可能性はある
Googleは、「Google Meet」にリアルタイム音声翻訳機能を追加した。まずはイタリア語、ポルトガル語、ドイツ語、フランス語に対応する。
Googleは2025年9月11日(米国時間)、オンライン会議サービス「Google Meet」において、音声を即時に翻訳する「Speech Translation」機能を追加したと発表した。この機能を使えば、話した内容を即座に翻訳し、「話者の声に似た音声」で相手に伝えることができる。同社の研究部門をはじめ、DeepMindなど複数のチームが連携して開発した。
翻訳特化型AIで遅延を2〜3秒に短縮
従来の音声の翻訳機能は「音声を文字に変換し、文字を翻訳し、その文字を合成音声に変換」という段階的な処理を必要とし、10〜20秒の遅延が発生していた。「これでは自然な会話は困難であり、翻訳音声も無機質で発話者の特徴を失っていた」とGoogleは説明。同社は翻訳に特化した言語モデルを使うことでこの課題を解決し、入力音声の処理を2〜3秒で可能にしたという。
対応言語は2025年9月時点でイタリア語、ポルトガル語、ドイツ語、フランス語の4か国語。ただし、現時点では直訳的な表現にとどまるため、「面白い誤解を招く可能性がある」と指摘している。今後は大規模言語モデル(LLM)の導入によって、文脈や皮肉を含む表現の解釈精度が向上する見込みだ。
このニュースのポイント
Q: Googleが「Google Meet」に追加した新機能は?
A: リアルタイム音声翻訳機能「Speech Translation」で、話者の声に似た音声で翻訳内容を出力できる。リリース時点ではイタリア語、ポルトガル語、ドイツ語、フランス語に対応。
Q: 従来の翻訳機能の課題は何だったか?
A: 音声を文字化、翻訳、合成音声、と段階処理が必要で10〜20秒の遅延が発生し、不自然で無機質な翻訳音声になっていた。
Q: 新機能によって改善された点は?
A: 入力音声を即時処理できるため、2〜3秒で翻訳音声を生成し、声質も話者に近い自然なものになる。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
開発現場で実際に使われているAIモデルや言語は何か New Relicがレポートを公開
New Relicは2025年8月21日にAI開発者の動向レポートを公開した。8万5000アカウントのデータを分析し、開発現場で利用されている技術の動向やAIモデルの採用状況について示している。SQLは「もはや専門職だけのものではない」 paizaがSQLスキルの可視化機能を提供開始
paizaは、SQLスキルを客観的に測定できる新機能「SQLスキルチェック(β版)」をリリースした。入門から熟練まで5段階でレベル判定できる。ITエンジニアに加え、幅広いビジネスパーソンのデータ活用力向上を支援するとしている。GitHub、「GitHub Copilot」の活用方法や組織への展開方法を学べるコースを無料公開
GitHubは、GitHub Copilotの活用方法や組織への展開方法を学べるコンテンツを無料公開した。組織のリーダーが抱きがちな疑問を理解する手助けになるとしている。