検索
ニュース

Google Meetが音声同時通訳に対応 話者の声に似た音声でほぼリアルタイム翻訳が可能にただし、直訳なので「面白い誤解」を招く可能性はある

Googleは、「Google Meet」にリアルタイム音声翻訳機能を追加した。まずはイタリア語、ポルトガル語、ドイツ語、フランス語に対応する。

Share
Tweet
LINE
Hatena

 Googleは2025年9月11日(米国時間)、オンライン会議サービス「Google Meet」において、音声を即時に翻訳する「Speech Translation」機能を追加したと発表した。この機能を使えば、話した内容を即座に翻訳し、「話者の声に似た音声」で相手に伝えることができる。同社の研究部門をはじめ、DeepMindなど複数のチームが連携して開発した。

翻訳特化型AIで遅延を2〜3秒に短縮

 従来の音声の翻訳機能は「音声を文字に変換し、文字を翻訳し、その文字を合成音声に変換」という段階的な処理を必要とし、10〜20秒の遅延が発生していた。「これでは自然な会話は困難であり、翻訳音声も無機質で発話者の特徴を失っていた」とGoogleは説明。同社は翻訳に特化した言語モデルを使うことでこの課題を解決し、入力音声の処理を2〜3秒で可能にしたという。

 対応言語は2025年9月時点でイタリア語、ポルトガル語、ドイツ語、フランス語の4か国語。ただし、現時点では直訳的な表現にとどまるため、「面白い誤解を招く可能性がある」と指摘している。今後は大規模言語モデル(LLM)の導入によって、文脈や皮肉を含む表現の解釈精度が向上する見込みだ。

このニュースのポイント

Q: Googleが「Google Meet」に追加した新機能は?

A: リアルタイム音声翻訳機能「Speech Translation」で、話者の声に似た音声で翻訳内容を出力できる。リリース時点ではイタリア語、ポルトガル語、ドイツ語、フランス語に対応。

Q: 従来の翻訳機能の課題は何だったか?

A: 音声を文字化、翻訳、合成音声、と段階処理が必要で10〜20秒の遅延が発生し、不自然で無機質な翻訳音声になっていた。

Q: 新機能によって改善された点は?

A: 入力音声を即時処理できるため、2〜3秒で翻訳音声を生成し、声質も話者に近い自然なものになる。

Copyright © ITmedia, Inc. All Rights Reserved.