音声認識から字幕表示まで約1秒――AbemaTV、AIによるリアルタイム字幕をニュース番組に試験導入:Googleが提供する音声認識テキスト変換APIを活用
AbemaTVは昼のニュース番組「けやきヒルズ」で、AI(人工知能)によるリアルタイム字幕システム「AI(あい)ポン」を試験的に導入する。このシステムは、AbemaTVとテレビ朝日が共同開発した。
AbemaTVは2018年12月10日、同社が運営する無料インターネットテレビ局「AbemaTV」の昼のニュース番組「けやきヒルズ」で、AI(人工知能)によるリアルタイム字幕を試験的に導入すると発表した。
けやきヒルズは、独自中継を交えて12〜13時の1時間でその日のニュースを網羅的に放送する番組。AbemaTVによると、番組の主な視聴者は「ランチをしながらスマホでニュースをキャッチアップしたい」ユーザーで、音声をオフにして視聴している視聴者が多いという。そうした視聴者でも、出演者のトークや会見の生中継などを楽しめるように、AIを使ってリアルタイムで字幕を入れられるようにした。
このリアルタイムAI字幕システム「AI(あい)ポン」は、Googleが提供する音声認識テキスト変換サービス「Cloud Speech-To-Text API」とLASSICが開発した「LASSIC Speech Recognition」を活用し、AbemaTVとテレビ朝日が共同開発した。出演者の音声を認識し、自動的にニュース放送に適切な文章に変換した上で表示する。音声認識から字幕の表示までにかかる時間は約1秒。現在テレビ局などに導入されているリアルタイム字幕システムに比べて、字幕を表示するまでにかかる時間を大幅に短縮した。
AbemaTVでは、まずは試験的に導入し、最新の機械学習アルゴリズムを利用して、日々の放送を通して固有名詞などを学習させ、音声認識精度を向上させるとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
あなたのAI活用成熟度はどれぐらい? 企業がAI活用の前に知っておくべきこととは
日本マイクロソフトは、2018年11月5〜7日の3日間、「Microsoft Tech Summit 2018」を開催した。Microsoft エンタープライズCTOが話す、企業がAIを活用する方法とは。GoogleがAI HubとKubeflow Pipelinesを発表、機械学習専門家の知見を再利用
Googleは2018年11月8日(米国時間)、機械学習のパイプラインを容易に構築できるツール「Kubeflow Pipelines」と、機械学習のためのツールやデータのカタログとも呼べる「AI Hub」を発表した。AIで校閲・校正作業を自動化 ディープラーニングで助詞や漢字変換の誤りも検出――みずほ銀行と凸版印刷が共同実証
みずほ銀行と凸版印刷は、AIを活用した校閲・校正システムで、みずほ銀行の広告制作物の校閲・校正業務を自動化する共同実証を開始。校閲・校正の精度向上と業務負荷軽減を目指す。