テキストを介さない翻訳技術の開発にGoogleが注力

【出典】2019/05/16

https://techcrunch.com/2019/05/15/googles-translatotron-converts-one-spoken-language-to-another-no-text-involved/

image50

Douglas Adamasの小説で登場した万能翻訳機バベルフィッシュの誕生もそう遠くないのかもしれない。Googleの新プロジェクトは従来の翻訳技術とは異なりテキストを用いず、音だけで翻訳を機能させようと試みる。開発が上手くいけば翻訳速度の向上、話者の抑揚やトーンの反映が容易となる。

プロジェクト名はTranslatotron。非常に実験的な内容であり、ここ数年で行われた関連研究の集大成と位置付けられている。Googleの研究者達は、長年に渡って言語の違った人同士の対話について研究を続けてきたが、つい最近になって努力が結果として現れ始めた。

通常、音声翻訳は音声を幾つもの要素に分解することで行われる。元になる音声をテキスト化し(STT)、そこから機械翻訳で別の言語のテキストへと変換する。そして、別言語へと変換されたテキストを音声データに戻す(TTS)というのが一連の流れである。非常に上手く機能はするが完璧ではなく、ステップ毎に起きやすいエラーが存在しているため複雑性が高まっていく。

マルチリンガルが証言している通り、彼/彼女らの頭の中の実態は分かっていない。どのように機能するかは不明瞭であるが、テキストを分解し別言語への変換を視覚化したと言う人はいないだろう。

人間の認識が、機械学習のアルゴリズム改善の補助線になる事例は多い。

正確性に関しては、今までのシステムよりも劣ることは研究者も認めている事実である。しかしながら、翻訳結果の多くは(少なくとも部分的には)とても優れており、話者の表現が含められる点はあまりにも恩恵として大きすぎるため看過できない。最後に研究チームは、今回の研究をあらゆるアプローチの可能性を検証するスタート地点と控えめに形容しているが、重要な領域の大きな一歩になるという見方で間違いないだろう。