翻訳バンクとは
データ提供を検討されている方へ
国立研究開発法人情報通信研究機構(NICT)では長年、音声認識・音声合成・自動翻訳技術の研究開発を推進し、その成果を社会に提供しています。
言葉の壁のない世界の実現を目指して総務省が発表したグローバルコミュニケーション計画においてもNICTは産学官連携の中核研究機関として研究開発を推進しています。
その一環として2017年9月に総務省とNICTは自動翻訳の高精度化に必要なデータを集積するために「翻訳バンク」を立ち上げました。
中央官庁、地方自治体、企業、各種団体など日本の多くの組織から「翻訳バンク」にデータをご提供いただき、それらのデータを自動翻訳の高精度化に活用しています。高精度化された自動翻訳エンジンは、多くのハードウェアやサービスに搭載され、日常生活や仕事で活用されています。
人工知能のコアテクノロジーである深層学習を用いた自動翻訳(ニューラル翻訳、NMTと呼ぶ)は従来技術が越えられなかった翻訳精度の天井を一気に突き破りました。
NICTは、翻訳バンクに提供された大量の翻訳データ(原文と訳文がペアとなったデータ)をサーバに格納し、大量のGPGPUで最先端の深層学習を実施し、自動翻訳の高精度化を推進しています。
高精度化した自動翻訳は、人手翻訳を効率化し、翻訳時間を短縮し、その波及効果で、翻訳量を増やします。その結果、翻訳データの蓄積も加速されます。言い換えると、社会全体で高精度自動翻訳を活用しながら、超・高精度自動翻訳を育てていくというエコシステムが誕生したことになります。様々な分野の翻訳データを翻訳バンクに集積することで、日本は『世界で最も多言語コミュニケーションが容易な国』になります。ひいては、翻訳バンクは日本の社会・経済の活性化にも貢献します。