推薦者の声

写真:喜連川優

喜連川 優

大学共同利用機関法人情報・システム研究機構
国立情報学研究所 所長
東京大学生産技術研究所 教授

ビッグデータの研究分野では良質なデータを多数集積することが重要であり、「データはAIの燃料」と例えられる。NICTが取り組んでいる翻訳バンクは自動翻訳精度向上の燃料である翻訳言語コーパスを集める取り組みであり、データ集積のデザインとして興味深い。

写真:田中 倫夫

田中 倫夫

アストラゼネカ株式会社 執行役員
サイエンス&データテクノロジー統括部長

アストラゼネカは100万文以上の翻訳データを翻訳バンクに提供し、製薬分野に特化した自動翻訳を業務に利用している。NICTの自動翻訳は精度が高いことはもちろん、スピード短縮やコスト削減といった面でも大きなメリットが得られている。

写真:柿沼太一

柿沼 太一

STORIA法律事務所 弁護士

わが国の著作権法では、機械学習用データの収集・加工に関して、海外に比べ許容される範囲が広く、データを利活用しやすい。これは、日本発の翻訳データを集積する取組である翻訳バンクにとって、大きな追い風である。

写真:須藤修

須藤 修

東京大学大学院 教授

VoiceTraはアルゴリズムに深層学習を採用することによって翻訳精度、音声認識精度を高めている。東京オリンピック・パラリンピックに向けて、さらなる精度向上には、収集できるボキャブラリー、コーパスの質と量に依存している。その意味で翻訳バンクは、極めて重要な役割を担っており、今後の活動に大いに期待している。

写真:須藤修

森口 功造

株式会社 川村インターナショナル 常務取締役

自動翻訳の精度向上により、翻訳業界では自動翻訳後の訳文を人の手によってブラッシュアップする「ポストエディット」という新たな市場が生まれている。翻訳バンクによって自動翻訳が多分野で高精度化すれば、今後の自動翻訳ビジネスの更なる展開につながる。