翻訳バンクとは
データ提供を検討されている方へ
ビッグデータの研究分野では良質なデータを多数集積することが重要であり、データは「AIの燃料」と例えられています。
NICTが取り組んでいる翻訳バンクは自動翻訳精度向上の燃料である翻訳言語コーパスを集める取り組みであり、データ集積のデザインとして興味深い活動です。
大学共同利用機関法人情報・システム研究機構
国立情報学研究所 所長
東京大学生産技術研究所 教授
喜連川 優
わが国の著作権法では、機械学習用データの収集・加工に関して、海外に比べ許容される範囲が広く、データを利活用しやすいものとなっています。
これは、日本発の翻訳データを集積する取り組みである翻訳バンクにとって、大きな追い風です。
STORIA法律事務所 弁護士
柿沼 太一
VoiceTra®はアルゴリズムに深層学習を採用することによって翻訳精度、音声認識精度を高めています。精度向上は、収集できるボキャブラリー、コーパスの質と量に依存しています。その意味で翻訳バンクは、極めて重要な役割を担っており、今後の活動に大いに期待しています。
中央大学国際情報学部 教授
須藤 修