【ニューラル機械翻訳】はあらゆるコンテンツに活用できるか?

翻訳外注ノウハウ

ニューラル機械翻訳(neural machine translation、NMT)は機械翻訳を変え、翻訳業界の将来をかたちづくるパラダイム(模範)です。

ニューラル機械翻訳(neural machine translation、NMT)は素晴らしい結果を示していますが、あらゆる種類のコンテンツの翻訳に有効な選択肢となるにはまだ制約が残っています。

果たしてニューラル機械翻訳は翻訳サービスの未来と呼べるものでしょうか?

※本コラムはAccelingo社のコラムを元にお届けしています。

ニューラル機械翻訳は最先端のサービスか、それともただの贅沢品か?

ニューラル機械翻訳(neural machine translation、NMT)は、ディープラーニングの手法に基づき、コーパスベースの機械翻訳を実現する、新しいタイプの機械翻訳です。

従来の機械翻訳(machine translation、MT)とは異なり、ニューラル機械翻訳(neural machine translation、NMT)はニューラルネットワークをベースにしているため、単語だけでなく、完全な文章を翻訳することができます。

ニューラル機械翻訳(neural machine translation、NMT)は人間の脳のニューロン(神経細胞)を模倣するように設計されていますが、Mikel L. Forcada(マイケル・L・フォルカダ、スペイン・アリカンテ大学教授)は彼の研究「Making sense of neural machine translation(ニューラル機械翻訳の意味するところ)」で、「ニューラル機械翻訳(neural machine translation、NMT)は人間、特に翻訳者の脳の働き方に漠然と似ているだけだ」と警告しています。

それでもニューラル機械翻訳(neural machine translation、NMT)は、単語の並びや出現の可能性を予測するのに役立つニューラルネットワークを利用しています。

ニューラル機械翻訳(neural machine translation、NMT)は当初、学習サイクルを完了するために多大なリソースと時間を要し、Slator社のレポートによれば翻訳ミスの少ない文章を作成し、ポストエディット(機械翻訳したものを翻訳者が修正する作業)を26%削減できるにもかかわらず、小さな翻訳会社にとっては取り扱いが難しいものだったのです。

Google、Microsoft、Yandexなどの大企業は、この画期的なプロセスをすぐに利用しました。

Googleは2016年11月にGoogle Neural Machine Translation(GNMT)を発表しましたが、同社の「Bridging the Gap between Human and Machine Translation(人間翻訳と機械翻訳のギャップを埋める)」の研究では、Googleのフレーズベースの機械翻訳と比較して、翻訳エラーを平均60%削減できることが明らかになりました。

現在ではほとんどの機械翻訳(machine translation、MT)システムがニューラル機械翻訳(neural machine translation、NMT)を採用していますが、このアプローチはまだ開発途上であり、最先端のプロフェッショナルな翻訳サービスとして提供できる段階にはありません。

しかし技術の進歩により翻訳業界への導入が容易になり、NMTが贅沢品ではなく通常の選択肢になりつつあるのは良い知らせです。

ニューラル機械翻訳はどんなコンテンツにも適しているのか?

Poznan(ポズナン市・ポーランド)のAdam Mickiewicz University(アダム・ミツキェヴィチ大学)とアダム・ミツキェヴィッチ大学とUniversity of Edinburgh(エディンバラ大学)が実施した「Case Study on 30 Translation Directions(30の翻訳方向に関するケーススタディ)」では、ニューラル機械翻訳(neural machine translation、NMT)がフレーズベースの統計的機械翻訳による翻訳品質と同等、あるいはそれ以上の品質を提供することが明らかにされました。

しかしこの研究の結果、ニューラル機械翻訳(neural machine translation、NMT)は中国語と英語、英語とアラビア語など特定の言語ペアでうまく機能し、他の言語ではあまりうまく機能しないという事実が明らかになりました。

さらに研究を進めた結果、翻訳文の質はコンテンツに左右されることもわかってきました。

「A Report from the Frontline of NMT in Multilingual’s January 2018 issue(2018年1月号のマルチリンガル誌掲載・NMTの最前線からのレポート)」に掲載された具体的な対象事例からも、ニューラル機械翻訳(neural machine translation、NMT)は内容、トピック、言語ペアに基づき、タイトルまたは記事全体の翻訳にのみ使用することができると結論付けることができます。

ニューラル機械翻訳(neural machine translation、NMT)は、使用できないレベルの翻訳文を生成しないようにするため、またあらゆる種類のコンテンツに適用できるようにするためにはまだ改良が必要なのです。

【ニューラル機械翻訳】はあらゆるコンテンツに活用できるか?

ニューラル機械翻訳が失敗しやすい部分とは?

ローカライゼーション(現地対応)や翻訳のためのリソースが限られているスタートアップは、海外市場での成長のための選択肢としてニューラル機械翻訳(neural machine translation、NMT)の可能性を追求したいと思うかもしれません。

一般的な機械翻訳、特にニューラル機械翻訳は人間による翻訳の代替となり得ますが、ニューラル機械翻訳(neural machine translation、NMT)が思いっきり失敗する分野もあります。

AI and Natural Language Processing (NLP、AIと自然言語処理)の研究者であるDelip Rao氏は、論文「The Real Problems with Neural Machine Translation(ニューラル機械翻訳の本当の問題点)」の中で、次の6つの懸念事項を挙げています。

  1. ニューラル機械翻訳(neural machine translation、NMT)は、領域外のデータとの相性が悪い。つまり、法律分野で学習させたシステムは、たとえば医療関係での良い結果につながらない。
  2. ニューラル機械翻訳(neural machine translation、NMT)は小さなデータセットではうまく機能しない。ニューラル機械翻訳の秘密は、入力データが増えるほど一般化され、より良い結果が得られることにある。
  3. ニューラル機械翻訳(neural machine translation、NMT)は希少な単語を扱うのが苦手であり、広範囲な活用が必要な言語では問題となることがある。
  4. ニューラル機械翻訳(neural machine translation、NMT)は長文に弱く、法律翻訳のように長文が当たり前の翻訳では問題となることがある。
  5. ニューラル機械翻訳(neural machine translation、NMT)システムでは、アラインメント(調整、調節)が問題となるため、ターゲット(翻訳後の)言語の動詞が、ソース(翻訳前の)言語の動詞に加え主語と目的語にも誤って掛かることがある。
  6. ビーム幅のトリミングや訳語の選択肢数の制御に用いられるビームサーチは、ニューラル機械翻訳(neural machine translation、NMT)システムでは効果がないようで、品質のコントロールが難しい。

それでも、ニューラル機械翻訳を翻訳の一次資料として利用し、その後に人間の編集・校正を行なうことは可能であり、訓練された翻訳者であれば、悪い部分を簡単に識別、無視するなどして通常通り翻訳することができます。

このような混合型のアプローチは、より手頃な価格の翻訳方法を探しているスタートアップにとっては非常に有効な手段です。

まとめ

以上、「【ニューラル機械翻訳】はあらゆるコンテンツに活用できるか?」でしたがいかがでしたでしょうか。

当社は翻訳の目的や、翻訳する文書の特徴、性質などを正しく理解、見極め、相手国の文化的背景を念頭に、ホームぺージや契約書、取扱説明書、プレゼン資料、リリース、ゲーム、アプリその他あらゆるビジネスで必要なドキュメント、テキストの「プロ翻訳者による翻訳」を、英語を中心に世界120か国語で行ないます。

高い品質が求められる外国語対応や翻訳についてもしお困りでしたら、どうぞお気軽にお問い合わせください。

お問い合わせボタン