Google 翻訳の失敗を目にしたことがある人は多いでしょう。それらは一見無邪気で、ときに笑いを誘うものでもあります。
ただし全体的に見て機械翻訳は大幅に改善されており、翻訳する内容によってはとても便利なものです。
ChatGPTやその他のさらに洗練された翻訳ツールの台頭により、ある質問がよくされるようになりました。それは「AIに人間の翻訳者の代わりが務まるのか?」というものです。
この質問をばかばかしいと思う人もいるかもしれませんが、次のようなことを考えてみてください。
Memsource(現Phrase) CEO の David Čaněk 氏は、SlatorCon (言語業界の大手 Slator社が主催するイベント) で「2020 年は機械翻訳ポストエディット (MTPE) が主要な翻訳方法になった最初の年となった」と述べました。。
このような機械翻訳の発展と進歩により、人々は「 AI が人間の翻訳者に取って代わるのではないか」と考えています。
このトピックについては数年前に取り上げましたが、答えは変わりません。 答えは、AI が人間の翻訳者に取って代わることは決してないということです。
なぜなら機械は各言語の異なる文法規則、意味論、構文、文化的影響から生じるニュアンスを捉えることができないからです。
したがって翻訳の未来は、人間とAIが共に働き続ける(MTPE)ということになります。なぜなら人間の要素をAIに完全に置き換えることはできないからです。
※本コラムはInterpreters and Translators社のコラムを元にお届けします
目次
2023 年の AI 翻訳ソース
近年、AI翻訳ソースは大きな進歩を遂げていますが、GPT-3.5アーキテクチャをベースにOpenAIが学習させた大規模言語モデル「ChatGPT」もそのひとつです。
ChatGPT はある言語から別の言語への翻訳が可能かつ、従来の翻訳ツールよりも自然に感じられる方法で人々とコミュニケーションをとることができます。
もう ひと つの例は、ニューラル ネットワークを使用して翻訳を生成する Google Neural Machine Translation (GNMT) システムです。
それでも人間による翻訳が、機械よりも優れている理由
AI翻訳ソースは大きな進歩を遂げましたが、人間の翻訳者が不可欠であるいくつかの要因が残っています。
機械翻訳はシンプルでわかりやすいテキストには適していますが、より複雑なテキストや文化的なニュアンスを必要とするコンテンツにはやはり、人間の手による翻訳が必要なのです。
Ethnologue によると世界の言語は7,000 以上あり、それぞれに独自の特徴があります。そしてどの文化にも、「文脈によってのみ意味をなす独自の言い回し」があります。
そう考えると、人間の翻訳者の需要が依然として高い理由がわかります。事実、米国労働統計局の報告によると、通訳者と翻訳者の雇用は今から2029 年までに20%増加すると予想されています。
ビジネス、特に医療の分野では、不適切な翻訳は重大な結果を招く可能性があります。一例として次のようなものがあります。
バージニア州のパイロット誌は、同州のCOVIDサイトが予防接種のスケジューリングに機械翻訳ツールを使用していることを指摘しました。
そこで生じた問題とは? 機械翻訳が「book(予約する)」という単語を間違えて、「本(革装の文学作品)」を意味するスペイン語に置き換えてしまったのです。
この間違いが大混乱を引き起こす理由はおわかりでしょう。
バージニア州が機械翻訳が犯したもうひとつの間違いは、「ワクチンは必ずしも求められていません」が、スペイン語で「ワクチンは必要ありません」と誤訳されたことです。
このようなミスは、公衆衛生上の危機的状況下で発生した場合に大きな影響を及ぼす可能性があります。
さらに頭が痛いのは、(Ethnologueによれば)米国で2番目に話されている言語であり、世界で4番目に多く話されている言語であるスペイン語の翻訳にミスがあったことです。
これほどメジャーな言語であるスペイン語を正しく翻訳できない機械翻訳がほかのマイナーな言語を翻訳した場合、その正確さはいかほどなのでしょうか。
このワクチン予約の例は、機械翻訳の最大の欠点を浮き彫りにしています。それは、機械翻訳が「文字通り」であることです。
これに対して人間の翻訳者なら機械とは異なり、文脈から正しい単語の使い方を判断できます。
なぜなら人間の翻訳者は、同じ綴りでも状況によって異なる意味を持つことを理解しているからです。
このような単語は「同音異義語」と呼ばれますが、批判的思考スキルのない機械をだますことがよくあるのです。
たとえば「lead」という単語は、「誰かを導くこと」を意味する場合もあれば、「有毒金属(鉛)」を指す場合もあり、また、「記事の冒頭の最初の文(リード)」を意味する場合もあり、さらにはローカルニュースの「トップ記事(リード)」を意味する場合もあるのです。
これは世界で最も複雑な言語のひとつである「英語」の一例です。 同様の例が他の言語にはどれだけあるのか想像してみてください。
さらにこの世には「翻訳不可能な単語」もあり、「希少言語ほどAI翻訳ツールに大きな問題を引き起こしがち」という問題が生じます。
希少言語の翻訳に於いてはは人間の翻訳者も同様ですが、彼らにはそれらを解決する創意工夫があります。
ワイヤード誌は最近、「ある非営利団体が血中に糖分が多過ぎると発症する糖尿病を説明する方法がなかったため、めったに話されない言語で新しい単語を作成した」例を詳しく紹介しました。
そこで彼らが作ったのは、英語で「sweet blood(甘い血)」と訳される言葉です。
人間の翻訳者は慣用句のニュアンスや、異文化に於けるユーモアを理解することができるので機械よりも優れています。
例1)英語で「あなたはだまされている」と言いたいときに、「You are pulling the wool over my eyes.(あなたは自分のかつらで目を覆ってしまっている)」と言うかもしれませんが、この表現はロシア人にとっては何の意味も持たないでしょう(だからトランスクリエーションが存在するのです)。 ちなみにロシアには同様の場合に使われる、「耳に麺を掛ける」ということわざがあります。
ロシアといえば、国際外交において時折紛れ込む翻訳ミスの例もあります。
2009年、当時のヒラリー・クリントン米国務長官は、長年の敵対関係を「リセット」することを目的とした贈り物をロシア外務大臣に贈りました。
クリントン氏の「贈り物」は、ロシア語で「リセット」を意味するはずの文言がついたダミーのリセットボタンだったのですが、実際には「過充電」または、「過労」と翻訳されていたのです。
この出来事は多少の笑いを引き起こしましたが、このミスによってクリントンが意図していたところはまったく通じなくなってしまいました。
このようなことからもAI が人間の翻訳者に取って代わることは決してないことは明らかですが、機械翻訳だけを見れば「アラジンのジーニー(精霊)はすでに魔法のランプから出ている」ような状態です。
それは翻訳の未来にとって何を意味するのでしょうか?それはこれからわかることでしょう。
ニューラル機械翻訳の仕組み
「機械が人間の翻訳者に取って代わることがない」理由を知るにはまず、機械翻訳そのものを理解する必要があります。それでは、 機械翻訳とは何なのでしょうか?
Globalization and Localization Association (GALA)は機械翻訳を、「人間の介入なしにコンピューター ソフトウェアがテキストをソース(翻訳する前の)言語からターゲット(翻訳した後の)言語に翻訳するプロセス」と定義しています。
機械翻訳の最新の反復(プロセスの繰り返し)はAIに依存し、ニューラル ネットワークを通じて翻訳を生成します。
IBM によれば、ニューラル ネットワークは人間のニューロンが相互に信号を送信する方法を「模倣」するように設計された「機械学習のサブセット」です。
この方法では、単語だけではなく文全体を調べます。 その結果、意味がよく捉えられ、より正確な文章で、より自然に聞こえる翻訳ができるのです。
こんな例もあります。2020 年 4 月、カリフォルニア大学サンフランシスコ校 (UCSF) の研究者らによる研究で、脳信号を 97% の精度で完全な文章に翻訳できることがわかったのです。
尚、研究者らは、自分たちの研究とニューラル機械翻訳のプロセスとの間に関連性があることを指摘しています。
では、機械は私たちの仕事を奪いに来るのでしょうか?それらはすでに存在していますが、翻訳に於いてのそれは「ターミネーター」というよりは「C3PO」に似ています。
ロスト・イン・トランスレーション: 医療業界に於けるAI翻訳の潜在的な責任
医療現場における機械翻訳のミスがもたらしうる悪影響は、いくら強調してもしすぎることはありません。
あるAI翻訳では、イブプロフェンに関する説明が次のようなアルメニア語に誤って翻訳されました。
「痛みに合わせて必要なだけ、市販のイブプロフェンを服用できます。」とすべきところ、「痛みに合わせて必要なだけ、対戦車ミサイルを服用できます。」となったのです。
パンデミックは、世界保健機関(WHO)が「インフォデミック(情報流行病)」とみなし、疾病対策予防センターが「コミュニケーション・エマージェンシー(コミュニケーションの緊急事態)」と呼ぶような、健康と言語のギャップを明らかにしました。
だから、機械翻訳テクノロジーのみに依存することは状況を悪化させるだけなのです。
人間による翻訳を行う翻訳会社 の医療翻訳者は広範なトレーニングを受けており、特に医療用語のニュアンスに精通しています。
機械翻訳が医療現場では使いものにならないのは誰の目にも明らかですが、実際には依然として機械翻訳の使用が続いているのです。
機械翻訳に於けるプライバシーとセキュリティの懸念
一部の組織は、「機械翻訳の使用が機密性やセキュリティの侵害につながる可能性がある」との懸念を表明しています。
翻訳がオンライン サービスで行われる場合、コンテンツ データはどこかのサーバー上にあります。
果たしてそれは、競合他社や悪意を持った他者がアクセスできないと確信できるものなのでしょうか?
ノルウェーの放送会社NRKは2017 年、某有名なウェブサイトの記事が無断で翻訳され、それがクラウドに保存されているだけでなく、簡単なGoogle検索によってアクセス可能であると報じました。
翻訳テクノロジーと人間の未来
AI を搭載した機械が人間の翻訳者に取って代わることは決してないことは明らかですが、それは翻訳テクノロジーと人間の未来にとって何を意味するのでしょうか?
つまりそれは、企業は今後ますます、機械と人間の両方に翻訳を依頼するようになるということです。
その理由は 2 つあります。ひとつは機械翻訳の方が安価だということです。しかしそれをビジネスで使えるものにするためには、人間が校正や後編集を行う必要があることに変わりはありません。
冒頭で触れたこのプロセスは、機械翻訳ポストエディット(MTPE)と呼ばれています。これには、コンピュータ支援翻訳(CAT)ツールを使った人間の翻訳者が含まれます。
その主なセールスポイントは、生産性の向上と納期の短縮ですが、この方法には欠点もある。主な問題は、その作業に於いて人間の翻訳者が大きな問題を抱えているということです。
どういうことか?それはつまり、MTPEでは文脈的にかなり不正確な機械翻訳の背後にある意味を解読する必要があるため、作業にさらに時間がかかるということです。
翻訳者らはグループスレッドで、余分な頭痛に対処するために適切な補償が必要であるとコメントし、むしろゼロから始めたいと思うことも多いと述べた。
あるスレッドで翻訳者は「余計な作業に対応するためには適切な報酬(もっと高い料金)を得る必要がある」とコメントしており、また、「むしろゼロから始める(翻訳し直す)ことが多い」とも述べています。
7,000人以上のリンギスト(言語学者)を対象としたCSAリサーチの2020年「言語学者のサプライチェーンの現状」調査では、翻訳者の89%が従来のやり方での翻訳を好み、MTPE(機械翻訳の編集)を好むのはわずか3%であることがわかりました。
また、調査によるとリンギスト(言語学者)の 37% が機械翻訳は「良い」と考えていながらも、81%は機械翻訳の品質はクライアントごとに「大きく異なる」と述べています。
さらに驚くことに71%が「翻訳には人間が介入すべきである」と考えています。それはつまり、人間のフィードバックから学習することでようやくAIは機能するということです。
したがって翻訳の未来は、両方の長所を組み合わせた「ヒューマン・イン・ザ・ループ(人間が関与する)」方法であるべきであり、人間の翻訳者が喜んで協力すると思われる方法であるべきなのです。
しかしCSA Research の調査結果から判断するかぎり、そのループに人間が介入する方法はあまり普及していません。それが実現するまではやはり、翻訳は最初から人間に対処した方が良いでしょう。
ことわざにもありますが、「2回計って、1回切る(行動を起こす前にしっかりとチェック、確認する)」です。
これをたとえば韓国語でどう表現するにはどう翻訳すれば良いのでしょうか? 機械翻訳ではそれを解決することはできませんが、翻訳者ならできるのです。
まとめ
以上、「AIに人間の翻訳者の代わりが務まるのか?」でしたがいかがでしたでしょうか。
当社は翻訳の目的や、翻訳する文書の特徴、性質などを正しく理解、見極め、相手国の文化的背景を念頭に、ホームぺージや契約書、取扱説明書、プレゼン資料、リリース、ゲーム、アプリその他あらゆるビジネスで必要なドキュメント、テキストの「プロ翻訳者による翻訳」を、英語を中心に世界120か国語で行います。
高い品質が求められる外国語対応や翻訳についてもしお困りでしたら、どうぞお気軽にお問い合わせください。
お気軽にお問い合わせください。受付時間 10:00 - 18:00 [ 土日祝除く ]
お問い合わせ 別ウインドウで開きます