2022年11月、ChatGPTは生成系人工知能(AI)を世に知らしめました。
このチャットボットは大規模言語モデル(LLM)を使ってオリジナルのテキストを生成します。
今現在利用可能な大規模言語モデル(LLM)はこれだけではありませんが、ChatGPTの人気はその成熟度と知名度を際立たせています。
これは生成系AIが、業界を超えた言語ベースのインタラクションを形成する上で不可欠であることを示しています。
大規模言語モデル(LLM)テクノロジーは自動翻訳(機械翻訳、MT)を改良し、ローカライゼーションの速度、精度、拡張性を向上させました。
そしてその成熟に伴い、さらなるコスト削減、顧客体験の向上、ワークフロー管理の合理化が期待されます。
ただし他のテクノロジーと同様、生成系AIにも限界があります。
ここでは、4つの幅広い使用例と、その進歩にもかかわらず今後もローカライゼーションには人間の翻訳者が必要な理由をご説明します。
※本コラムはVISTATEC LTD社のコラムを元にお届けします
目次
生成系AIはどのように機能するのか?
生成 系AIで何ができるかを理解するには、まずその仕組みを理解する必要があります。
生成系AIは、ニューラル ネットワークを使用して大規模なデータ セットからパターンを分析、それらのパターンを使用してプロンプトに応答するオリジナルのテキスト、画像、その他のメディアを生成します。
たとえば、写真のデータセットを使用してトレーニングされたモデルは、風景の説明などの入力プロンプトが与えられると、まったく新しい画像を生成することができます。
ローカライゼーションに於ける4つのAI活用事例
生成系AIは最初からローカライゼーションを念頭に開発されたわけではありませんが、オリジナルのアウトプットを生成するその能力は、イノベーションのための強力なツールとなります。
AIはローカライゼーションプロセスの可能性を広げ、翻訳会社 がローカライズされたコンテンツを迅速かつ、効率的に作成することを可能にします。
用途によってはローカライゼーションにすでに不可欠となっている場合もあれば、まだ実験段階で改良が必要な場合もあります。
カスタムローカライゼーションとQA ツールの構築
大規模言語モデル(LLM)ツールは、従来の翻訳ツールや品質保証ツールを補完し、高度なコンテンツ分析と品質保証を提供することができます。
具体的には、翻訳会社などローカライゼーションサービス会社は既存のモデルを使用して、次のようなタスクを支援するカスタムツールを構築することができます。
- 複雑な種類のファイルの整理と管理
- 大規模言語モデル(LLM)ツールは、プロジェクトから画像、音声、動画ファイルを識別して抽出し、アクセスやレビューが簡単にできるよう、個別のフォルダ構造に整理することができます
- 翻訳前のソースコンテンツを分析、ローカライゼーションを最適化
- テキストの拡張をチェックし、全体の単語数を減らすことを提案したり、翻訳が不可能なテキスト要素をチェックしたりすることができます
- 用語集、用語ベース、言語ツールを「人間が作業する」ワークフローに統合
- 用語集や用語ベースに含めるべき文脈固有の用語を特定したり、自動翻訳(機械翻訳)によって生成された誤訳を特定したりすることができます
敵対的生成ネットワーク(Generative adversarial networks、GANs) と変分オートエンコーダー(variational autoencoders、VAEs)は、オリジナルの画像を作成したり、既存の画像をターゲットのロケールに合うように適応させたりすることができます。
たとえば翻訳会社などローカライゼーションサービス会社は、プロンプトに基づいて衣服のスタイルを変更したり、色を調整したりして画像を修正するツールを構築できます。
これにより、より複雑なデザインプロジェクトに集中できる時間を確保し、ストック画像に関連するコストを削減されることができます。
業界を超えたコンテンツパーソナライゼーションの実現
AIを活用したコンテンツのパーソナライゼーション(個々人向け最適化)は、エンゲージメントを向上させ、ブランド ロイヤルティを構築し、コンバージョンを増加させることでローカライゼーションの取り組みを強化します。
実際に、パーソナライゼーションテクノロジーに投資している企業の売上は、競合他社を約 30%上回っているのです。
パーソナライゼーションをローカライゼーションプロセスに統合している翻訳会社は、継続的にコンテンツを作成するお客様に付加価値を提供していますが、その仕組みは次のとおりです。
- アルゴリズムがデータを分析してパターンと嗜好を特定
- そのデータを使用してパーソナライズされた電子メール、プッシュ通知、アプリ内メッセージ、その他のコンテンツを配信
- たとえばオンライン小売業者はアルゴリズムによるパーソナライゼーションを利用して、顧客の購入履歴に基づいておすすめの商品を送ることができる
コンテンツのパーソナライゼーションは小売業に限ったことではありません。
NetflixやHuluのようなストリーミングサービスでは、パーソナライゼーションを利用してユーザーの視聴履歴に基づいた映画やテレビ番組をレコメンドしています。
また、教育分野ではパーソナライゼーションテクノロジーを利用して生徒に個別のラーニングパスを作成し、生徒のニーズに合った、カスタマイズされたコンテンツを確実に受講できるようにすることができます。
パーソナライゼーションを導入する業界が増えるにつれ、高度なAIを活用したローカライゼーションツールによって、翻訳会社は継続的な翻訳を大規模に提供することが容易になるでしょう。
音声認識を翻訳プロセスに統合
音声認識ツールは、話された内容を正確に文字に起こして翻訳することにより、ローカライゼーションを効率化することに役立ちます。
これらのツールは高度なアルゴリズムとディープニューラル ネットワークを使用して音声データを分析し、パターンを検出、文字言語に変換します。
これにより翻訳会社などローカライゼーションサービス会社は次のことが可能になります。
- ビデオや音声コンテンツをテキストに書き起こし、 字幕用の翻訳を作成できます
- たとえばインタビューの長い音声録音を文字起こしし、テキストに変換し、ビデオコンテンツの字幕を作成するために使用することができます
- 音声コンテンツをターゲット言語に翻訳し、ライブ通訳や事前に録音されたコンテンツの事前翻訳に役立ちます
- たとえば、異なる言語の二人の会話をリアルタイムで翻訳し、両方の言語で字幕を生成できます
- ボイスユーザーインターフェイス(Voice user interface、VUI)を有効にし、ユーザーの音声コマンドを理解、解釈し、ユーザーの言語で応答することができます
- たとえばAIを搭載した ボイスユーザーインターフェースは、スマートスピーカーや家電製品などのデバイスと対話することができます
- 多言語カスタマー サポートでは、音声認識ツールが顧客からの問い合わせを識別して文字に起こし、適切な言語を話す担当者に問い合わせを誘導するのに役立ちます
- たとえばカスタマーサービスチームは顧客の言語を迅速に識別し、人手を介さずに適切な担当者に電話を転送することができます。
音声コンテンツの量が増え、カスタマーサポートがオンラインに移行するにつれて、音声認識ツールの重要性はますます高まっていくでしょう。
あまり知られていない言語も大規模に翻訳
今日、コンテンツは主に約20の世界言語に翻訳されていますが、新興市場でインターネットへのアクセスが増加するにつれ、人々は母国語のコンテンツを求めるようになってきています。
しかし対応できる翻訳者が少ないため、あまり一般的ではない言語を大規模に翻訳することは困難です。
ただし大規模言語モデル(LLM)は「教師なし学習」を活用することで、翻訳会社によるこの課題への取り組みを支援することができます。
「教師なし学習」では、直接の監視やラベルを付けずに、注釈のない大量のデータに対して大規模言語モデル(LLM)をトレーニングします。
このアプローチはリソースが少ない言語や注釈付きデータが限られている言語に役立ちます。
たとえば西アフリカ言語など語彙が限られた言語で、 大規模言語モデル(LLM)を訓練するために「教師なし学習」が使用されてきました。
ただしリソースが少ない言語モデルは、より広く話されている他の言語と比較してパフォーマンスが制限されることに注意が必要です。
つまり、高度な正確性や文化的配慮を必要とするコンテンツには適さない可能性があるということです。
生成系AIの限界
生成 系AIは近年大きな進歩を遂げましたが、それでも限界はあります。 そのため人間の翻訳者がその出力を確認し、修正する必要がまだあるのです。
ここでは、AIをローカライゼーションプロセスに組み込む前に考慮すべき、4つのポイントをご紹介します。
創造性の限界
- 生成系AIはトレーニング データから学習した内容に近いコンテンツを生成しますが、オリジナルまたは、クリエイティブなコンテンツを作成するには手助けが必要です
- それはデータから学習したルールとともに、パターンが出力を制限するためです
- AIは製品説明、技術仕様書、ユーザー作成コンテンツには適していますが、マーケティングや広告などのようなクリエイティブな翻訳には適していません
偏りと不正確さ
- データの偏りがAIモデルに影響を与える可能性があり、それはトレーニングデータが現実世界を表していない場合に発生しますが、出力が偏ったり不正確になったりすることがあります
- よって専門知識を持つ翻訳者が、AIが生成したコンテンツに人種差別的、性差別的、文化的に不適切な表現がないかを確認する必要があります
言語変数
- AIアプリケーションを正確にトレーニングするには大量のデータが必要ですが、ほとんどのデータセットはメジャーな言語からのものです
- その結果、大規模言語モデル(LLM)はあまり一般的ではない言語や代替方言の場合、精度が低くなります
- これらの言語変数に対処するには、正確性、包括性、文化的理解を確保するための多様なチームが必要です
高い計算要件
- 生成系AIモデルは多くの場合、計算量が多く、実行とトレーニングに大量のリソースを必要とするため、一部のアプリケーションでは非現実的でコストが掛かる可能性があります
- つまり、カスタムローカラゼーションツールを作成するには、より成熟したモデルが必要になるということです
生成系AIは、最小限のコストと労力で大量のローカライズされたコンテンツを生成するには適していることに注意してください。
たとえば生成系AIは、eコマース用ウェブサイトの製品説明のローカライズ版を何千も作成することができます。
ただし、ターゲット言語や文化の微妙な理解が必要なプロジェクトは、やはり人間の翻訳者に任せるのがベストです。
ローカライゼーションのためのAIの未来
AIは無限の可能性を秘めた、急速に進化している分野です。
オープンソースまたは商用ツールは、翻訳会社などローカライゼーションプロバイダーがこの技術をワークフローに統合する機会をより多く提供するでしょう。
さらに開発が進めば、使用可能なケースが大幅に拡大し、特定のタスクと結果に向けたカスタムトレーニングが促進されるでしょう。
ただしそれらの進歩にかかわらず、人間の翻訳者は創造性と文化的専門知識を活用することで、その役割を果たし続けるでしょう。
まとめ
以上、「【AIと生成系AI】がローカライゼーションに与えるインパクトとは?」でしたがいかがでしたでしょうか。
当社は翻訳の目的や、翻訳する文書の特徴、性質などを正しく理解、見極め、相手国の文化的背景を念頭に、ホームぺージや契約書、取扱説明書、プレゼン資料、リリース、ゲーム、アプリその他あらゆるビジネスで必要なドキュメント、テキストの「プロ翻訳者による翻訳」を、英語を中心に世界120か国語で行います。
高い品質が求められる外国語対応や翻訳についてもしお困りでしたら、どうぞお気軽にお問い合わせください。