統計的機械翻訳(Statistical Machine Translation:スタティスティカルマシントランスレーション、SMT)

  • 統計的機械翻訳とは、あらかじめ登録した言語データベースであるコーパスの統計に基づいて翻訳を行なう機械翻訳のこと(Statistical Machine Translation:スタティスティカルマシントランスレーション)
  • SMTと略される
  • コーパスとは対訳コーパスのことであり、文章や段落レベルで作られた原文(翻訳が必要な文章)と翻訳文のデータベース
  • 辞書をデータベース化したようなルールベース機械翻訳(Rule-based Machine Translation:ルールベースドマシントランスレーション、RMT)とは異なるコーパスを用いる
  • 意訳(いやく)に強いがデータ量が翻訳品質に大きく影響する
  • NMT(Neural Machine Translation:ニューラルマシントランスレーション)の台頭により、ルールベース機械翻訳(Rule-based Machine Translation:ルールベースドマシントランスレーション、RMT)と並び従来型とされる機械翻訳