翻訳料金の最大要素はボリューム・そのカウント方法を知り外注を攻略

翻訳料金の最大要素はボリューム そのカウント方法を知り外注を攻略

ボリュームとは、翻訳が必要なドキュメント(文書:以降、”原稿”とします)に含まれる文字数や単語数のことを言います。

翻訳単価」「その他料金」とともに翻訳料金を決定付ける三大要素のひとつである「ボリューム」は、どのようにして数えるのでしょうか。

本記事では、翻訳会社が行なうボリュームカウント方法について解説します。

※翻訳料金の構成要素のひとつであるボリュームですが、

  • 原文ベース(翻訳が必要な文章の文字数または、単語数を基準とする場合、日本語→英語への翻訳なら日本語の文字数)
  • 仕上がりベース(翻訳された文章の文字数または、単語数を基準とする場合、日本語→英語への翻訳なら英語の単語数)

そのカウント方法は二通りあります。これらの詳細については別の記事でご紹介しますが、本記事では「原文ベース」を前提としています。

紙媒体の場合

翻訳が必要な原稿が紙媒体の場合、そのボリューム(文字数、単語数)のカウント方法は次のとおりです。

手作業でカウントする

もっともシンプルな方法は、一文字ずつまたは、1単語ずつ手作業で数えるというものです。

1ページずつ丁寧に数えて正確なボリュームを確認するのが理想ですが、冊子など出版物の場合はページ数も多くその作業に掛かる時間も膨大なものとなります。よって、次のような方法でラフに算出する場合もあります。

一列に含まれる文字数または、一行に含まれる単語数 × 1ページあたりの行数 × 全ページ数

「ラフなカウントだと文字数または、単語数が実際とは異なり、翻訳料金が変わってしまう(依頼主が損をする)のでは?」といった懸念が生じると思いますが、ラフにカウントする場合でも「空白の多い、少ない」によって何種類かのページ構成に分けてカウントするなど、正確にカウントした結果と大きく変わらないように工夫しています。

OCRソフトを使ってカウントする

前述のとおり、手作業によるボリュームカウントは膨大な時間を費やします。そこで使用するのがOCRソフトです。

OCRとは、Optical Character RecognitionまたはReaderの略であり、通称「オーシーアール」と呼ばれる光学的文字認識技術です。OCRソフトとはその技術を用いた文字読み取りソフトウェアのことであり、豊富なラインナップで各社から販売されています。

OCRソフトを用いて紙媒体を電子ファイル形式のテキストに変換することにより、Microsoft Wordなどの「文字カウント機能」を使って容易にボリュームがカウントできるようになる、というわけですが時間削減の点で大きな効果を発揮するカウント方法です。

ただし、文字の読み取り精度が各社各ソフトによって異なること、また、印鑑などが重なった文字、手書きの文字、濃い背景色の上に載った文字などはどのソフトを使っても読み取りが難しい場合がありますので、読み取った結果(内容)をよく確認する作業が必要となります。

PDFファイルの場合

翻訳が必要な原稿がPDFファイルの場合、そのボリューム(文字数、単語数)のカウント方法は次のとおりです。

テキストのコピー&ペーストができる場合

Microsoft、Appleその他各社のソフトウェアである文章作成ソフト、表計算ソフト、プレゼンテーションソフトなどで作成した電子ファイルを直接的にPDFに出力したものは、コピーガードで保護されていない場合を除きコピー&ペーストすることができます。

コピー&ペーストできるかできないかは、PDFファイルを開いた状態で「Ctrl+A」で「全範囲選択」した際にテキスト部分が反転表示されるかどうかをみればすぐに判別できます。

テキストがコピー&ペーストできる場合は、コピーしたものをMicrosoft Wordファイル上にペースト(貼り付け)し、あとは同ソフトの「文字カウント機能」用いてボリュームを簡単にカウントすることができます

文字カウント機能

文字カウント結果

文字カウントについてはMicrosoft Wordにかぎらず、テキストエディタ(ソフトウェア)に標準装備の機能やWebサイト上の無料ツールで行なうこともできますが、セキュリティ面もよく考えて行なうようにしましょう。

テキストのコピー&ペーストができない場合

紙媒体のものをスキャンしてPDFファイルにしたものや、画像化されたテキストまたは、コピーガード(コピー防止)設定されたPDFファイル形式のテキストはコピー&ペーストができません。

このような場合は前述の紙媒体と同じ方法(手計算もしくは、OCRソフト)でボリュームをカウントしましょう。

ただし、コピーガード(コピー防止)設定についてはファイル管理者もしくは、提供者に解除を依頼することも考えましょう(解除できればコピー&ペーストが行なえる可能性があります)。

Microsoft Wordファイルの場合

翻訳が必要な原稿がMicrosoft Wordファイルの場合、そのボリューム(文字数、単語数)のカウント方法は次のとおりです。

原稿がテキストだけの場合

原稿がテキスト(文字)だけで構成されている場合はそのまま、Microsoft Wordの「文字カウント機能」を用いて簡単に、瞬時にボリュームをカウントすることができます。

原稿にテキストボックスが含まれる場合

原稿にテキストボックスが挿入されていると、テキストボックス内のテキストはMicrosoft Wordの「文字カウント機能」ではカウントすることができません。

このような場合は、Microsoft Wordファイルを一旦PDFファイル形式に出力してから「Ctrl+A」で全範囲選択、テキストをふたたびMicrosoft Wordファイルにコピー&ペーストしてボリュームをカウントしましょう。

原稿に画像などが挿入されている場合

原稿に画像などが挿入されている場合、当然ながらそこにテキストが含まれていても、Microsoft Wordの「文字カウント機能」ではカウントすることができません。

画像内に含まれるテキストのボリュームもカウントする必要がある場合は、その部分のみ手計算でカウントするかもしくは、OCRソフトを使ってカウントしましょう。

Microsoft Excelファイルの場合

翻訳が必要な原稿がMicrosoft Excelファイルの場合、そのボリューム(文字数、単語数)のカウント方法は次のとおりです。

  • カウントする必要のあるテキストすべてを範囲選択(またはシートごと範囲選択)
  • PDFファイル形式に出力
  • 「Ctrl+A」で全範囲選択
  • テキストをMicrosoft Wordファイルにコピー&ペースト
  • Microsoft Wordの「文字カウント機能」を用いてボリュームをカウント

ただし、画像などが挿入されていてそこにテキストが含まれていても、Microsoft Wordの「文字カウント機能」ではカウントすることができませんので、その部分のみ手計算でカウントするかもしくは、OCRソフトを使ってカウントしましょう。

また、Microsoft ExcelファイルをPDFファイル形式に出力する際、出力が必要なシートすべてを選択することを忘れないようにしましょう。複数シートに渡ってテキストが含まれている場合などは特に注意が必要です。

Microsoft PowerPointファイルの場合

翻訳が必要な原稿がMicrosoft PowerPointファイルの場合、そのボリューム(文字数、単語数)のカウント方法は次のとおりです。

Microsoft Excelファイルへの対処と同様に、

  • カウントする必要のあるテキストすべてを範囲選択(またはシートごと範囲選択)
  • PDFファイル形式に出力
  • 「Ctrl+A」で全範囲選択
  • テキストをMicrosoft Wordファイルにコピー&ペースト
  • Microsoft Wordの「文字カウント機能」を用いてボリュームをカウント

テキストが含まれた画像などが挿入されている場合の対処も同様です。その部分のみ手計算でカウントするかもしくは、OCRソフトを使ってカウントしましょう。

Microsoft PowerPointファイルをPDFファイル形式に出力する際は、スライド部だけでなくメモ欄(通常はスライドの下に表示)にテキストが含まれていないかも注意しましょう。

Adobe Illustratorファイルの場合

翻訳が必要な原稿がAdobe Illustratorファイルの場合、そのボリューム(文字数、単語数)のカウント方法は次のとおりです。

Microsoft Excel、PowerPointファイルへの対処と同様に、

  • カウントする必要のあるテキストすべてを範囲選択(またはシートごと範囲選択)
  • PDFファイル形式に出力
  • 「Ctrl+A」で全範囲選択
  • テキストをMicrosoft Wordファイルにコピー&ペースト
  • Microsoft Wordの「文字カウント機能」を用いてボリュームをカウント

テキストが含まれた画像などが挿入されている場合の対処も同様です。その部分のみ手計算でカウントするかもしくは、OCRソフトを使ってカウントしましょう。

Adobe Photoshopファイルの場合

翻訳が必要な原稿がAdobe Photoshopファイルの場合、そのボリューム(文字数、単語数)のカウント方法は次のとおりです。

上述の原稿がAdobe Illustratorファイルへの対処と同様に、

  • カウントする必要のあるテキストすべてを範囲選択(またはシートごと範囲選択)
  • PDFファイル形式に出力
  • 「Ctrl+A」で全範囲選択
  • テキストをMicrosoft Wordファイルにコピー&ペースト
  • Microsoft Wordの「文字カウント機能」を用いてボリュームをカウント

テキストが含まれた画像などが挿入されている場合の対処も同様です。その部分のみ手計算でカウントするかもしくは、OCRソフトを使ってカウントしましょう。

Adobe InDesignファイルの場合

翻訳が必要な原稿がAdobe InDesignファイルの場合、そのボリューム(文字数、単語数)のカウント方法は次のとおりです。

上述の原稿がAdobe Illustratorファイル

への対処と同様に、

  • カウントする必要のあるテキストすべてを範囲選択(またはシートごと範囲選択)
  • PDFファイル形式に出力
  • 「Ctrl+A」で全範囲選択
  • テキストをMicrosoft Wordファイルにコピー&ペースト
  • Microsoft Wordの「文字カウント機能」を用いてボリュームをカウント

テキストが含まれた画像などが挿入されている場合の対処も同様です。その部分のみ手計算でカウントするかもしくは、OCRソフトを使ってカウントしましょう。

ウェブサイト(HTMLほか)の場合

翻訳が必要な原稿がウェブサイト(HTMLほか)の場合、そのボリューム(文字数、単語数)のカウント方法は次のとおりです。

ボリュームをカウントする前にまず、カウントする必要のあるページや箇所を特定する(定義付ける)作業が必要です。

なぜなら、LP(ランディングページ)などごく一部を除き、ウェブサイトは通常何ページに渡って構成されていること、また、各ページにはリンクが複数設定されていること、そのほかにもメニューやバナーなど、同じ内容のテキストが繰り返し使用されていることが多いため、ボリュームカウントの仕方によっては結果が大きく異なってくるからです。

ウェブサイトでボリュームをカウントする必要のあるページを定義付けるには次のような方法があります。

  • ボリュームをカウントする必要のあるページのURLリスト(一覧表)を作る
  • ボリュームをカウントする必要のあるページひとつひとつをPDFファイル形式に出力する

URLをリストを作成する場合はあらかじめ、「クリックした際に表示されるページに含まれるすべてのテキストを対象とする」といった定義を設定しておくことも寛容です。

カウントする必要のあるページや箇所を特定(定義)さえすれば、あとは

  • ページをPDFファイル形式に出力
  • Microsoft Wordファイルにテキストをコピー&ペースト
  • Microsoft Wordの「文字カウント機能」を用いてボリュームをカウント

という流れは前述のその他のファイル形式のテキストと同様です。

まとめ

以上が「翻訳料金の最大要素はボリューム・そのカウント方法を知り外注を攻略」ですが、翻訳料金を決定付ける三大要素のひとつである「ボリューム」は、そのカウント結果によって翻訳料金が大きく変動するもっとも大切なものです。

ボリュームのカウントの仕方を間違えることによって重大な問題につながる可能性があるため、細心の注意を以て行なうようにしましょう。

また、より詳細確認がご必要な場合はお気軽にお問い合わせください!

コラムフッター