【図解】原稿によって異なる文字数・単語数のカウント方法

翻訳外注ノウハウ

原稿に含まれる文字数や単語数のことをボリュームと言います。ボリュームは、翻訳単価とともに翻訳料金を決める三大要素のひとつですが、どのようにして数えればよいのでしょうか。本コラムでは、翻訳会社が行なうボリュームのカウント方法について解説します。

はじめに

ボリュームのカウント方法は大きく分けて次の二種類があります。

  • 原文ベース
    • 翻訳する前の原稿に含まれる文字数または、単語数を基準とする
    • 日本語→英語への翻訳なら、日本語の文字数が基準となる
    • 英語→日本語への翻訳なら、英語の単語数が基準となる
  • 仕上がりベース
    • 翻訳した後の原稿に含まれる文字数または、単語数を基準とする
    • 日本語→英語への翻訳なら、英語の単語数が基準となる
    • 英語→日本語への翻訳なら、日本語の文字数が基準となる

尚、本コラムでは「原文ベース」を前提としています。

原稿が紙媒体の場合

翻訳が必要な原稿が紙媒体の場合、ボリュームカウント方法は次のとおりです。

  • 手作業でカウントする
    • もっともシンプルな方法で、一文字ずつまたは、1単語ずつ手作業で数えるというものです
    • 1ページずつ丁寧に数えて正確なボリュームを確認するのが理想ですが、冊子など出版物の場合はページ数も多く、その作業に掛かる時間も膨大なものとなります
    • よって「一列に含まれる文字数または、一行に含まれる単語数 × 1ページあたりの行数 × 全ページ数」のような方法でラフにカウントする場合もあります
    • 「ラフなカウントだと文字数または、単語数が実際とは異なり、翻訳料金が変わってしまう(依頼主が損をする)のでは?」と思われるかもしれませんが、「空白の多い・少ないによって何種類かのページ構成に分けてカウントする」など正確にカウントした結果と大きく変わらないように工夫しています
  • OCRソフトを使ってカウントする
    • 時間の掛かる手作業のボリュームカウントの代わりに使用するのがOCRソフトです
    • OCRとはOptical Character RecognitionまたはReaderの略であり、通称「オーシーアール」と呼ばれる光学的文字認識技術です
    • OCRソフトとはその技術を用いた文字読み取りソフトウェアのことで、各社から豊富なラインナップが販売されています
    • OCRソフトを用いて紙に印字された文字を電子ファイル形式のテキストに変換することにより、Microsoft Wordなどの「文字カウント機能」を使って容易にボリュームがカウントできるようになり、時間削減に大きく役立つカウント方法です
    • ただし使用するソフトウェアによって文字の読み取り精度が異なること、また印鑑などが重なった文字や手書きの文字、濃色の背景の上に印刷された文字などはどの読み取りが難しい場合があるため、読み取り結果をよく確認する必要があります

原稿がPDFファイルの場合

原稿がPDFファイルの場合、ボリュームカウント方法は次のとおりです。

  • テキストをコピー&ペーストできる場合
    • Microsoft、Appleその他各社の文章作成ソフト、表計算ソフト、プレゼンテーションソフトなどで作成した電子ファイルをPDFに直接出力したものは、コピーガードで保護されていない場合を除きコピー&ペーストすることができます
    • コピー&ペーストできるかできないかは、PDFファイルを開いた状態で「Ctrl+A(全範囲選択)」した際に「テキスト部分が反転表示されるかどうか」を確認すればすぐに判別できます
    • テキストがコピー&ペーストできる場合は、コピーしたものをMicrosoft Wordファイル上にペースト(貼り付け)し、「文字カウント機能」を使ってボリュームを簡単にカウントすることができます
    • 文字カウントはMicrosoft Wordの機能だけでなく、各種ソフトウェア(テキストエディタ)に標準装備された機能や、ウェブサイト上の無料ツールで行なうこともできます
    • ただし、無料のものを使う場合はセキュリティ面もよく考えるようにしましょう
  • テキストをコピー&ペーストができない場合
    • 紙媒体をスキャンしてPDFファイルにしたものや、スマホで撮影するなどして画像化されたテキストまたは、コピーガード(コピー防止)設定されたPDFファイル形式のテキストはコピー&ペーストができません
    • コピー&ペーストできない場合は紙媒体と同じ方法(手計算かOCRソフト)でボリュームをカウントしましょう
    • ただし、コピーガード(コピー防止)設定されている場合は解除できればコピー&ペーストできる可能性がありますので、ファイル管理者かファイルの提供者に解除を依頼することを先に考えましょう

詳しい方法については【図解】文字数・単語数のカウント方法【Adobe PDFファイル編】をお読みください。

文字カウント機能
Microsoft Wordによる文字カウント結果の例

原稿がWordファイルの場合

翻訳が必要な原稿がMicrosoft Wordファイルの場合、ボリュームカウント方法は次のとおりです。

  • 原稿がテキストだけの場合
    • 原稿に図や表もなく、テキストボックスも使われていないテキスト(文字)だけの場合はMicrosoft Wordの「文字カウント機能」でボリュームカウントできます
  • 原稿にテキストボックスが含まれる場合
    • 原稿にテキストボックスが使われている場合、テキストボックス内に含まれるテキストはMicrosoft Wordの「文字カウント機能」ではカウントでないため、以下の手順でカウントします
    • Microsoft Wordファイルを一旦PDFファイル形式に出力する
    • 「Ctrl+A」で全範囲選択し、テキストをコピーする
    • コピーしたテキストをMicrosoft Wordファイルにペーストする
    • 最後にMicrosoft Wordの「文字カウント機能」でボリュームカウントする
  • 原稿に画像などが挿入されている場合
    • 原稿に画像などが挿入されている場合、そこにテキストが含まれていてもMicrosoft Wordの「文字カウント機能」ではボリュームカウントすることができません
    • 画像内に含まれるテキストもボリュームカウントする必要がある場合は、その部分だけ手計算でカウントするか、OCRソフトを使ってカウントしましょう

詳しい方法については【図解】文字数・単語数のカウント方法【Microsoft Word(ワード)ファイル編】をお読みください。

原稿がExcelファイルの場合

原稿がMicrosoft Excelファイルの場合、ボリュームカウント方法は次のとおりです。

  • カウントする必要のあるテキストすべてを範囲選択(またはシートごと範囲選択)する
  • PDFファイル形式に出力する
  • 「Ctrl+A」で全範囲選択してテキストをコピーする
  • コピーしたテキストをMicrosoft Wordファイルにペーストする
  • Microsoft Wordの「文字カウント機能」でボリュームカウントする

ただし、画像などが挿入されていてその中にテキストが含まれていても、Microsoft Wordの「文字カウント機能」ではカウントできませんので、その部分のみ手計算でカウントするかもしくは、OCRソフトを使ってカウントしましょう。

また、Microsoft ExcelファイルをPDFファイル形式に出力する際、「出力が必要なシートすべてを選択する」ことを忘れないようにしましょう。「複数のシートにまたがってテキストが含まれている」場合などは特に注意が必要です。

詳しい方法については【図解】文字数・単語数のカウント方法【Microsoft Excel(エクセル)ファイル編】をお読みください。

原稿がPowerPointファイルの場合

原稿がMicrosoft PowerPointファイルの場合、ボリュームカウント方法は次のとおりです。

  1. カウントする必要のあるテキストすべてを範囲選択(またはシートごと範囲選択)する
  2. PDFファイル形式に出力する
  3. 「Ctrl+A」で全範囲選択してテキストをコピーする
  4. コピーしたテキストをMicrosoft Wordファイルにペーストする
  5. Microsoft Wordの「文字カウント機能」でボリュームカウントする

テキストが含まれる画像が挿入されている場合は、その部分のみ手計算でカウントするかもしくは、OCRソフトを使ってカウントしましょう。

また、Microsoft PowerPointファイルをPDFファイル形式に出力する際は、スライド部だけでなく「メモ欄(通常はスライドの下に表示)にテキストが含まれていないか」にも注意しましょう。

具体的で詳しい方法については【図解】MSパワーポイントの文字カウント方法をお読みください。

原稿がIllustratorファイルの場合

原稿がAdobe Illustratorファイルの場合、ボリュームカウント方法は次のとおりです。

  1. カウントする必要のあるテキストすべてを範囲選択(またはシートごと範囲選択)する
  2. PDFファイル形式に出力する
  3. 「Ctrl+A」で全範囲選択してテキストをコピーする
  4. コピーしたテキストをMicrosoft Wordファイルにペーストする
  5. Microsoft Wordの「文字カウント機能」でボリュームカウントする

テキストが含まれる画像などが挿入されている場合は、その部分のみ手計算でカウントするかもしくは、OCRソフトを使ってカウントしましょう。

原稿がPhotoshopファイルの場合

原稿がAdobe Photoshopファイルの場合、ボリュームカウント方法は次のとおりです。

  1. カウントする必要のあるテキストすべてを範囲選択(またはシートごと範囲選択)する
  2. PDFファイル形式に出力する
  3. 「Ctrl+A」で全範囲選択してテキストをコピーする
  4. コピーしたテキストをMicrosoft Wordファイルにペーストする
  5. Microsoft Wordの「文字カウント機能」でボリュームカウントする

テキストが含まれる画像などが挿入されている場合は、その部分のみ手計算でカウントするかもしくは、OCRソフトを使ってカウントしましょう。

原稿がInDesignファイルの場合

原稿がAdobe InDesignファイルの場合、ボリュームカウント方法は次のとおりです。

  1. カウントする必要のあるテキストすべてを範囲選択(またはシートごと範囲選択)する
  2. PDFファイル形式に出力する
  3. 「Ctrl+A」で全範囲選択してテキストをコピーする
  4. コピーしたテキストをMicrosoft Wordファイルにペーストする
  5. Microsoft Wordの「文字カウント機能」でボリュームカウントする

テキストが含まれる画像などが挿入されている場合は、その部分のみ手計算でカウントするかもしくは、OCRソフトを使ってカウントしましょう。

原稿がウェブサイトの場合

原稿がウェブサイト(HTMLほか)の場合、ボリュームカウントの前にまず「カウントする必要のあるページや箇所を決める」作業が必要です。

なぜなら、LP(ランディングページ)などごく一部を除きウェブサイトは、

  • 通常何ページにも渡って構成されていること
  • 各ページにはリンクが複数設定されていること
  • メニューやバナーなど、同じ内容のテキストが繰り返し使用されていることが多いこと

といった理由から、カウントする必要のあるページを箇所を決めずにカウントすると、カウントした人によって結果が大きく変わる可能性があるからです。

尚、ウェブサイトでボリュームを「カウントする必要のあるページや箇所を決める」には次のような方法があります。

  1. ボリュームカウントするページのリスト(URL一覧表)を作る
  2. ボリュームカウントするページを、1ぺージずつPDFファイル形式に出力する

また、「1.リスト(URL一覧表)を作成する」場合はあらかじめ、

  • クリックした際に表示されるページに含まれるすべてのテキストを対象とする
  • バナーやテキストリンクから遷移した先のページは含まない
  • グローバルメニューはトップページのみを対象とする

といった取り決め(定義付け)をしておくことも寛容です。

ボリュームカウントするページや箇所さえ決めることができたらあとは、

  1. ページをPDFファイル形式に出力してテキストをコピーする
  2. Microsoft Wordファイルにテキストをペーストする
  3. Microsoft Wordの「文字カウント機能」でボリュームカウントする

という流れは、前述のWordやExcel、PowerPointなどと同じです。

最後に

翻訳料金を決める三大要素のひとつである「ボリューム」は、そのカウント結果によって翻訳料金が大きく変動するもっとも大切なものです。

ボリュームカウントを間違えると重大な問題が発生する可能性があるため、細心の注意を払うようにしましょう。

まとめ

以上、「【図解】原稿によって異なる文字数・単語数のカウント方法」でしたがいかがでしたでしょうか。

当社は翻訳の目的や、翻訳する文書の特徴、性質などを正しく理解、見極め、相手国の文化的背景を念頭に、ホームぺージや契約書、取扱説明書、プレゼン資料、リリース、ゲーム、アプリその他あらゆるビジネスで必要なドキュメント、テキストの「プロ翻訳者による翻訳」を、英語を中心に世界120か国語で行ないます。

高い品質が求められる外国語対応や翻訳についてもしお困りでしたら、どうぞお気軽にお問い合わせください。

お問い合わせボタン