【必読】文字数・単語数のカウント方法

翻訳外注ノウハウ

翻訳が必要なドキュメント(原稿)に含まれる文字数や単語数のことをボリュームと言います。

ボリュームは翻訳単価とともに翻訳料金を決める三大要素のひとつですが、どのようにして数えればよいのでしょうか。

本記事では、翻訳会社が行なうボリュームカウント方法について解説します。

はじめに

ボリュームのカウント方法は大きく分けて次の二種類があります。

原文ベース

  • 翻訳が必要な文章に含まれる文字数または、単語数を基準とする
  • 日本語→英語への翻訳なら、日本語の文字数が基準となる
  • 英語→日本語への翻訳なら、英語の単語数が基準となる

仕上がりベース

  • 翻訳した後の文章に含まれる文字数または、単語数を基準とする
  • 日本語→英語への翻訳なら、英語の単語数が基準となる
  • 英語→日本語への翻訳なら、日本語の文字数が基準となる

本記事では「原文ベース」を前提としています。

原稿が紙媒体の場合

翻訳が必要な原稿が紙媒体の場合、ボリュームカウント方法は次のとおりです。

手作業でカウントする

  • もっともシンプルな方法は、一文字ずつまたは、1単語ずつ手作業で数えるというものです
  • 1ページずつ丁寧に数えて正確なボリュームを確認するのが理想ですが、冊子など出版物の場合はページ数も多くその作業に掛かる時間も膨大なものとなります
  • よって、「一列に含まれる文字数または、一行に含まれる単語数 × 1ページあたりの行数 × 全ページ数」のような方法でラフに算出する場合もあります
  • 「ラフなカウントだと文字数または、単語数が実際とは異なり、翻訳料金が変わってしまう(依頼主が損をする)のでは?」といった懸念が生じると思いますが、ラフにカウントする場合でも「空白が多い・少ない」によって何種類かのページ構成に分けてカウントするなど、正確にカウントした結果と大きく変わらないように工夫しています

OCRソフトを使ってカウントする

  • 膨大な時間を費やす必要のある手作業のボリュームカウントの代わりに使用するのがOCRソフトです
  • OCRとは、Optical Character RecognitionまたはReaderの略であり、通称「オーシーアール」と呼ばれる光学的文字認識技術です
  • OCRソフトとはその技術を用いた文字読み取りソフトウェアのことであり、豊富なラインナップで各社から販売されています
  • OCRソフトを用いて紙媒体を電子ファイル形式のテキストに変換することにより、Microsoft Wordなどの「文字カウント機能」を使って容易にボリュームがカウントできるようになるというわけですが、時間削減の点で大きな効果を発揮するカウント方法です
  • ただし、使用するソフトウェアによって文字を読み取る精度が異なること、また、印鑑などが重なった文字や手書きの文字、濃色の背景の上に印刷された文字、などはどのソフトウェアでも読み取りが難しい場合がありますので、読み取った結果(内容)をよく確認する必要があります

原稿がPDFファイルの場合

翻訳が必要な原稿がPDFファイルの場合、ボリュームカウント方法は次のとおりです。

テキストがコピー&ペーストできる場合

Microsoft、Appleその他各社の文章作成ソフト、表計算ソフト、プレゼンテーションソフトなどで作成した電子ファイルをPDFに直接出力したものは、コピーガードで保護されていない場合を除きコピー&ペーストすることができます。

コピー&ペーストできるかできないかは、PDFファイルを開いた状態で「Ctrl+A(全範囲選択)」した際に「テキスト部分が反転表示されるかどうか」を確認すればすぐに判別できます。

テキストがコピー&ペーストできる場合は、コピーしたものをMicrosoft Wordファイル上にペースト(貼り付け)し、「文字カウント機能」を使ってボリュームを簡単にカウントすることができます。

文字カウント機能
文字カウント結果

文字カウントについてはMicrosoft Wordの機能だけでなく、各種ソフトウェア(テキストエディタ)に標準装備された機能や、ウェブサイト上の無料ツールで行なうこともできますが、無料のものを使う場合はセキュリティ面もよく考えるようにしましょう。

テキストのコピー&ペーストができない場合

紙媒体をスキャンしてPDFファイルにしたものや、スマホで撮影するなどして画像化されたテキストまたは、コピーガード(コピー防止)設定されたPDFファイル形式のテキストはコピー&ペーストができません。

コピー&ペーストできない場合は前述の紙媒体と同じ方法(手計算もしくは、OCRソフト)でボリュームをカウントしましょう。

ただし、コピーガード(コピー防止)設定されている場合は、ファイル管理者かファイルの提供者に解除を依頼することを先に考えましょう(解除できればコピー&ペーストできる可能性があります)。

具体的で詳しい方法については【図解】Adobe PDFの文字カウント方法をお読みください。

原稿がWordファイルの場合

翻訳が必要な原稿がMicrosoft Wordファイルの場合、ボリュームカウント方法は次のとおりです。

原稿がテキストだけの場合

原稿がベタ打ちのテキスト(文字)だけで構成されている場合、ボリュームカウント方法は次のとおりです。

  1. Microsoft Wordの「文字カウント機能」でボリュームカウント

原稿にテキストボックスが含まれる場合

原稿にテキストボックスが挿入されている場合、テキストボックス内のテキストはMicrosoft Wordの「文字カウント機能」ではカウントできません。

このような場合は、ボリュームカウント方法は次のとおりです。

  1. Microsoft Wordファイルを一旦PDFファイル形式に出力
  2. 「Ctrl+A」で全範囲選択→テキストをコピー
  3. コピーしたテキストをMicrosoft Wordファイルにペースト
  4. Microsoft Wordの「文字カウント機能」でボリュームカウント

原稿に画像などが挿入されている場合

原稿に画像などが挿入されている場合、そこにテキストが含まれていてもMicrosoft Wordの「文字カウント機能」ではボリュームカウントすることができません。

画像内に含まれるテキストもボリュームカウントする必要がある場合は、その部分だけ手計算でカウントするか、OCRソフトを使ってカウントしましょう。

具体的で詳しい方法については【図解】MSワードの文字カウント方法をお読みください。

原稿がExcelファイルの場合

翻訳が必要な原稿がMicrosoft Excelファイルの場合、ボリュームカウント方法は次のとおりです。

  1. カウントする必要のあるテキストすべてを範囲選択(またはシートごと範囲選択)
  2. PDFファイル形式に出力
  3. 「Ctrl+A」で全範囲選択→テキストをコピー
  4. コピーしたテキストをMicrosoft Wordファイルにペースト
  5. Microsoft Wordの「文字カウント機能」でボリュームカウント

ただし、画像などが挿入されていてそこにテキストが含まれていても、Microsoft Wordの「文字カウント機能」ではカウントすることができませんので、その部分のみ手計算でカウントするかもしくは、OCRソフトを使ってカウントしましょう。

また、Microsoft ExcelファイルをPDFファイル形式に出力する際、「出力が必要なシートすべてを選択する」ことを忘れないようにしましょう。複数のシートにまたがってテキストが含まれている場合などは特に注意が必要です。

具体的で詳しい方法については【図解】MSエクセルの文字カウント方法をお読みください。

原稿がPowerPointファイルの場合

翻訳が必要な原稿がMicrosoft PowerPointファイルの場合、ボリュームカウント方法は次のとおりです。

  1. カウントする必要のあるテキストすべてを範囲選択(またはシートごと範囲選択)
  2. PDFファイル形式に出力
  3. 「Ctrl+A」で全範囲選択→テキストをコピー
  4. コピーしたテキストをMicrosoft Wordファイルにペースト
  5. Microsoft Wordの「文字カウント機能」でボリュームカウント

テキストが含まれた画像が挿入されている場合は、その部分のみ手計算でカウントするかもしくは、OCRソフトを使ってカウントしましょう。

また、Microsoft PowerPointファイルをPDFファイル形式に出力する際は、スライド部だけでなくメモ欄(通常はスライドの下に表示)にテキストが含まれていないかにも注意しましょう。

具体的で詳しい方法については【図解】MSパワーポイントの文字カウント方法をお読みください。

原稿がIllustratorファイルの場合

翻訳が必要な原稿がAdobe Illustratorファイルの場合、ボリュームカウント方法は次のとおりです。

  1. カウントする必要のあるテキストすべてを範囲選択(またはシートごと範囲選択)
  2. PDFファイル形式に出力
  3. 「Ctrl+A」で全範囲選択→テキストをコピー
  4. コピーしたテキストをMicrosoft Wordファイルにペースト
  5. Microsoft Wordの「文字カウント機能」でボリュームカウント

テキストが含まれた画像などが挿入されている場合は、その部分のみ手計算でカウントするかもしくは、OCRソフトを使ってカウントしましょう。

原稿がPhotoshopファイルの場合

翻訳が必要な原稿がAdobe Photoshopファイルの場合、そのボリューム(文字数、単語数)のカウント方法は次のとおりです。

  1. カウントする必要のあるテキストすべてを範囲選択(またはシートごと範囲選択)
  2. PDFファイル形式に出力
  3. 「Ctrl+A」で全範囲選択→テキストをコピー
  4. コピーしたテキストをMicrosoft Wordファイルにペースト
  5. Microsoft Wordの「文字カウント機能」でボリュームカウント

テキストが含まれた画像などが挿入されている場合は、その部分のみ手計算でカウントするかもしくは、OCRソフトを使ってカウントしましょう。

原稿がInDesignファイルの場合

翻訳が必要な原稿がAdobe InDesignファイルの場合、そのボリューム(文字数、単語数)のカウント方法は次のとおりです。

  1. カウントする必要のあるテキストすべてを範囲選択(またはシートごと範囲選択)
  2. PDFファイル形式に出力
  3. 「Ctrl+A」で全範囲選択→テキストをコピー
  4. コピーしたテキストをMicrosoft Wordファイルにペースト
  5. Microsoft Wordの「文字カウント機能」でボリュームカウント

テキストが含まれた画像などが挿入されている場合は、その部分のみ手計算でカウントするかもしくは、OCRソフトを使ってカウントしましょう。

原稿がウェブサイトの場合

翻訳が必要な原稿がウェブサイト(HTMLほか)の場合、ボリュームカウントの前にまず「カウントする必要のあるページや箇所を決める」作業が必要です。

なぜなら、LP(ランディングページ)などごく一部を除きウェブサイトは、

  • 通常何ページにも渡って構成されていること
  • 各ページにはリンクが複数設定されていること
  • メニューやバナーなど、同じ内容のテキストが繰り返し使用されていることが多いこと

といった理由から、カウントする必要のあるページを箇所を決めずにカウントすると、カウントした人によって結果が大きく変わる可能性があるからです。

尚、ウェブサイトでボリューム「カウントする必要のあるページや箇所を決める」には次のような方法があります。

  • ボリュームカウントするページのリスト(URL一覧表)を作る
  • ボリュームカウントするページを、1ぺージずつPDFファイル形式に出力する

尚、リスト(URL一覧表)を作成する場合はあらかじめ、

  • クリックした際に表示されるページに含まれるすべてのテキストを対象とする
  • バナーやテキストリンクから遷移した先のページは含まない
  • グローバルメニューはトップページのみを対象とする

といった取り決め(定義付け)をしておくことも寛容です。

ボリュームカウントするページや箇所さえ決めることができたらあとは、

  1. ページをPDFファイル形式に出力→テキストをコピー
  2. Microsoft Wordファイルにテキストをペースト
  3. Microsoft Wordの「文字カウント機能」でボリュームカウント

という流れは、前述のWordやExcel、PowerPointなどと同じです。

まとめ

以上が「【必読】文字数・単語数のカウント方法」でしたがいかがでしたでしょうか。

翻訳料金を決定付ける三大要素のひとつである「ボリューム」は、そのカウント結果によって翻訳料金が大きく変動するもっとも大切なものです。

ボリュームカウントを間違えると重大な問題が発生する可能性があるため、細心の注意を払うようにしましょう。

もっと詳しいご説明が必要な場合は、どうぞお気軽にお問い合わせください!

お問い合わせボタン