OCR処理サービス

OCR処理サービス

OCR処理サービスについて

OCR処理をすると・・・

画像データ(文字画像)をテキストの文字データとして認識します。このことにより大量 のPDFデータ、スキャニングデータの中から特定の文字を検索キーとして一瞬で検索 が可能になります。

OCR化のメリット

多くのスキャニングデータの中から、特定のページ、特定の文字を探すことができます。 透明なテキストデータの為、見た目は原稿のままです。

但し次の条件をいずれも満たしている必要がございます。

  • 原稿の画像データは「PDF」「JPEG」「TIFF」であること。
  • 手書き文字ではないこと。
  • 解像度は300dpi以上であること。(400dpi推奨)

※OCR処理は原稿の汚れ、コピーの状態、文字の大きさ、フォントの種類、ページのレイアウトなどによって認識率が異なります。
※OCR処理後の文字校正費は別となっております。

納品の形式

納品形式は、透明テキスト付きPDF、テキストファイル(txt)、EXCEL、WORDが可能です。
※EXCEL、WORD形式は、テキストボックスのレイアウトになります。

OCR処理によってテキストを抽出する作業

  • 自動認識での抽出・・・文章の順序には並びませんが、コスト面が安価です。テキスト抽出後、お客様での修正活用される際に
    便利です。
  • 文章順認識の抽出・・・ご指示いただく文章(記事)の順に認識させます。コスト面は若干上がりますが、抽出後、お客様での
    修正負荷が大きく減ります。
  • 抽出後の文字校正・・・自動認識、あるいは文章順認識によって抽出したテキストを1文字ずつ修正し、完全なテキストに致しま
    す。価格は大きく上がりますが即活用できるメリットがあります。

OCRの料金表