テキスト化の費用感は、お電話では難しい

2018.04.26

先日、電子化を依頼するなら電話かサンプルを作成してもらって検討しようという記事を公開しましたが、一つ注意点がありました。

<そのままスキャンHP
そのままスキャンへ

そのままスキャンでは、テキスト化のお問合せでお電話をいただく際『ページ数を言うから口頭で概算見積りを出してもらえないか?』とのご要望をいただくことがあります。お客様として予算や時間のリミットがございますから、折り返しの連絡や原本送付の前にざっくりと費用を掴んでおきたい、というのは非常に理解が出来ます。

実は、これはかなり難しいのです。

OCRの精度と書籍の状態

劣化した本

OCRの精度は最大95%。但し書籍の状態や内容に応じて激しい下落があります。その下落が起こらないよう、あるいは誤認識があっても後から校正で直せるようにする為に諸々の作業が発生することとなり、結果としてテキストデータの作成にかかる料金が上がってしまうケースがあります。

『状態』というのは単に痛みや文字の掠れといった経年劣化に限らず、

  • 文章のレイアウト
  • 化学式やレ点など細かい文字があるか
  • 図表が入っているか
  • 旧字が混じっているか
  • マイナーな外国語が書かれているか …等

といった、書籍のコンテンツの状態も含まれます。

そのままスキャンはじめ、OCR処理やテキスト化をサービスとして提供している業者は『何がOCRソフトの精度を高め、狂わせるのか?』について熟知しています。しかしその判断はあくまで原本を目で具に確認することで初めて出来ることで、口頭で承った書籍の情報だけでは、正確なお見積り額を申し上げることは厳しいと言わざるを得ません。痛みやコンテンツを直に見なければお約束出来ないのです。更に言えばお客様の考える『書籍の状態の情報』や『テキスト化において重要となる情報』に違いが生まれてしまうことも考えられます。

もちろんお電話でも、いただいた情報を元にさっとお見積りを出すことは出来ます。しかしその金額が正式なお見積り額と乖離する可能性が高いことも私たちは知っています。はじめに安い金額を算出してしまい、実際に原本を確認してみたらすごい金額になってしまった、ということも十分に考えられることなのです。

スマホで撮影すればOK

本をスマホで撮影

すると、わざわざ対象書籍を直に見てもらわなければ概算の費用すら分からないのでしょうか。実は一つだけ方法があります。

書籍ではなく、そのページ画像を送ればある程度の費用感を知ることが出来ます。

画像と言っても勿論全ページではなく、そのうちの数ページ分の画像が数枚あればOKです。スマートフォンで撮影したレベルでも問題ありません。

もちろんざっくりとした値ではありますが、実際の画像があれば『ここのレイアウトが複雑で、OCR処理を掛けた後に修正が必要だから…』『この部分は問題なく読み取れそう』といった算出を担当者の方で出すことが出来ます。

少し注意点があるとすれば、ページによって文字量に大差がある場合、その中間の文字量のページ写真を送っていただくか『最大文字量』と『最小文字量』のページ写真をそれぞれ送っていただく必要があること。文字量やレイアウトによってテキスト化までの作業量が変わってくる為です。

そのままスキャンの場合ご依頼は無料。冊数やページ数の下限を設けておらず、1冊1ページから承っております。概算見積りなので基本的にはその日、夕方以降にいただいた場合は遅くとも次の日中にはご連絡可能です。ただしそれでも『概算』の金額であることをご承知置きください。

弊社に限らず、お願いする前にテキスト化の費用感が知りたい方は、まず業者に一度画像をお見せした方が確実です。

実は少ないOCR処理の修正サービス

OCRサービス

通常スキャニング代行を運営している事業者は、同時にOCR処理のサービスも展開していることが多いです。しかし多くはOCRソフトで読み取るだけ、もしくは一度校正を入れる程度で、複雑なレイアウトに合わせてソフトを調整したり、複数人で文字を校正するレベルまで徹底して提供しているのは限られています。

一方で修正や校正まで行うサービスの場合、どこで誤認識が出るのか?どうやって直せばいいのか?という『OCR処理後のこと』まで十分に考慮しなければなりません。端的に言えば見通す範囲が広く、見積算出に必要な判断材料が増えるため、自然とOCRや校正に関するナレッジも増えてきます。もちろん、これは実際に電子化やOCR処理の作業を担うスキャニング担当ではなく、窓口である営業などのお話です。

テキスト化やその校正サービスの費用感にお悩みの方は、単なるOCRソフトだけでなくその先について詳しいプロフェッショナルへ一度相談してみることをお勧め致します。

追記:テキスト化の精度が更にアップ

新サービスが始まりました

2018年10月、それまでOCR処理のサービスにまとめられていたテキスト化サービスを独立させ『そのままテキスト化』としてリリース致しました。

従来のOCR処理→1人校正、3人校正+校正システムの併用サービスに加え、今回更にテキストデータの精度を高めた『テキスト化プレミアム』を公開。プロフェッショナルの校正者によるテキスト校正の作業を追加したことにより、何と99.99%の精度を実現しました。

詳しくは『そのままテキスト化』をご覧ください。