文書の電子化でビジネスのコスト&クオリティを革新する

HOME » 文書電子化に関する用語集

文書電子化に関する用語集

文書とは、一般的に書類・資料・図面・伝票など紙に書かれたものを指しますが、これらの紙文書をスキャナなどで電子化した文書を「電子化文書」といいます。文書のデータ化(電子化)について、知っておくと便利な用語をまとめました。

文書の電子化に関する用語集

  • OCR
    光学式文字読取装置(Optical Character Reader)の略。手書き文字や印字された文字を光学的に読み取って、形状に基づいて文字を識別後、文字データへ変換する仕組みのことです。
    一般的には、スキャナで読み取った画像をパソコン上で文字データに変換します。手書き文書については精度があまり良くないのですが、ワードなどで作られた活字に関しては高精度で再現出来ます。
    その他に、表レイアウト・フォント・文字の大きさ、文字の擦れ具合、スキャニング解像度など、様々要因で文字認識精度は変わってきます。
  • COM
    Computer Output Microfilmlingの略で、コンピュータで処理したデータ(ビット信号)を、人が認識できる文字や数字に変換して、それをマイクロフィルムに記録する方法です。また、それらが記録された装置やフィルムのことも言います。
    COMは、ISOやJIS規格に準拠しており、永年保存が可能なので、リスク管理に最適なメディアとして、金融機関、官公庁、一般の企業等、あらゆる分野で広く活用されています。
  • タイムスタンプ
    広い意味では、「電子データに記録されている、作成・更新した日時の情報」のこと。
    法的証拠能力を高めるためのタイムスタンプという意味では、「電子データに対して、第三者機関が正確な日時情報を付与し、その時点での電子データの存在時刻証明と完全性証明を行う仕組みや技術のことになります。また、電子データにタイムスタンプを付与することで、「存在時刻」と「完全性」を証明できます。
    【存在時刻証明】
    生成時刻以前に確かに存在したことを証明する
    【完全性証明】
    タイムスタンプ付与時の状態を保持していることを証明する
  • 電子署名
    電子データは、痕跡を残さず簡単に改ざんしたりコピーしたりすることができ、本人性の電子署名とは、電子データに対しておこなわれる電子的な署名です。
    電子データを特定の暗号方式と鍵でコード化することで、「本人性」と「完全性」を証明することができます。
    【本人性証明】
    電子データ作成者を特定する
    【完全性証明】
    署名がなされてから作成者を含む誰も電子データの改ざんをしていないことを証明する
  • ファイルフォーマット
    コンピュータなどで利用するファイルの保存形式のこと。文書、音声、画像、動画などのさまざまなメディアのファイルを、特定の利用方法やアプリケーションソフトウェア上で共通に扱えるようにするための形式や規格です。
    以下に、電子化した文書データで一般的に使われているファイルフォーマットをいくつか紹介します。
    【PDF形式】 
    Adobe(アドビ)社が開発した文書フォーマットで、OCR処理した透明テキストを埋め込んで検索性を高めたり、ファイルにパスワードをかけてセキュリティを高めたりすることも可能です。
    【XDW形式】
    富士ゼロックス社が開発した文書フォーマットで、動きが軽いことが特長です。機能はPDF形式に似ていますが、日本のオフィスワークを考えて作られているので、日本では300万本以上販売され根強いファンが多くいます。
    ただし、海外ではあまり知られていないフォーマットなので、海外にファイルを送付する方にはおすすめできません。
    【TIFF(G4圧縮)形式】 
    カラー画像には対応しておらず、モノクロ画像の保存に多く使われる画像フォーマットです。圧縮率が高いので、ファイルサイズの軽減が期待できます。圧縮方式は可逆圧縮を用いており、この方法なら画像が劣化することはありません。
    次で説明するJPEG形式と異なり、1つのファイルに複数のページを保持する(マルチページ)機能があります。また、国際規格なのでモノクロ画像の長期保存に向いています。
    【JPEG形式】
    カラー画像の保存によく使われる画像フォーマットです。圧縮率が任意に指定できるので、ファイルサイズの軽減と画質のバランスをとることができます。
    圧縮方式は非可逆圧縮で、この方法では保存をする度に画質が劣化していきます。一度画質を落とすと元に戻すことはできません。1つのJPEGファイルは画像を1つ保持するので、複数ページには対応していません。
    また、モノクロ画像をJPEG形式にすると、画像が荒れるのでおすすめできません。
  • マイクロフィルム
    一般文書や設計図面などを保存するための、1/5~1/40に縮小撮影された写真フィルムのことです。投影にはマイクロフィルムリーダーという専用の機材を用いますが、印刷機能が搭載されていれば、原版と同じサイズでの印刷が可能です。
 
文書の電子化サービス選びガイド