pdf、txt、ai…色々なデータ形式をまとめて解説

2019.09.09

電子データのファイル形式には数多くの種類があり、どれがどのような役割を持っているのか、混乱している方も多いのではないでしょうか?そのままスキャンはデータ化の企業なので、テキストから画像まで実に様々な拡張子に触れることとなり、当然それらの知識や使い分けも熟知しています。しかし大半の方はあまり詳しくご存じないかも知れません。

そこで本記事では、各形式のジャンルごとにどんな電子データがあるのか纏めてみました。各形式の拡張子や、どこで使われているのかについても合わせて触れていきます

電子データのファイル形式について分からないことがあったら、ぜひその都度本記事を参考にしてくださいね。

画像

画像データ

まずは、画像関連のファイル形式についてご紹介していきます。主に、イラストや写真などに使われているファイル形式です。

画像のファイル形式は、以下のものが主要となっております。

  • BMP形式
  • JPEG形式
  • TIFF形式
  • PNG形式

他にもいくつか存在しますが、これだけ覚えておけば問題はありません。

BMP形式

BMP形式とはwindowsの標準的な画像ファイル形式のことです。読み方は「ビーエムピー」となり「bitmap」を略したものとなっています。

BMP形式のファイルは、拡張子が「.BMP」になっています。

マイクロソフト社のwindowsで画像データを取り扱うために使われている形式であり、点の集まりで画像を表現しています。画像の色は、6色、256色、1677万色までをサポートしています。

JPEG形式

JPEG形式とは、gif、pngと並ぶ有名な静止画ファイル形式の1つです。読み方は色々ありますが「ジェイペグ」と呼ぶのが一般的で、「Joint Photographic Experts Group」を略したものとなっています。Joint Photographic Experts GroupとはJPEG形式を生み出した組織の名称です。

JPEG形式のファイルは、拡張子が「.jpg」か「.jpeg」になっていることが多いです。

JPEG形式のメリットとして、PNGよりも画像の圧縮率に優れていることが挙げられます。また、GIFのような色数制限もありません。

こういった特徴を持っているため、デジタルカメラの多くはJPEGでの保存を標準としています。

TIFF形式

TIFF形式も静止画ファイル形式の1つであり、こちらも一部のデジタルカメラが画像記録に対応しています。読み方は「ティフ」となり「Tagged Image File Format」を略したものとなっています。

TIFF形式のファイルは、拡張子は「.tif」もしくは「.tiff」。マイクロソフト社とアルダス社によって開発されました。

ビットマップ画像(ピクセルを用いたもの)を保存するための形式であり、タグ情報を追加することで様々な形式を扱うことができます。ソースやバイナリが公開されていることもあって、多くのグラフィックソフトが対応しています。

そのままスキャンでは、主に絵画スキャニングなど高解像度かつ大型の資料のデータ化で用いられることが多いですね。

PNG形式

PNG形式とは、web上で使われることを前提として開発された画像ファイル形式です。読み方は「ピング」となり「rtable Network Graphics」を略したものとなっています。

PNG形式のファイルは、拡張子が「.png」になっています。

GIFの代わりにWeb上で普及されることを目指して開発されたため、GIF形式よりも利点が多いのか特徴です。JPEG形式に比べるとファイルが大きくなってしまいますが、、圧縮しても画像が劣化しにくいのがメリットです。写真よりも、色の境界がはっきりしているイラストの圧縮の方が向いていると言われています。余談ですが、そのままスキャンのHPで使用しているイラストは全てPNG形式です。

テキストファイル

ここからはテキストファイルの形式について説明していきます。テキストファイルの形式には、以下のものが存在します。

  • テキスト形式
  • PDF形式
  • CSV形式
  • ASP形式
  • XML形式

テキスト情報を示すものでもこれだけの種類があります。1つずつどのような特徴を持っているか説明していきます。

テキスト形式

テキストデータ

テキスト形式とは、コンピュータが読む用のデータではなく、人間が読むための文字データのことを一般的に指します

テキスト形式の中には、コンピュータに向けられたコードを一部分だけ含んでいるものはあります。例えば、htmlタグが挿入されたHTML形式も、テキスト形式の一部に含まれます。

逆に、コンピュータに対する指示を一切挟んでいないものは、プレーンテキストと呼ばれることがあります。プレーンテキストの場合、拡張子は「.txt」であることが多いですが、特に決められているということでもありません。

PDF形式

PDF形式とは、アドビ システムズ社が開発した文書表示用のファイル形式のことです。読み方はそのまま「ピー ディー エフ」であり「Portable Document Format」の略になります。

テキスト情報だけでなく、画像やフォントの情報もPDFの中に含まれています。拡張子は「.pdf」であることが多いです。

PDF形式のメリットとして、パソコンの機種に関わらず、書類を同じレイアウトで表示させられることです。パワーポイントなどの資料は他のパソコンだとレイアウトが崩れる場合があるため、プレゼンをする場合は念の為、PDF形式にした物も用意する場合が多いです。

また、同社が無料で提供しているAdobe Readerを使えば、容易にファイルを表示したり印刷したりすることが可能です。

一般的に書籍を電子化すること=PDF化と言い換えられることも多く、言うまでもなくビジネスシーンでは非常に活用されているフォーマットです。

CSV形式

CSV

CSV形式とは表計算ソフトで開くために用いられる、データをカンマや改行で区切って並べてあるファイル形式のことです。読み方は「シー エス ブイ」であり「Comma Separated Values」の略になります。

拡張子は「.csv」であることが多いです。表計算だけでなく、エディタやメモ帳などでも編集することは可能です。

カンマや改行でデータを区切ることによって、セル間やフィールド間を表しています。また、改行をすることで1レコードを表してもいます。

CSVについてはこちらの記事で詳しく解説しています!

ASP形式

ASP形式とは、スクリプト埋め込みが可能なHTMLファイルのことです。読み方は「エー エス ピー」であり、「Active Server Pages」の略になります。

拡張子は「.asp」であることが多いです。

ASPとは、Microsoft社のサーバーに対する機能として提供されるもののことです。ASPを使うことで、ホームページを作る際に便利な機能が利用できるようになります。

例えば、ホームページに表示する内容を条件によって変更したり、あるいはページに関するデータの集計を行ったりすることが可能になります

XML形式

XML形式とは、ファイルにデータを書き込む際の記述形式のことです。種類が異なるソフトウェアの間でデータを交換するために使われます。読み方は「エックス エム エル」であり、「eXtensible Markup Language」の略になります。

拡張子は「.xml」であることが多いです。

XMLは、データを分かりやすく書き込んで管理することが可能です。タグを利用することで、文章の構造やタイトルを表現することができます

ありとあらゆるソフトウェアがXML形式を読み込むことができます。なのでデータを一度、XML形式に変換した後に、他のソフトウェアに移動させることができるのです。

Microsoft Office

MOS

続いて、Microsoft Office製品で使われているファイル形式についてご紹介します。Microsoft Office製品とはMicrosoft社が提供している、事務作業などで使われている有名なソフトのことです。

主に使われているファイル形式は、以下の通りです。

  • WORD
  • Excel
  • PPT
  • Access

みなさんも使ったことがあるものが多いのではないかと思われます。

Word

Microsoft Wordで使われているファイル形式のことです。

一般的にはそのまま「ワード」と呼ばれることが多いです。拡張子は「.docx」が現在主流となっていますが、昔は「.doc」であったり、「.dot」であったりすることもありました。

今更説明するまでもありませんが、Wordでは主に、高機能な文章を作成することが可能になります。文章のフォントや大きさを変更したり、画像を挿入したりすることができます。見出しも目次作成も可能であり、更には複雑な表の作成も可能です。

Excel

Excel

Microsoft Excelで使われているファイル形式のことです。一般的にはそのまま「エクセル」と呼ばれることが多いです。

拡張子は「.xls」や「.xlsx」が現在主流となっています。

WORDが文章を作成するソフトなのに対し、Excelは表計算をするためのソフトになっています。ただ表を作成できるだけでなく、表の中の数値を計算することに特化しており、簡単に答えを出すことができます。

主に「関数」と呼ばれるものを使って、様々な複雑な計算を行うことができるようになっています。

また、表を並び替えたり、グラフとして表示させたりといった応用的な表現も自由に行うことができます。

PPT

Microsoft PowerPointで使われているファイル形式のことです。「ピーピーティー」とそのまま読むことが多いです。

拡張子は現在「.ppt」が主流になっており、かつては「.pptx」と「.pptm」が一般的になっていました。

PowerPointは主にプレゼンテーションを行うためのソフトになっています。数多くのスライドを作成することができ、それを順番に表示していくことができます。スライドには文章の他、画像やグラフなども挿入することが可能です。また、アニメーション機能を用いることで、スライドの文字を動かしたりすることもできます。

Access

Microsoft Accessで使われているファイル形式のことです。一般的にはそのまま「アクセス」と呼ばれることが多いです。

拡張子はAccess2003までは「.mdb」が使われ、Access2007以降では「.accdb」が使われています。

Accessは、データベースソフトであり、その中でも大量のデータを扱うことが可能です。データの集まりを表として管理し、テーマごとに複数の表を作成することもできます。また、データをすぐに探せるようソートや検索も容易に可能になっています。

データの保存はExcelもちろん可能ですが、ExcelだとAccessほど大量のデータを扱うことはできません。Accessはアプリケーションを利用しているユーザーの情報を管理したりするなど、企業で使われることがほとんどです。

なお、Accessが保存できる最大データサイズは2GBほどとなっています。

Adobe系

Adobe

最後にAdobe系についてご紹介していきます。ここで紹介するファイルは、いずれも通常の事務作業では使われない、逆にそのままスキャンのように画像編集や修正を行う者にはお馴染みの形式です。

Abodeとはソフトウェア企業の1つであり、画像編集ソフトウェアを提供しています。Adobe系のファイル形式には、以下のようなものがあります。

  • AI形式
  • INDD形式
  • PSD形式
  • EPS形式

専門分野で使われているものもあり、恐らく知らないものがほとんどの方が多いと思われます。分かりやすく説明していきます。

AI形式

AI形式は、Adobe Illustratorで使われている画像データのファイル形式のことです。

読み方はそのまま「エーアイ」で、拡張子は「.ai」。

Adobe Illustratorは数多くのデザイナーが使っており、イラストを作成したり、編集したりすることが可能です。イラストは縮小したり、回転させたりすることもできます。また、Illustratorで作ったテキストの書体を変えたり、行間や行揃えをしたりすることも可能です。

INDD形式

INDD形式は、Adobe InDesignで使われているファイル形式のことです。

読み方はそのまま「アイ エヌ ディー ディー」で拡張子は「.indd」であることが多いです。

Adobe InDesignはAdobeが提供しているDTPソフトウェアのことです。

DTPソフトウェアとは、パソコンでデータを作成して、印刷物を制作することを目的としています。原稿や編集やレイアウト、版下の作成、印刷まで、全てDTPで行うことができるため、出版業界で多く扱われています

従来印刷物作成には多くの人手が必要であった所を、DTPの導入により1人で素早く行うことが可能になりました。

PSD形式

PSD形式は、Adobe Photoshopで使われているファイル形式のことです。読み方はそのまま「ピー エス ディー」で拡張子は「.psd」となっています

Adobe PhotoshopはAdobeが提供している画像編集ソフトであり、世界中で使われています。

Adobe Photoshopなら、写真を加工したり合成したりすることが容易で、美しいグラフィックの作成に役立ちます。更には手書きイラストに色をつけたり、プレゼンテーション資料の作成にも利用している人が多いです。

EPS形式

EPS形式は、Encapsulated PostScriptの略であり、PostScriptで使われてるファイル形式のことです。

読み方はそのまま「エス ピー エス」で、拡張子は「.eps」となっています。

PostScriptは一般的にPSと略され、1984年に開発されたページ記述言語のことを指します。

ページ記述言語とは、プリンターに描画の指示を出すためのプログラミング言語のことです。文章や画像を印刷する際に、ページ記述言語使って「どの色で印刷するか」、「どの大きなで印刷するか」などを指示していきます。

PostScriptを使うことで、より高品質の印刷ができるようになります。こちらも出版業界やDTPの分野では非常に多く扱われています。

まとめ

データ形式

本記事では、電子データのファイル形式についてまとめてみました。本記事で書かれて内容を振り返るために、それぞれの電子データを以下に表にして纏めてみました。

こちらを参考にしてください。

ファイル形式 ファイル区分 用途
BMP形式 画像 windowsの標準的な画像ファイル
JPEG形式 画像 写真向き
TIFF形式 画像 ビットマップ画像用
PNG形式 画像 イラスト向き
テキスト形式 テキストファイル 通常ファイル
PDF形式 テキストファイル Adobe Readerで読める
CSV形式 テキストファイル 表計算ソフト用データ
ASP形式 テキストファイル Microsoftアプリケーションサービス用
XML形式 テキストファイル ソフトウェア間でデータを交換する用
WORD Microsoft Office Microsoft Word用
Excel Microsoft Office Microsoft Excel用
PPT Microsoft Office Microsoft PowerPoint用
Access Microsoft Office Microsoft Access用
AI形式 Adobe系 Adobe Illustrator用
INDD形式 Adobe系 Adobe InDesign用
PSD形式 Adobe系 Adobe Photoshop用
EPS形式 Adobe系 PostScript用

電子データには本当に数多くの種類があることが分かって頂けたかと思っております。これらの電子データのうち、最適な形を選び、その都度変換していくのは非常に大変なことです。

コンピュータに明るくない人にとって、上記で挙げたようなデータ形式を扱っていくのは難しいかもしれません。電子データの作成、編集は、プロフェッショナルに任せた方がより品質の高いものに仕上がることが多いでしょう

そのままスキャンでは、上記他様々なデータ形式に精通しているため、スキャニングして作成した電子データをお客様の目的に応じて最適な形に変換し、納品することが可能です。

電子データの作成に関するノウハウが充実しており、これまで様々な企業向け資料の作成に取り組んできました。例えば紙の名簿をリストしビッグデータ化したいという方にはExcelに変換し、また電子化した書籍を将来編集可能にしたいとお考えの企業様にはINDD形式でデータを納品しました。このように、単なるスキャニングに留まらずその先の『データ活用』までお手伝いするのが、そのままスキャンなのです。

通常、自炊代行をはじめとした電子化代行会社は、資料の電子化までは行えても、最適な電子データに変換する所まではできないことが多いです。資料に即した最適な形式で電子データを作成したい場合は、是非そのままスキャンに電子化をご相談くださいませ。