PDFの中に必要な写真がどこかにあります。パンフレットの商品画像、メディアキットのロゴ、論文の図、スキャンされた文書に埋め込まれた家族写真かもしれません。画像はそこにあり、ページ上で見ることができますが、PDFでは右クリックして保存することができません。

これはPDFで最もよくある不満の一つです。この形式は、個々の要素を抽出するためではなく、一貫したドキュメント表示のために設計されています。PDF内の画像は、PDFの内部構造内に元の形式（JPEG、PNG、または生のビットマップ）で個別のオブジェクトとして埋め込まれています。それらを取り出すには、その構造を読み取り、各画像オブジェクトを個別に抽出できるツールが必要です。

朗報：適切なツールを使えば、PDFから画像を抽出するのは簡単で、抽出された画像は元の解像度と品質を維持します。その方法を以下に示します。

How to extract images from a PDF - pull out photos, logos, and graphics at original quality

抽出と変換：重要な違い

さらに進む前に、「画像を抽出する」とは実際には何を意味するのかを明確にしておく価値があります。なぜなら、人々はしばしばそれを「画像に変換する」と混同するからです。

画像を抽出するとは、PDF内に埋め込まれた個々の画像オブジェクトを取り出すことです。PDFに3枚の写真と1つのロゴが含まれている場合、抽出によってそれら4つのファイルが、元の埋め込み解像度で正確に取得されます。ページのスクリーンショットではなく、生の画像が得られます。

PDFを画像に変換するとは、ページ全体を画像としてレンダリングすることです。ページ上のすべての要素（テキスト、画像、背景、境界線）が単一の画像の一部になります。これは、各ページのスクリーンショットを撮るようなものです。

プレゼンテーションスライドなどのためにページ全体を画像として必要な場合は、PDFから画像へを使用してください。元の品質で個々の写真、ロゴ、グラフィックを取り出したい場合は、画像抽出が必要です。そして、このガイドで説明するのはその方法です。

PDF内に画像が保存される仕組み

PDFが画像をどのように保存するかを理解すると、抽出が実際に行うことと、なぜ品質が維持されるのかを説明するのに役立ちます。

PDFファイルは基本的にコンテナです。テキスト命令は、レンダラーに文字をどこに配置するか、どのフォントを使用するか、ベクトルグラフィックをどのように描画するかを指示します。しかし、画像は異なって保存されます。それらはPDFのクロスリファレンス構造内に個別のバイナリオブジェクトとして埋め込まれています。

各埋め込み画像には独自のプロパティがあります。

解像度： 元の画像のピクセル寸法（例：2400 x 1600ピクセル）
色空間： RGB、CMYK、グレースケール、またはインデックスカラー
圧縮： JPEG、JPEG2000、Deflate（PNGスタイル）、CCITT（白黒用ファックススタイル）、またはJBIG2
ビット深度： 通常はチャンネルあたり8ビットですが、プロフェッショナルな作業ではそれ以上になることもあります。

PDF作成者が写真を埋め込むと、完全な画像データがファイルに保存されます。ページレイアウトが画像を2インチのサムネイルに縮小しても、元の4000 x 3000ピクセルの画像はPDF内に残っています。抽出は、そのフル解像度の画像を取得します。

これが抽出が非常に価値がある理由です。選択したDPIでスクリーンショットを撮るのではなく、ネイティブ解像度で、埋め込まれたときの元の画像を取得しているのです。

PDFSubで画像を抽出する方法

PDFSubの画像抽出ツールは、PDFSub Engineを使用してサーバー上でPDFを処理します。このエンジンは内部構造を読み取り、埋め込まれた各画像オブジェクトを抽出します。

ステップバイステップの手順

ステップ1：ツールを開く。 pdfsub.com/tools/extract-imagesにアクセスします。

ステップ2：PDFをアップロードする。 ファイルをドラッグアンドドロップするか、クリックして参照します。ファイルはPDFSubの安全な処理サーバーにアップロードされます。

ステップ3：抽出を開始する。 抽出ボタンをクリックします。PDFSub EngineはPDFの内部構造をスキャンし、すべての埋め込み画像オブジェクトを特定して、それぞれを抽出します。

ステップ4：レビューしてダウンロードする。 各抽出画像のプレビュー（形式、寸法、ファイルサイズ）が表示されます。個々の画像をダウンロードするか、すべてをZIPファイルとして取得します。

抽出されるもの

抽出プロセスは、PDF内のすべての画像オブジェクトを見つけます。これには以下が含まれます。

写真： 元の解像度の埋め込みJPEG
ロゴとアイコン： 多くの場合、透明度付きPNGとして保存されます。
チャートとグラフ： ExcelやTableauなどのツールからエクスポートされた際に、通常はラスター画像として埋め込まれます。
スキャンされたページ背景： スキャンされたPDFの各ページは、技術的には1つの大きな画像です。
インライングラフィック： 小さな装飾要素、区切り線、背景パターン。

必要なもの	使用するツール
PDFからの個々の写真/ロゴ	画像抽出
ページ全体を単一の画像として	PDFから画像へ
PDFのすべてのテキストコンテンツ	PDFからテキストへ

ほとんどのユースケース（商品写真の復元、ロゴの再利用、古いドキュメントからの画像のサルベージ）では、抽出は「PDFで見える」から「必要なファイルがある」までの最も速い道です。

抽出の準備はできましたか？ PDFSubの画像抽出ツールを試してください。PDFをアップロードして、埋め込まれたすべての画像を数秒で取得できます。