PDFSub
料金MergeSplitCompressEditE-Sign銀行取引明細書
ブログに戻る
チュートリアルスキャンクリーンアップPDFOCR

スキャンしたPDFをきれいに修正する方法(ノイズ除去、ページの傾き補正)

2026年3月15日
PDFSub Team

スキャンしたPDFは、ページの傾き、背景のノイズ、文字のかすれなどで見づらくなりがちです。プロフェッショナルで読みやすい状態に修正する方法を解説します。


書類をまとめてスキャンしたものの、仕上がりが今ひとつだったことはありませんか?ページがわずかに傾いていたり、白い背景が黄色っぽくくすんで斑点や汚れが目立っていたり。紙の上では鮮明だった文字も、画面上ではかすれてぼやけて見え、スキャナーのガラスに密着しなかった部分には縁に沿って黒い影が忍び寄る……。

これがスキャンの現実です。高性能なスキャナーを使い、慎重に操作しても、完璧な結果を得るのは困難です。自動給紙中に紙がずれ、フラットベッドスキャナーは微細な埃まで拾い上げます。古い書類であれば、紙の黄ばみやインクの退色、物理的な損傷までもが忠実に再現されてしまいます。その結果、機能的には問題なくても、見た目が不自然で読みにくいPDFが出来上がってしまうのです。

スキャンしたPDFのクリーンアップは、こうした雑多なスキャンデータを、真っ直ぐなページ、白い背景、鮮明なテキストを備えたプロフェッショナルな文書へと変貌させます。さらに、クリーンなスキャンデータを使用することで、後でOCRを実行してテキストを検索・選択可能にする際の精度が劇的に向上します。

ここでは、スキャンしたPDFをきれいにする方法、各ステップの役割、そしてクリーンアップとOCRを組み合わせるべきタイミングについて解説します。

how to clean scanned pdf hero

なぜスキャンしたPDFにはクリーンアップが必要なのか

スキャン時に発生する問題の原因を理解することで、自分の文書にどのクリーンアップ手順が最も重要かを知ることができます。

傾き(ページの歪み)

書類がスキャナーを通過する際、わずか0.5度でも角度がつくと、画像は傾いて見えます。これは、ほぼすべての自動原稿送り装置(ADF)で多かれ少なかれ発生します。人間の目は傾きに対して非常に敏感で、わずか1度の傾きでも明らかに「曲がっている」と感じられ、文書全体の信頼性やプロフェッショナルな印象を損ねてしまいます。

また、傾きはOCRの精度にも悪影響を及ぼします。OCRエンジンはテキストが水平であることを前提としています。ページ全体が回転していると、テキスト検出アルゴリズムが行の境界を正しく認識できず、単語の混同、文字の読み飛ばし、段落の崩れなどの原因となります。

ノイズ(斑点や点)

スキャナーのノイズは、ガラス面の埃、高解像度でキャプチャされた紙の質感、センサーの電気的ノイズ、光学系のアーティファクトなど、さまざまな要因で発生します。その結果、ページ全体にランダムな点や斑点が散らばり、特に白い背景部分で目立ちます。

ノイズは余白や行間に視覚的な乱雑さを生むだけでなく、OCRにおいても問題となります。ノイズの点が句読点や記号、あるいは文字の一部として誤認されることが多く、OCRエラーの一般的な原因となっています。

文字のかすれ

時間はインクを退色させます。レーザープリントは比較的長持ちしますが、インクジェットプリントやコピー、カーボンコピーなどは著しく薄くなります。比較的新しい書類でも、トナーの残量によって色の濃い部分と薄い部分が混在し、印字密度が不均一になることがあります。

かすれた文字は画面上で読みにくく、印刷してもきれいに仕上がりません。また、OCRアルゴリズムが文字を正確に識別するにはテキストと背景の明確なコントラストが必要なため、かすれは認識率を低下させます。

黒い縁と影

用紙がスキャナーの表面全体を覆っていない場合や、本の背表紙によって影ができる場合、スキャンデータには黒い縁や影が写り込みます。これらはスキャン過程で生じる不要な産物であり、印刷時にトナーを浪費するだけでなく、文書がいかにも「コピーのコピー」という印象を与えてしまいます。

不均一な背景

紙は完全な白ではありません。古い書類は黄ばみ、再生紙は灰色がかっています。色付きの用紙もあります。スキャンすると、これらの背景のバリエーションがピクセルデータとして保存され、可読性には寄与しないままファイルサイズを増大させる原因となります。


4つのクリーンアップステップ

PDFSubのスキャンPDFクリーンアップツールは、特定のアーティファクトをターゲットにした4つのステージで文書を処理します。

ステップ1:傾き補正(デスクイュー)

各ページの主要なテキストの角度を検出し、画像を回転させてテキストを完全に水平にします。アルゴリズムがページ全体の暗いピクセル(テキスト)の分布を分析し、必要な回転角度を決定して、1度未満の精度で補正を適用します。

ほとんどのページは0.3度から2度程度の補正を必要とします。このプロセスは自動で行われるため、角度を指定する必要はありません。各ページが個別に分析・補正されるため、3ページ目が左に、7ページ目が右に傾いているような文書でも、すべて正しく修正されます。

効果: 斜めに見えていたテキスト行が完全に水平になります。改善は一目瞭然で、文書の見た目が格段にプロフェッショナルになります。

ステップ2:ノイズ除去(デノイズ)

文書の内容ではない、孤立した小さなマークを特定して除去します。アルゴリズムは、サイズ、形状、文脈に基づいて、ノイズ(ランダムな小さな点)と実際の内容(テキスト、線、画像)を区別します。

ここでの課題は、ピリオド、カンマ、小数点、記号などの重要な詳細を損なわずにノイズだけを取り除くことです。PDFSub Engineは、周囲の状況を考慮する適応型しきい値処理を使用しています。例えば、白い余白の真ん中にある小さな点はノイズと判断し、文末にある小さな点はピリオドとして保持します。

効果: 背景がきれいになり、余白がすっきりして、文書全体の「ざらつき」が軽減されます。ノイズの多いスキャンデータでは、劇的な改善が見られます。

ステップ3:コントラスト強調

テキスト(暗い部分)と背景(明るい部分)の差を大きくします。これにより、かすれた文字が読みやすくなり、コンテンツと背景が視覚的に明確に分離されます。

この強調は適応型であり、画像の局所的な特性に基づいて強度を調整します。太字のセクションには控えめに、かすれた薄い文字のセクションには強めに適用されます。これにより、すでに濃い文字が潰れてしまうのを防ぎつつ、薄い文字を読みやすい濃さまで引き上げます。

効果: テキストがより鮮明に、より黒く見えます。かすれていた部分が読めるようになり、背景はより明るく均一になります。

ステップ4:縁のクリーンアップ(黒いエッジの除去)

スキャンしたページの端にある暗い領域(スキャナーの蓋の影、スキャンエリアより小さい紙による黒い枠、本の背表紙の影など)を検出して除去します。

アルゴリズムがページ内容の境界を特定し、その外側にあるものをすべてクリーンな白に置き換えます。ヘッダー、フッター、余白のメモなど、ページの端まであるコンテンツは保持しながら、不要なアーティファクトだけを取り除きます。

効果: 黒い縁が消え、ページ全体の余白が均一になります。印刷しても、邪魔な黒枠が出ることはありません。


PDFSubでスキャンしたPDFをきれいにする方法

操作手順

ステップ1:ツールを開く。 pdfsub.com/tools/clean-scan にアクセスします。

ステップ2:スキャンしたPDFをアップロードする。 ファイルをドラッグ&ドロップするか、クリックして選択します。PDFはPDFSubの安全な処理サーバーにアップロードされます。

ステップ3:クリーンアップオプションを選択する。 適用するステップを選択します。デフォルトでは4つすべてが有効になっていますが、必要に応じて無効にすることもできます。通常、4つすべてを適用するのが最も良い結果につながります。

ステップ4:処理を実行する。 クリーンアップボタンをクリックします。PDFSub Engineが各ページを選択されたステップで処理します。処理時間はページ数と解像度によりますが、1ページあたり約2〜3秒が目安です。

ステップ5:確認してダウンロードする。 クリーンアップされたページをプレビューして結果を確認し、PDFをダウンロードします。

設定をカスタマイズすべきケース

傾き補正を無効にする: 高性能スキャナーですでに完璧に整列されている場合や、意図的に斜めに配置されたコンテンツ(斜めの透かしなど)を維持したい場合。

ノイズ除去を無効にする: 点描画、網点写真、または意図的にテクスチャ加工された背景を持つ文書など、ノイズと間違われやすい微細な詳細が含まれている場合。

コントラスト強調を抑える: 元のスキャンのコントラストがすでに十分な場合。強調しすぎると、テキストが意図したよりも太く見えることがあります。

縁のクリーンアップを無効にする: ページの端ギリギリまでコンテンツがある場合や、黒い縁の中に有用な情報(トンボやレジストレーションマークなど)が含まれている場合。


クリーンアップとOCRの組み合わせ

スキャンしたPDFをクリーンアップする最大の理由の一つは、OCR精度の劇的な向上です。OCRエンジンは、文字の形状を既知のフォントデータベースと比較して分析します。ノイズ、傾き、低コントラスト、縁の影など、文字の形状を損なう要因はすべてOCRの精度を低下させます。

精度向上の効果

OCRを実行する前にクリーンアップを行うと、通常、文字認識の精度が5〜15%向上します。ノイズがひどい場合や傾きが大きいスキャンデータでは、その効果はさらに顕著になります。

  • 傾き補正だけで、OCR精度が3〜8%向上することがあります。OCRエンジンは水平な行を想定しているため、わずかな傾きでも単語の分断エラーの原因になります。
  • ノイズ除去は、誤認識を防ぎます。余白にあるランダムな点が、文字や句読点として誤って検出されることがなくなります。
  • コントラスト強調は、特に薄い文字において、OCRエンジンが背景と文字を区別するのを助けます。

推奨されるワークフロー

最高の結果を得るには、まずクリーンアップを行い、その後にOCRを実行してください。

  1. スキャンしたPDFをPDFSubのスキャンPDFクリーンアップツールにアップロードする
  2. クリーンアップされたバージョンをダウンロードする
  3. そのファイルをPDFSubのOCRツールにアップロードする
  4. 検索・選択可能なPDFをダウンロードする

この2ステップのプロセスは、元の状態のままOCRにかけるよりも、はるかに優れた結果をもたらします。


よくある利用シーン

オフィス文書のスキャン

最も一般的なケースです。契約書、手紙、フォーム、レポートなどをオフィスの複合機でスキャンした場合、ADFによる傾き、スキャナーによるノイズ、フラットベッドでの影などが発生しやすいため、4つのステップすべてを適用するのが理想的です。

書籍や雑誌のページ

綴じられた資料のスキャンには特有の問題があります。背表紙付近のページの歪みや影、綴じ角度による傾き、厚みによる黒い帯などです。これらには縁のクリーンアップと傾き補正が特に有効です。

歴史的・アーカイブ文書

古い書類には、紙の黄ばみ、インクの退色、フォクシング(経年による茶色の斑点)、物理的な損傷が見られます。コントラスト強調は、こうした文書の可読性を復活させるのに最も効果的です。ただし、歴史的に意味のある汚れがある場合は、ノイズ除去を慎重に行う必要があります。

領収書と感熱紙のプリント

レシートなどに使われる感熱紙は劣化が早く、スキャン結果も悪くなりがちです。文字が黒ではなく薄いグレーになり、紙面がまだら模様になることもあります。保存すべき微細な詳細が少ないため、強めのコントラスト強調とノイズ除去が効果を発揮します。

複数ページのフォーム

公的書類や税務書類、申込書などには、あらかじめ印刷された枠線や網掛けがあり、クリーンアップを難しくさせます。PDFSubのエンジンはこれらを適切に処理し、印刷要素を保持しながらノイズを除去し、フォーム全体を正しく整列させます。


よくある質問

クリーンアップによって文書の内容が変わることはありますか?

いいえ。クリーンアップはスキャン画像の視覚的な品質(傾き、ノイズ、コントラスト、縁の影)にのみ作用します。テキストや内容を追加、削除、修正することはありません。ページ上の情報はそのまま保持されます。

スキャンしたものではないPDFもクリーンアップできますか?

このツールは、各ページがラスター画像である「スキャンされたPDF」向けに設計されています。デジタル作成されたPDF(Wordからの書き出しなど)に適用しても害はありませんが、スキャン特有のノイズや傾きがないため、目に見える改善はほとんど期待できません。

クリーンアップでファイルサイズはどのくらい小さくなりますか?

状況によりますが、通常20〜40%ほど削減されます。ノイズ除去によって1ページあたり数千の不要なピクセルが消え、縁のクリーンアップで大きな暗い領域が除去されるためです。また、背景が均一になることで圧縮効率も向上します。例えば、80MBあった50ページのスキャン文書が、クリーンアップ後に50〜60MBになることがあります。

カラーのスキャンデータにも対応していますか?

はい。4つのステップすべてがカラー、グレースケール、白黒のスキャンに対応しています。カラーのスキャンでは、特に背景の正規化と縁のクリーンアップが効果的です。コントラスト強調も、色の情報を保持しながらテキストの可読性を高めるように適用されます。

結果が気に入らない場合、元に戻せますか?

クリーンアップは新しいファイルを生成するため、元のPDFが上書きされることはありません。結果に満足できない場合は、元のファイルを使用し直すだけです。そのため、クリーンアップ後のバージョンと一緒に、常に元のスキャンデータも保管しておくことをお勧めします。


まとめ

スキャンしたPDFのクリーンアップは、見づらいスキャンデータをプロフェッショナルな文書へと変える4つのステップから成ります。

ステップ 修正内容 効果
傾き補正 ページの傾き 真っ直ぐでプロフェッショナルな外観
ノイズ除去 斑点や点 清潔な背景、より鮮明なテキスト
強調 かすれた低コントラストの文字 読みやすく、印刷に適した仕上がり
縁のクリーンアップ 黒いエッジや影 均一な余白、不要な影の除去

各ステップは独立しており、オン・オフの切り替えが可能です。ほとんどのスキャン文書では、4つすべてを実行することで最高の結果が得られます。クリーンアップされたPDFはファイルサイズが小さくなり、見た目が美しくなるだけでなく、後で検索可能なテキストが必要になった際のOCR精度も劇的に向上します。

スキャンデータをきれいにしてみませんか?PDFSubのスキャンPDFクリーンアップツールをぜひお試しください。アップロードするだけで、数秒でプロフェッショナルな仕上がりが手に入ります。

ブログに戻る

ご不明な点がありますか? お問い合わせ

PDFSub

PDFやドキュメントに必要なすべてのツールを1か所に。高速、安全、そしてプライベート。

GDPR準拠CCPA準拠SOC 2 Ready
Powered by PDFSub Engine

PDFツール

  • PDF結合
  • PDF分割
  • ページ並べ替え
  • PDF回転
  • ページ削除
  • ページ抽出
  • 透かし追加
  • PDF編集
  • PDFスタンプ
  • PDFフォーム入力
  • ページ切り抜き
  • ページサイズ変更
  • ページ番号追加
  • ヘッダーとフッター
  • PDF圧縮
  • 検索可能にする
  • Clean Scanned PDF
  • Photo to Document
  • Auto-Crop PDF
  • PDF修復
  • メタデータ編集
  • メタデータ削除
  • PDFをWordに変換
  • WordをPDFに変換
  • ExcelをPDFに変換
  • PDFをPowerPointに変換
  • PDFを画像に変換
  • 画像をPDFに変換
  • HTMLをPDFに変換
  • HEICを画像に変換
  • WEBPをJPGに変換
  • WEBPをPNGに変換
  • PowerPointをPDFに変換
  • PDFをHTMLに変換
  • EPUBをPDFに変換
  • TIFFをPDFに変換
  • PNGをPDFに変換
  • PDFをPNGに変換
  • テキストをPDFに変換
  • SVGをPDFに変換
  • WEBPをPDFに変換
  • PDFをEPUBに変換
  • RTFをPDFに変換
  • ODTをPDFに変換
  • ODSをPDFに変換
  • PDFをODTに変換
  • PDFをODSに変換
  • PDFをSVGに変換
  • PDFをRTFに変換
  • PDFをテキストに変換
  • ODPをPDFに変換
  • PDFをODPに変換
  • ODGをPDFに変換
  • PDFビューア
  • PDF/A変換
  • PDF作成
  • 一括変換
  • 複数ページを1枚に
  • パスワード保護
  • PDF保護解除
  • PDF墨消し
  • PDF電子署名
  • PDF比較
  • 表抽出
  • PDF to Excel
  • 銀行明細変換ツール
  • 請求書データ抽出
  • 領収書スキャナー
  • 財務レポート分析
  • OCR - テキスト抽出
  • 手書き文字変換
  • PDF要約
  • PDF翻訳
  • PDFとチャット
  • データ抽出
  • デザインスタジオ

製品

  • Privacy & Security
  • すべてのツール
  • 機能
  • 銀行取引明細書
  • 料金
  • よくある質問
  • ブログ

サポート

  • ヘルプセンター
  • お問い合わせ
  • よくある質問

法務

  • プライバシーポリシー
  • 利用規約
  • クッキーポリシー

© 2026 PDFSub. All rights reserved.

世界中の人々のために、アメリカで を込めて制作されました