如何將 PDF 轉換為 PDF/A 以進行長期歸檔
PDF/A 是用於長期文件保存的 ISO 標準。以下是如何將您的 PDF 轉換為 PDF/A — 這對於政府、法律和合規性歸檔是必需的。
您被告知要以 PDF/A 格式提交文件。也許是政府文件、法律法庭提交、醫療記錄,或是公司合規要求。您看著普通的 PDF,不禁想問:它有什麼問題?為什麼需要是「PDF/A」?又該如何轉換?
PDF/A 是一個 ISO 標準(ISO 19005),其目的單一:確保 PDF 文件在未來數十年內,在任何系統上都能以完全相同的方式重現。普通的 PDF 可以引用外部字體、連結到網站、運行 JavaScript,並依賴於 20 年後可能不存在的系統資源。PDF/A 文件是完全獨立的 — 所有渲染文件所需的元素都嵌入在文件本身內。
這點比您想像的更重要。政府檔案需要 50 年後仍能開啟文件。法庭需要確保證據沒有被更改。醫療系統需要病歷能在任何平台上呈現相同樣貌。PDF/A 確保了這一點。
本指南將說明什麼是 PDF/A、您需要哪個版本、誰需要它,以及如何轉換您現有的 PDF。
PDF/A 與普通 PDF 的差異
標準 PDF 非常靈活。它可以嵌入字體或引用系統字體。它可以包含用於互動式表單的 JavaScript。它可以連結到外部內容。它可以進行加密。這種靈活性使 PDF 適用於日常使用 — 但卻會對長期保存造成問題。
想像一下,當您嘗試開啟一個 20 年前的 PDF,而該 PDF 引用了您系統上不存在的字體時會發生什麼。檢視器會替換為另一種字體,文件看起來就不同了 — 文字重新排列、欄位移動、表格損壞。對於普通的商業文件,這很煩人。但對於法律合約或政府記錄,這是不可接受的。
PDF/A 透過強制執行嚴格規則來消除這些風險:
所有內容都必須嵌入
字體: 文件中使用的所有字體都必須完全嵌入 — 而非僅僅引用。這表示整個字體文件(或至少是使用的字體子集)儲存在 PDF 中。即使該字體從地球上的所有作業系統中消失,文件仍能正確渲染。
色彩設定檔: 文件必須包含 ICC 色彩設定檔,精確定義顏色的顯示方式。普通 PDF 可能只說「使用紅色」,將詮釋權交給檢視器。PDF/A 文件則精確指定了確切的紅色色調,使用標準化的色彩設定檔。
圖像: 所有圖像都必須嵌入,而非連結。禁止外部 URL,禁止連結到網路磁碟機上的文件。
部分功能被禁止
JavaScript: 不允許執行程式碼。依賴 JavaScript 計算的互動式表單將無法在 PDF/A 中運作。表單欄位可以保留,但任何腳本都會被移除。
加密: PDF/A 文件不能被加密或密碼保護。理由是加密依賴於特定的演算法和金鑰長度,這些可能會過時 — 而無法開啟的檔案庫是無用的。
外部引用: 禁止連結到外部內容、禁止從網際網路串流的多媒體、禁止依賴文件以外的任何內容。
透明度(在 PDF/A-1 中): 最早的 PDF/A 標準不支援圖形中的透明度。較新版本(PDF/A-2 和 PDF/A-3)已加入透明度支援。
PDF/A 相容性級別說明
PDF/A 並非單一標準 — 它有幾個變體,每個都建立在前一個的基礎上。以下是您需要了解的內容。
PDF/A-1b (ISO 19005-1, B 級)
2005 年的原始 PDF/A 標準。B 級(「基本」)確保文件視覺外觀得以保留 — 文件在任何系統上看起來都一樣。它不保證文字可以搜尋或提取(那是 A 級)。
適用於: 僅需視覺保存的簡單文件。支援最廣泛的變體 — 如果不確定使用哪個,PDF/A-1b 是最安全的選擇。
PDF/A-1a (ISO 19005-1, A 級)
A 級(「可存取」)增加了對文件結構的要求:標記內容、正確的閱讀順序、Unicode 文字對應,以及圖像的替代文字。這使得文件對螢幕閱讀器完全可存取,並確保文字可以可靠地搜尋和提取。
適用於: 需要符合 ADA、Section 508 或 WCAG 合規要求的可存取文件。
PDF/A-2b (ISO 19005-2, B 級)
PDF/A-2 於 2011 年發布,基於較新的 PDF 1.7 規格。它增加了對 JPEG2000 圖像壓縮、圖形透明度以及 PDF 圖層(可選內容組)的支援。它還允許將其他 PDF/A 文件嵌入為附件。
適用於: 具有透明度效果、圖層內容或嵌入式 PDF 附件的現代文件。大多數新轉換的推薦選擇。
PDF/A-3b (ISO 19005-3, B 級)
PDF/A-3 的關鍵創新:它允許將任何文件類型嵌入為附件 — 不僅僅是其他 PDF/A 文件。這表示您可以將原始 Word 文件、XML 資料文件、CSV 電子表格,或任何其他來源文件與歸檔的 PDF 一起附加。
適用於: 電子發票(ZUGFeRD 和 Factur-X 標準要求 PDF/A-3)、需要來源數據與視覺文件一起傳輸的混合歸檔,以及需要單一文件中包含人類可讀和機器可讀格式的工作流程。
應選擇哪個變體?
| 要求 | 推薦變體 |
|---|---|
| 一般歸檔 | PDF/A-2b |
| 最大相容性 | PDF/A-1b |
| 可存取性合規 | PDF/A-2a |
| 電子發票 (ZUGFeRD / Factur-X) | PDF/A-3b |
| 附帶來源文件附件的歸檔 | PDF/A-3b |
| 政府提交(請檢查要求) | 通常是 PDF/A-1b 或 PDF/A-2b |
如有疑問,請詢問接收組織他們接受哪種變體。如果他們只說「PDF/A」而未指定,PDF/A-2b 是最安全的現代選擇。
誰需要 PDF/A?
PDF/A 不僅僅是錦上添花 — 許多組織和法規都要求它。
政府檔案
美國國家檔案和記錄管理局 (NARA) 要求 PDF/A 作為永久電子記錄。歐盟委員會強制要求官方文件使用 PDF/A。世界各地的許多國家檔案館都有類似的要求。
法院和法律系統
越來越多的法院系統要求使用 PDF/A 進行電子歸檔。其邏輯很簡單:法律文件必須與提交時完全一致地保存,可能長達數十年。PDF/A 的獨立性確保今天提交的合約在 2060 年審閱時看起來完全相同。
醫療保健
醫療記錄和臨床文件必須以標準化格式保存。PDF/A 在醫療資訊系統 (HIS) 和電子健康記錄 (EHR) 平台中被廣泛採用,用於此目的。
金融服務
銀行監管機構、審計軌跡和財務報告越來越要求使用 PDF/A 進行長期記錄保存。巴塞爾協定和各種國家銀行法規規定了某些文件的保存期限為 5-10 年以上。
電子發票
歐洲電子發票標準 ZUGFeRD(德國/奧地利)和 Factur-X(法國)明確要求 PDF/A-3b 格式。PDF/A 文件包含人類可讀的發票,而嵌入的 XML 附件則包含機器可讀的結構化數據。
公司合規
許多大型組織已採用 PDF/A 作為其標準歸檔格式。如果您與企業客戶、政府承包商或受監管行業合作,遲早會遇到 PDF/A 的要求。
如何使用 PDFSub 將 PDF 轉換為 PDF/A
PDFSub 的 PDF 轉 PDF/A 工具 使用 PDFSub Engine 在伺服器端處理轉換,該引擎負責嵌入字體、轉換色彩設定檔、移除禁止的功能以及驗證輸出的複雜工作。
分步說明
步驟 1:開啟工具。 前往 pdfsub.com/tools/pdf-to-pdfa。
步驟 2:上傳您的 PDF。 拖放文件或點擊瀏覽。文件將上傳到 PDFSub 的安全處理伺服器。
步驟 3:選擇相容性級別。 選擇您的 PDF/A 變體 — PDF/A-1b、PDF/A-2b 或 PDF/A-3b。如果不確定,建議預設使用 PDF/A-2b。
步驟 4:轉換。 點擊轉換按鈕。PDFSub Engine 會處理文件:嵌入字體、添加色彩設定檔、移除 JavaScript 和加密,並執行其他必要的轉換。
步驟 5:下載。 轉換後的 PDF/A 文件將下載,其相容性級別包含在元數據中。您可以使用任何 PDF/A 驗證器來驗證轉換。
轉換過程做了什麼
轉換引擎會自動執行多項轉換:
- 嵌入所有字體 — 任何被引用但未嵌入的字體都會被找到並嵌入
- 添加 ICC 色彩設定檔 — 通常是 sRGB 以用於螢幕顯示,確保一致的色彩渲染
- 移除 JavaScript — 任何腳本都會被移除(表單欄位保留,但失去互動性)
- 移除加密 — 密碼保護將被移除(文件必須可存取)
- 轉換透明度 — 對於 PDF/A-1,透明元素會被展平為不透明的對應物
- 添加 PDF/A 元數據 — XMP 元數據塊會更新以聲明相容性
疑難排解轉換問題
「無法嵌入字體」
某些字體有授權限制,不允許嵌入。如果轉換因受限字體而失敗,您有兩個選擇:替換為可嵌入的替代字體(轉換工具可以自動執行此操作,使用視覺上相似的字體),或返回原始文件,在重新匯出為 PDF 之前更改字體。
文件轉換後外觀略有不同
這通常發生在展平透明度(用於 PDF/A-1 轉換)或替換字體時。如果視覺保真度至關重要,請嘗試轉換為 PDF/A-2b 而非 PDF/A-1b — 新標準原生支援透明度,消除了大多數視覺差異。
轉換後檔案大小增加
這是預期的。PDF/A 文件會嵌入所有內容 — 字體、色彩設定檔、完整元數據。一個引用系統字體的普通 PDF 可能只有 200 KB,但帶有這些字體完全嵌入的 PDF/A 版本可能高達 2 MB。這種增加是獨立性所付出的代價。
表單欄位失去互動性
PDF/A 禁止 JavaScript,因此表單計算、驗證腳本和動態行為都會被移除。表單欄位本身仍然存在 — 仍然可以填寫 — 但任何自動化行為都消失了。如果您需要互動式表單,PDF/A 不是工作副本的正確格式。僅將 PDF/A 用於最終的歸檔版本。
常見問題解答
我還能編輯 PDF/A 文件嗎?
PDF/A 是歸檔格式,而非鎖定格式。您可以在任何 PDF 編輯器中開啟和編輯 PDF/A 文件。但是,編輯可能會破壞 PDF/A 的相容性 — 編輯器可能會添加違反標準的功能或移除元數據。編輯後,您需要重新轉換為 PDF/A 以恢復相容性。因此,最好將可編輯的來源文件單獨保存,並在文件最終確定後再轉換為 PDF/A。
PDF/A 和「唯讀」PDF 相同嗎?
不。唯讀 PDF 是具有防止編輯的擁有者密碼保護的 PDF。PDF/A 實際上禁止加密 — 它根本無法進行密碼保護。PDF/A 關乎保存,而非存取控制。任何人都可以開啟、複製,並且(理論上)編輯 PDF/A 文件。
如何驗證我的 PDF 是否為有效的 PDF/A?
有多種工具可以驗證 PDF/A 的相容性。Adobe Acrobat Pro 具有內建的 PDF/A 驗證功能。免費的 veraPDF 工具是許多檔案館和圖書館使用的開源驗證器。PDFSub 的轉換過程包含驗證 — 如果輸出通過,您將看到相容性指示器。
轉換為 PDF/A 會改變文件的外觀嗎?
在大多數情況下,不會。PDF/A 的重點是視覺保存。但是,某些邊緣情況可能會導致細微變化:PDF/A-1 的透明度展平、無法嵌入字體的字體替換,以及多媒體元素的移除。轉換為 PDF/A-2b 或 PDF/A-3b 可以最大限度地減少這些問題,因為較新的標準支援更多功能。
PDF/A 和 PDF/X 有何區別?
PDF/A 用於歸檔 — 長期保存並保證可重現性。PDF/X 用於印刷製作 — 確保文件在不同印刷系統上都能正確印刷。它們是針對不同目的的不同標準,儘管文件在技術上可以同時符合兩者。
總結
PDF/A 是用於長期文件保存的 ISO 標準。它透過將渲染所需的所有內容嵌入文件本身,確保您的文件在未來的任何時間點,都能在任何系統上以完全相同的方式開啟和顯示。
對於大多數轉換,PDF/A-2b 是推薦的選擇 — 它現代、廣泛支援,並且能夠處理原始 PDF/A-1b 標準所不支援的透明度和 JPEG2000 等功能。當需要最大的向後相容性時,請使用 PDF/A-1b;當您需要嵌入非 PDF 附件時(特別是電子發票),請使用 PDF/A-3b。
轉換過程是自動化的 — 工具會處理字體嵌入、色彩設定檔、JavaScript 移除和驗證。您的工作只是上傳 PDF 並選擇相容性級別。
準備好轉換了嗎?試試 PDFSub 的 PDF 轉 PDF/A 工具 — 上傳您的文件,選擇相容性級別,並在幾秒鐘內獲得準備歸檔的文件。