如何為法律發現文件進行PDF redaction:逐步指南
法律發現中的redaction錯誤可能導致制裁、惡意索賠和紀律處分。以下是如何正確redact PDF的方法——真正移除數據,而不僅僅是視覺遮蓋。
您即將向對造律師提交 4,000 份文件。在這些 PDF 中,有三段是特權律師客戶溝通內容,兩頁是工作成果分析,還有十七個社會安全號碼,聯邦規則要求您在提交前進行redaction。
您在敏感文字上畫上黑色矩形,儲存 PDF,然後提交文件。
您剛剛將所有您試圖隱藏的內容都交給了對造律師。文字仍然在檔案中。他們可以選取、複製、貼上並閱讀。每一個特權溝通。每一個社會安全號碼。您以為已移除的每一個工作成果。
這不是假設。它發生在聯邦刑事案件的辯護團隊、提交 FOIA 記錄的政府機構以及處理數百萬美元訴訟的律師事務所身上。後果從法院制裁到惡意索賠再到律師協會紀律處分不等。
本指南涵蓋了 PDF 檔案層級的真正 redaction 實際操作、聯邦規則要求您 redaction 的內容、如何驗證 redaction 是否成功,以及如何建立一個 redaction 工作流程來保護您的客戶和您的執照。

真實 Redaction 與視覺遮蓋:技術現實
在討論法律要求之前,您需要了解當您「redact」PDF 時,PDF 檔案內部會發生什麼。這個區別是本指南中最重要的一個概念。
PDF 如何儲存文字
PDF 頁面是一個內容串流——一系列操作符,將個別字元定位在畫布上的精確座標。當 PDF 顯示「SSN:123-45-6789」時,檔案包含將每個字元放置在特定 x,y 位置的指令。這與 Word 文件或網頁有根本上的不同。文字被嵌入到基於座標的渲染串流中。
當您使用註釋工具、標示工具或形狀工具在該文字上方繪製黑色矩形時,您是在頁面上添加一個新的圖形元素。原始文字操作符仍然保留在它們原來的確切位置。黑色矩形就像貼在印刷紙上的便利貼一樣,覆蓋在文字上方。
結果:任何收到 PDF 的人都可以選取矩形下方的區域,複製它,然後將完整的未 redaction 文字貼到任何文字編輯器中。程式化工具甚至可以更輕鬆地提取文字——無需手動選取。
真實 Redaction 的作用
真實 redaction 會永久修改 PDF 內容串流。它不會在文字上方添加圖層。它會從檔案結構中刪除文字操作符本身。在真實 redaction 後:
-
字元資料已從內容串流中移除
-
可見區域顯示一個黑色(或彩色)方塊
-
方塊下方沒有任何東西——沒有可選取、複製或提取的文字
-
無法透過任何方式恢復文字
-
搜尋工具找不到已 redaction 內容的匹配項
-
關於已 redaction 內容的元數據已清理
這是一個不可逆的操作。一旦文字被真正 redaction,它就消失了。沒有復原。這就是重點。
比較
| 視覺遮蓋 | 真實 Redaction | |
|---|---|---|
| 視覺外觀 | 文字上方的黑色方塊 | 文字上方的黑色方塊 |
| 底層文字 | 仍在 PDF 內容串流中 | 已永久刪除 |
| 選取和複製 | 可複製完整文字 | 無可選取內容 |
| 文字搜尋 | 找到匹配項 | 無匹配項 |
| 程式化提取 | 返回完整文字 | 不返回數據 |
| 元數據 | 作者、註釋、屬性完好 | 已清理 |
| 可逆性 | 是——移除註釋層 | 否——數據已銷毀 |
從外部看,兩者看起來完全相同。區別完全在表面之下。
高調 Redaction 失敗案例
這些並非邊緣案例。它們涉及經驗豐富的律師和政府專業人士,他們相信他們的 redaction 是有效的。
Manafort 案(2019)
保羅·馬納福特的律師在聯邦法院提交的文件中使用了實際上是黑色標示文字的「redaction」。記者複製了黑色條紋下的文字,揭露了馬納福特與俄羅斯聯繫人分享了總統競選民意調查數據,並討論了烏克蘭和平計劃。redaction 失敗導致了數十萬美元的額外法律費用,造成了巨大的聲譽損害,並加劇了案件結果的嚴重性。
原因很簡單:有人使用了文字處理器的黑色標示功能並導出為 PDF。文字層被完整保留。
TSA 安全手冊(2009)
運輸安全管理局發布了其機場安全檢查程序手冊的 redaction 版本。「redaction」是繪製在文字上方的黑色矩形。安全研究人員移除了覆蓋層,並訪問了完整文件,揭露了安全檢查例外情況、執法人員識別程序和檢查點漏洞。TSA 不得不修改其整個檢查協議。
AT&T / NSA 監控(2006)
在電子前線基金會對 AT&T 的訴訟中,該公司提交了一份法律簡報,其中包含「redacted」的商業機密。redaction 是覆蓋在文字上方的黑色方塊。完整內容——描述 AT&T 設施內的 NSA 監控基礎設施——可以輕易提取。該文件被下載了數千次。
共同點
在每一個案例中,失敗模式都是相同的:在文字上方放置了一個視覺元素,而沒有刪除文字本身。犯下這些錯誤的人並非粗心的業餘人士。他們是律師、政府官員和安全專業人士,他們使用的工具根本無法執行真實 redaction。
聯邦規則要求您 Redact 的內容
Fed. R. Civ. P. 5.2:法院文件的隱私保護
聯邦民事訴訟規則第 5.2 條要求,任何包含某些類別個人資訊並提交給法院的文件,都只能包含部分識別符:
| 資訊類型 | 必須 Redact 的內容 | 可保留的內容 |
|---|---|---|
| 社會安全號碼 | 最後 4 位數字除外 | 僅最後 4 位數字 |
| 納稅人識別號碼 | 最後 4 位數字除外 | 僅最後 4 位數字 |
| 出生日期 | 月和日 | 僅出生年份 |
| 未成年人姓名 | 全名 | 僅首字母 |
| 金融帳戶號碼 | 最後 4 位數字除外 | 僅最後 4 位數字 |
這不是可選的。它適用於聯邦民事案件中的每一份提交文件。許多州法院已採用類似或相同的規則。
重要的是,規則 5.2 專門適用於法院文件。當事人之間的證據開示受不同規則管轄,但實際情況是,大多數證據開示協議也要求 redaction 個人身份資訊 (PII)——而任何可能最終提交給法院的文件都需要準備好進行 redaction。
FRCP Rule 26(b)(5):特權記錄
當您基於特權(律師客戶特權、工作成果原則或另一項公認的特權)而扣留或 redaction 資訊時,規則 26(b)(5)(A) 要求您:
- 明確聲明特權主張
- 詳細描述被扣留材料的性質,以便對方能夠評估該主張——而無需洩露特權內容本身
這意味著基於特權的每一次 redaction 都必須在特權記錄中有一條相應的條目。該記錄通常包括日期、文件類型、作者、收件人、一般主題,以及所主張的特定特權。
如果您 redaction 了內容但未能記錄,對造律師可以質疑該 redaction。如果法院發現理由不足,您可能會被命令提交未 redaction 的文件——或面臨制裁。
證據開示中應 Redact 的類別
除了規則 5.2 中強制性的 PII 類別外,證據開示 redaction 通常屬於以下類別:
律師客戶特權溝通 - 律師與客戶之間為獲取或提供法律建議而進行的機密溝通。這包括電子郵件、備忘錄、筆記以及反映此類溝通實質內容的任何文件。
律師工作成果 - 為準備訴訟而製作的材料。這可能包括訪談筆記、備忘錄、法律研究、精神印象、策略和法律理論。根據工作成果原則,意見工作成果(精神印象和法律結論)比事實工作成果受到更強的保護。
不相關的個人數據 - 儘管法院普遍認為您不能單方面 redaction 您認為「不相關」的證據開示資訊,但您可以根據規則 26(c)(1) 尋求保護令,以保護與訴訟請求或抗辯確實不相關的個人資訊。
商業秘密和機密商業資訊 - 通常受約定保護令管轄,而不是 redaction,但在某些提交文件中,redaction 特定商業秘密內容可能是適當的。
法律發現的逐步 Redaction 工作流程
步驟 1:確定需要 Redact 的內容
在觸碰任何文件之前,請確定您的 redaction 類別。建立一份書面協議,其中規定:
-
將 redaction 的資訊類別(規則 5.2 的 PII、特權內容、工作成果)
-
誰審閱文件並做出 redaction 決定
-
如何記錄 redaction 決定以用於特權記錄
-
什麼品質保證流程驗證 redaction 的完整性
對於大型提交,此協議應在規則 26(f) 會議期間與對造律師達成一致。早期達成一致可以防止後續的爭議。
步驟 2:執行真實 Redaction
使用 PDFSub 的 Redact PDF 工具:
-
上傳文件 - 該工具直接在您的瀏覽器中處理檔案。PDF 永遠不會離開您的設備,這消除了將客戶文件上傳到外部伺服器的機密風險。
-
選取要 Redact 的文字 - 標示包含特權或敏感資訊的特定文字、段落或區域。您可以選取單字、完整句子或矩形區域。
-
套用 Redaction - 該工具會永久從 PDF 內容串流中移除選取的文字。這是真實 redaction——底層數據被銷毀,而不是被覆蓋。
-
儲存 Redacted 文件 - 下載新的 PDF。Redacted 內容已永久從檔案中移除。
由於該工具在瀏覽器中運行,敏感的客戶數據——社會安全號碼、特權溝通、金融帳戶號碼——永遠不會上傳到任何伺服器。這直接解決了《 النموذج規則 1.6》下的保密義務。
步驟 3:清除元數據
Redaction 可見文字僅僅是工作的一半。PDF 檔案包含元數據,這些元數據可能會洩露您打算保密的資訊:
-
文件屬性 - 作者姓名、創建日期、修改日期、用於創建文件的軟體
-
註釋和標記 - 審閱註釋、便利貼以及早期草稿的修訂記錄
-
書籤 - 可能透過名稱引用已 redaction 區段的導航書籤
-
嵌入式文件附件 - 某些 PDF 包含附件,其中可能包含未 redaction 的版本
-
表單欄位數據 - 隱藏的表單欄位可能包含已填寫然後「清除」的數據
-
XMP 元數據 - 擴展元數據,可能包含編輯歷史、版本資訊等
在 redaction 內容後,請審閱並清理文件的元數據。移除作者資訊、註釋以及任何未包含在提交中的嵌入式文件。
步驟 4:維護特權記錄
對於基於特權的每一次 redaction,請創建一條特權記錄,其中包含:
-
文件識別符(Bates 編號或檔案名稱)
-
文件的日期
-
作者和收件人
-
文件類型(電子郵件、備忘錄、信件、報告)
-
一般主題——足夠詳細,以便對造律師評估特權主張,而無需洩露特權內容
-
聲明的特權——律師客戶特權、工作成果、聯合辯護等
維護良好的特權記錄是您應對 redaction 質疑的防線。沒有它,法院可能會命令提交未 redaction 的文件。
步驟 5:驗證 Redaction
這是大多數人跳過的步驟——也是防止 Manafort 式失敗的步驟。
驗證檢查清單:
-
嘗試選取已 Redaction 的區域 - 打開已 Redaction 的 PDF,並嘗試選取已 Redaction 區域中的文字。如果您可以選取文字,則 redaction 失敗。
-
嘗試從已 Redaction 的區域複製 - 即使選取看起來是空的,也嘗試從已 Redaction 的區域複製並貼到文字編輯器中。如果出現任何文字,則 redaction 失敗。
-
搜尋已知的 Redacted 內容 - 如果您 redaction 了文字「123-45-6789」,請使用 PDF 的搜尋功能搜尋該字串。如果找到結果,則 redaction 失敗。
-
使用文字提取工具檢查 - 使用 PDFSub 的文字提取功能從文件中提取所有文字。審閱輸出,檢查是否有任何應被 redaction 的內容。
-
檢查元數據 - 驗證文件屬性、註釋和嵌入式文件是否已清理。
在提交之前,請對每個文件執行此驗證。對於大型提交,請建立一個品質保證樣本——隨機驗證至少 10% 的已 Redaction 文件,並 100% 驗證包含最敏感類別(SSN、金融帳戶、特權溝通)的文件。
步驟 6:自信地提交
驗證通過後,文件即可提交。您的 Redacted 內容已從檔案中永久移除,您的特權記錄記錄了每次 redaction 的基礎,並且您已驗證沒有可恢復的數據殘留。
應避免的常見 Redaction 錯誤
錯誤 1:使用標示或註釋工具
文字處理器和基本 PDF 檢視器提供的標示和註釋工具看起來像 redaction,但實際上並未對底層文字進行任何處理。黑色標示、註釋框和繪製形狀都是視覺覆蓋層。它們都無法移除數據。
錯誤 2:Redaction 列印副本
有些律師會列印文件,在紙上用黑色馬克筆塗抹,然後掃描結果。雖然這確實消除了數位文字層(掃描創建了一個新圖像),但它引入了 OCR 風險:如果掃描後運行光學字元識別軟體,在馬克筆覆蓋不完美的地方的文字可能會被部分重建。它還會產生質量較差的文件並增加不必要的步驟。
錯誤 3:忘記元數據
您可以完美地 redaction 文件主體中所有特權文字,但仍然可能透過文件屬性、註釋或嵌入式附件洩露相同資訊。元數據清理必須是每次 redaction 工作流程的一部分。
錯誤 4:未記錄特權記錄就進行 Redaction
沒有記錄的 redaction 會招致質疑。如果對造律師質疑某個 redaction,而您無法提供證明其合理性的特權記錄條目,法院可能會命令提交未 redaction 的文件——或得出不利推論。
錯誤 5:未能驗證
驗證只需幾分鐘。在高風險案件中,redaction 失敗可能需要數年才能解決。切勿在未通過驗證清單的情況下提交已 Redaction 的文件。
建立全公司範圍的 Redaction 協議
對於經常處理證據開示提交的律師事務所和法律部門來說,標準化的 redaction 協議可以防止個人錯誤成為公司範圍內的問題。
培訓: 每一位處理 redaction 的律師和律師助理都應了解視覺遮蓋與真實 redaction 之間的區別。一次 30 分鐘的現場演示培訓可以避免多年的潛在惡意索賠風險。
工具標準化: 選擇一個 redaction 工具,並要求在公司內統一使用。使用不一致的工具會增加某人誤用標示工具而非 redaction 工具的風險。
品質保證: 在提交工作流程中建立驗證步驟。指派第二雙眼睛——不是執行 redaction 的人——來運行驗證清單。
特權記錄整合: 在 redaction 的同時建立特權記錄,而不是事後。從已 Redaction 的文件追溯性地構建特權記錄既容易出錯又耗時。
文件保留: 保留原始未 Redaction 的文件和 Redacted 的提交版本。如果特權主張受到質疑,並且法院進行了 in camera 審查,您可能需要原始文件。
為何基於瀏覽器的 Redaction 對法律道德至關重要
美國律師協會的《 النموذج規則 1.6》要求律師做出「合理的努力,以防止無意或未經授權披露客戶代表資訊,或未經授權訪問該資訊」。《 النموذج規則 1.1》,評論 8,進一步要求技術能力。
當您將客戶的文件上傳到基於雲端的 PDF 工具時,您正在將該客戶的數據——可能包括特權溝通、社會安全號碼和金融帳戶資訊——發送到外部伺服器。您可能不知道該伺服器的位置、誰有權訪問它、數據保留多長時間,或者其他用戶的數據是否在同一基礎設施上處理。
基於瀏覽器的處理完全消除了這種風險類別。當 PDFSub 的 Redact PDF 工具在您的瀏覽器中處理文件時,該文件永遠不會離開您的設備。沒有伺服器上傳,沒有雲端儲存,沒有數據保留。處理在您的瀏覽器記憶體中本地進行,當您關閉標籤頁時,數據就會消失。
對於處理敏感客戶資訊的律師——幾乎所有律師都是如此——這一區別直接解決了規則 1.6 中的「合理努力」標準。
常見問題解答
在文字上方畫黑色方塊與 Redact 它是否相同?
否。在文字上方繪製黑色方塊、使用黑色標示或放置註釋都是視覺遮蓋。文字仍然保留在 PDF 內容串流中,並且可以被任何收到該文件的人選取、複製、搜尋和提取。真實 redaction 會永久從檔案結構中刪除文字。兩者在視覺上看起來完全相同,但只有真實 redaction 才能實際移除數據。
如果在訴訟過程中發現 Redaction 失敗會怎樣?
後果因司法管轄區和嚴重程度而異,但可能包括法院施加的制裁(金錢處罰或不利推論指示)、受影響客戶的惡意索賠、因違反保密義務而提起的律師協會紀律處分程序,以及對適用於所暴露資訊的特權或保護措施的放棄。在 Manafort 案中,redaction 失敗暴露了主導新聞週期並實質影響案件的資訊。
除了可見文字,我還需要 Redact 元數據嗎?
是的。PDF 元數據可能包含作者姓名、文件創建和編輯日期、註釋、修訂記錄、嵌入式文件以及其他可能具有特權或敏感性的資訊。即使文件主體已完美 Redacted,也可能透過其元數據洩漏資訊。務必將元數據清理作為 redaction 工作流程的一部分。
我可以從證據開示文件中 Redact 不相關的資訊嗎?
聯邦法院普遍認為,《聯邦民事訴訟規則》不允許一方僅因認為資訊不相關而單方面 Redact 該資訊。但是,您可以根據規則 26(c)(1) 尋求保護令,以保護確實不相關的個人資訊免於提交。更安全的方法是與對造律師在證據開示過程的早期進行協商,並建立約定的 redaction 協議。
如何在特權記錄中處理 Redaction?
對於基於特權主張的每一次 redaction,您的特權記錄應包括文件的識別符(例如 Bates 編號)、日期、作者和收件人、文件類型、主題的一般描述(詳細到足以讓對造方評估主張,但又不過於詳細以至於洩露特權內容),以及聲明的特定特權。《規則 26(b)(5)(A)》要求這樣做——不足的特權記錄可能會導致法院命令提交未 Redacted 的文件。
PDFSub 的 redaction 是真實 redaction 還是視覺覆蓋?
PDFSub 的 Redact PDF 工具執行真實 redaction。它會永久從 PDF 內容串流中移除選取的文字。Redaction 後,文字無法透過任何方式選取、複製、搜尋或提取。該工具完全在您的瀏覽器中處理檔案——文件永遠不會離開您的設備——這解決了律師根據《 النموذج規則 1.6》的保密義務。
總結
Redaction 錯誤是法律實務中最容易避免的錯誤之一,但它們仍在不斷發生,因為大多數人使用的工具——標示功能、註釋層、黑色形狀——看起來似乎有效,但實際上並未移除數據。
解決方案很簡單:使用執行真實 redaction(而非視覺遮蓋)的工具,在 redaction 內容後清理元數據,為每一次基於特權的 redaction 維護特權記錄,並在提交前驗證每個文件。始終如一地執行這四件事,您就可以消除一整類惡意索賠的風險。
如果您經常處理證據開示文件,PDFSub 的 Redact PDF 工具直接在您的瀏覽器中執行真實 redaction——無需伺服器上傳,無需雲端儲存,無需數據保留。如需完整的工具集,包括文件比較、電子簽名、OCR 和合併,請參閱 律師的 PDF 工具 指南。