วิธีลบข้อมูลที่ละเอียดอ่อนออกจากไฟล์ PDF อย่างปลอดภัยและถาวร (Redaction) | PDFSub Blog

แนวปฏิบัติที่ดีที่สุดในการปกปิดข้อมูล

การมีเครื่องมือปกปิดข้อมูลที่ถูกต้องเป็นเพียงครึ่งหนึ่งของสมการ กระบวนการที่เกี่ยวข้องกับการปกปิดข้อมูลก็มีความสำคัญไม่แพ้กัน

1. ตรวจสอบเสมอหลังจากการปกปิด

หลังจากใช้การปกปิดแล้ว ให้ทดสอบผลลัพธ์ ลองเลือกข้อความในบริเวณที่ปกปิด หากคุณสามารถไฮไลต์อะไรที่อยู่ใต้กล่องสีดำได้ แสดงว่าการปกปิดล้มเหลว ค้นหา (Ctrl+F / Cmd+F) เนื้อหาที่ควรจะถูกลบ เปิดไฟล์ในโปรแกรมดู PDF อื่น เนื่องจากบางโปรแกรมจัดการคำอธิบายประกอบแตกต่างกัน สำหรับการปกปิดข้อมูลที่มีความสำคัญสูง (การดำเนินคดีทางกฎหมาย การยื่นเอกสารต่อหน่วยงานกำกับดูแล) ให้ใช้เครื่องมือแยกข้อความเพื่อดึงข้อความทั้งหมดออกมาและยืนยันว่าเนื้อหาที่ปกปิดนั้นไม่มีอยู่จริง

2. ลบข้อมูลเมตา (Metadata)

การปกปิดข้อความที่มองเห็นได้เป็นสิ่งจำเป็นแต่ไม่เพียงพอ PDF มีข้อมูลเมตาที่สามารถเปิดเผยข้อมูลที่ละเอียดอ่อนได้: คุณสมบัติเอกสาร (ผู้เขียน องค์กร วันที่สร้าง) ความคิดเห็นและคำอธิบายประกอบ ข้อมูลช่องกรอกแบบฟอร์ม ไฟล์แนบที่ฝังไว้ บุ๊กมาร์ก JavaScript และข้อมูลเมตา XMP กระบวนการปกปิดข้อมูลที่สมบูรณ์จะต้องลบข้อมูลทั้งหมดนี้ออก นอกเหนือจากเนื้อหาที่มองเห็นได้

3. ทำงานจากสำเนา

ห้ามปกปิดเอกสารต้นฉบับเด็ดขาด ให้สร้างสำเนา เก็บต้นฉบับไว้ในที่ปลอดภัย ดำเนินการปกปิดข้อมูลทั้งหมดบนสำเนา ตรวจสอบ และแจกจ่ายเฉพาะเวอร์ชันที่ปกปิดแล้ว ต้นฉบับที่ยังไม่ได้ปกปิดอาจจำเป็นต้องใช้ในภายหลังสำหรับการดำเนินคดี บันทึกการตรวจสอบ หรือการตรวจสอบภายใน

4. ใช้รูปลักษณ์การปกปิดที่สอดคล้องกัน

สร้างมาตรฐานรูปลักษณ์ของการปกปิดข้อมูลทั่วทั้งองค์กรของคุณ กล่องสีดำเป็นมาตรฐานสำหรับเอกสารทางกฎหมายและเอกสารราชการ พิจารณาเพิ่มป้ายกำกับการปกปิด (เช่น "REDACTED", "PRIVILEGED", "PII REMOVED") เพื่อให้ผู้อ่านทราบว่าทำไมเนื้อหาจึงถูกลบออก

5. บันทึกและทบทวน

เพื่อวัตถุประสงค์ทางกฎหมายและการปฏิบัติตามข้อกำหนด ให้เก็บบันทึกว่าใครเป็นผู้ดำเนินการปกปิดข้อมูล เมื่อใด หมวดหมู่ข้อมูลใดที่ถูกลบออก และใช้เครื่องมือใด สิ่งนี้จะสร้างบันทึกการตรวจสอบหากความเพียงพอของการปกปิดข้อมูลถูกตั้งคำถาม

ให้บุคคลที่สองทบทวนเอกสารที่ปกปิดแล้วก่อนที่จะออกจากองค์กรของคุณ สายตาที่สองจะช่วยจับการปกปิดที่พลาด การลบที่ไม่สมบูรณ์ และเบาะแสบริบทที่อาจทำให้ผู้อ่านอนุมานเนื้อหาที่ปกปิดได้จากข้อความโดยรอบ การทบทวนโดยสองคนเป็นแนวปฏิบัติมาตรฐานในสำนักงาน FOIA ของรัฐบาล

การปกปิดข้อมูลแบบกลุ่ม: การค้นหาและลบรูปแบบ

เมื่อคุณต้องการปกปิดข้อมูลประเภทเดียวกันในเอกสารขนาดใหญ่ การเลือกด้วยตนเองจะทำได้ไม่สะดวก การปกปิดข้อมูลแบบกลุ่มจะทำให้กระบวนการเป็นอัตโนมัติโดยการค้นหารูปแบบและทำเครื่องหมายการจับคู่ทั้งหมดในครั้งเดียว

รูปแบบทั่วไปสำหรับการปกปิดข้อมูลแบบกลุ่ม:

ประเภทข้อมูล	รูปแบบ
หมายเลขประกันสังคม	`XXX-XX-XXXX`, `XXX XX XXXX`, `XXXXXXXXX`
ที่อยู่อีเมล	`[email protected]`
หมายเลขโทรศัพท์	`(XXX) XXX-XXXX`, `XXX-XXX-XXXX`, `+1XXXXXXXXXX`
หมายเลขบัตรเครดิต	ลำดับตัวเลข 13-19 หลัก มักจะแบ่งเป็นกลุ่มละสี่หลัก
หมายเลขบัญชี	ลำดับตัวเลข 8-17 หลัก ตามหลัง "Account #" หรือ "Acct"
วันเกิด	`MM/DD/YYYY`, `Month DD, YYYY`, `DD-MM-YYYY`

ขั้นตอนการทำงาน: กำหนดรูปแบบของคุณ ค้นหาในทุกหน้า ทบทวนการจับคู่แต่ละรายการ (ไม่ใช่ทุกรูปแบบที่จับคู่ได้นั้นละเอียดอ่อนจริงๆ) ใช้ทั้งหมดในครั้งเดียว จากนั้นทำการกวาดด้วยตนเองสำหรับเนื้อหาที่ไม่ตรงกับรูปแบบของคุณ ชื่อ ที่อยู่ และคำอธิบายที่เป็นข้อความอิสระ มักจะไม่ตรงกับรูปแบบง่ายๆ และต้องอาศัยการตรวจสอบโดยมนุษย์

ข้อกำหนดทางกฎหมายสำหรับการปกปิดข้อมูล

การปกปิดข้อมูล (Redaction) ไม่ใช่แค่แนวปฏิบัติที่ดีที่สุด แต่ในหลายบริบทถือเป็นข้อกำหนดทางกฎหมาย

FOIA (Freedom of Information Act). หน่วยงานรัฐบาลกลางที่ตอบสนองต่อคำขอ FOIA จะต้องเปิดเผยเอกสาร แต่มีข้อกำหนดให้ปกปิดข้อมูลที่เข้าข่ายการยกเว้นเก้าประการ ซึ่งรวมถึงข้อมูลความมั่นคงแห่งชาติ ความลับทางการค้า การละเมิดความเป็นส่วนตัวของบุคคล และบันทึกการบังคับใช้กฎหมาย กฎหมายเกี่ยวกับบันทึกสาธารณะของรัฐก็มีข้อกำหนดที่คล้ายคลึงกัน การปกปิดข้อมูลที่ไม่ถูกต้องอาจนำไปสู่การฟ้องร้อง คำสั่งศาล และการลงโทษหน่วยงาน

GDPR. ภายใต้กฎระเบียบการคุ้มครองข้อมูลทั่วไปของสหภาพยุโรป (EU General Data Protection Regulation) องค์กรที่ตอบสนองต่อคำขอเข้าถึงข้อมูลของเจ้าของข้อมูล (มาตรา 15) จะต้องปกปิดข้อมูลส่วนบุคคลของบุคคลที่สามในเอกสารเดียวกัน "สิทธิ์ในการลบ" (มาตรา 17) อาจกำหนดให้ต้องปกปิดข้อมูลส่วนบุคคลจากเอกสารที่องค์กรต้องเก็บรักษาไว้ การละเมิดอาจส่งผลให้ถูกปรับเป็นเงินสูงสุด 20 ล้านยูโร หรือ 4% ของรายได้ทั่วโลกต่อปี

HIPAA. ข้อมูลสุขภาพที่ได้รับการคุ้มครอง (Protected health information) จะต้องถูกระบุตัวตนก่อนการเปิดเผยเพื่อวัตถุประสงค์อื่นนอกเหนือจากการรักษา วิธีการ "Safe Harbor" กำหนดให้ต้องลบตัวระบุทั้ง 18 ประเภทที่กล่าวไว้ก่อนหน้านี้ การลงโทษมีตั้งแต่ 100 ถึง 50,000 ดอลลาร์สหรัฐต่อการละเมิดหนึ่งครั้ง

คำสั่งศาล. ศาลมักมีคำสั่งให้ปกปิดชื่อบุคคลทั่วไป ความลับทางการค้า ตัวตนของผู้ให้ข้อมูล และข้อมูลที่ถูกปิดผนึกในการยื่นเอกสารต่อสาธารณะ การไม่ปฏิบัติตามอาจส่งผลให้ถูกลงโทษฐานละเมิดอำนาจศาล การยกฟ้องคดี หรือการลงโทษทางวินัยต่อนักกฎหมาย

กฎหมายความเป็นส่วนตัวของรัฐ. CCPA/CPRA ของแคลิฟอร์เนีย, CDPA ของเวอร์จิเนีย, CPA ของโคโลราโด และกฎหมายของรัฐอื่นๆ ที่คล้ายคลึงกัน กำหนดภาระผูกพันคล้ายกับ GDPR องค์กรที่ตอบสนองต่อคำขอข้อมูลของผู้บริโภคจะต้องปกปิดข้อมูลของบุคคลที่สามก่อนการเปิดเผย

คำถามที่พบบ่อย

ข้อมูลที่ปกปิดไปแล้วสามารถกู้คืนได้หรือไม่?

หากการปกปิดข้อมูลดำเนินการอย่างถูกต้องโดยใช้เครื่องมือปกปิดข้อมูลที่แท้จริง — ไม่ ข้อมูลอักขระจะถูกลบอย่างถาวร ไม่มีชั้นซ่อน ไม่มีสำรองข้อมูลที่เข้ารหัส ไม่มีเส้นทางการกู้คืนทางนิติเวช หาก "การปกปิด" เป็นเพียงรูปร่างที่วาดทับข้อความ (การปกปิดปลอม) ก็สามารถทำได้ — ใครก็ตามสามารถเลือก คัดลอก และวางข้อความที่ซ่อนอยู่ได้ด้วยโปรแกรมดู PDF ทั่วไป

ฉันสามารถปกปิดข้อมูลในรูปภาพภายใน PDF ได้หรือไม่?

ได้ เครื่องมือปกปิดข้อมูลสามารถวางกล่องทับบริเวณของรูปภาพที่ฝังอยู่ โดยการประมวลผลภาพบริเวณที่ได้รับผลกระทบด้วยสีทึบ เพื่อทำลายพิกเซลต้นฉบับ สิ่งนี้สำคัญสำหรับเอกสารสแกนที่ข้อความปรากฏเป็นส่วนหนึ่งของรูปภาพ แทนที่จะเป็นอักขระที่เลือกได้

แล้วการปกปิดช่องกรอกแบบฟอร์มล่ะ?

ช่องกรอกแบบฟอร์ม PDF จะเก็บข้อมูลแยกต่างหากจากเนื้อหาหน้าจอที่มองเห็นได้ การวางกล่องปกปิดทับตำแหน่งที่มองเห็นของช่องกรอกแบบฟอร์ม ไม่ได้หมายความว่าจะลบข้อมูลที่เก็บไว้ออก การปกปิดข้อมูลที่สมบูรณ์จะต้องทำให้ช่องกรอกแบบฟอร์มและข้อมูลที่เกี่ยวข้องแบนราบหรือลบออก

การปกปิดข้อมูลจะเปลี่ยนเค้าโครงหน้ากระดาษหรือไม่?

ไม่ บริเวณที่ปกปิดจะถูกแทนที่ด้วยกล่องสีทึบที่กินพื้นที่เท่ากับเนื้อหาที่ถูกลบออก ข้อความและเค้าโครงโดยรอบจะยังคงอยู่ในตำแหน่งเดิม

ฉันสามารถยกเลิกการปกปิดข้อมูลได้หรือไม่?

ไม่ได้ — นั่นคือประเด็น การปกปิดข้อมูลเป็นการถาวรและไม่สามารถย้อนกลับได้ นี่คือเหตุผลที่คุณควรทำงานจากสำเนาเสมอ และเก็บต้นฉบับที่ยังไม่ได้ปกปิดไว้ในที่ปลอดภัย

การปกปิดข้อมูลแตกต่างจากการเข้ารหัสอย่างไร?

การเข้ารหัสจำกัด ว่าใครสามารถเข้าถึง เอกสารทั้งหมดได้ การปกปิดข้อมูลจำกัด เนื้อหาใด ที่มองเห็นได้ภายในเอกสารที่ทุกคนสามารถเข้าถึงได้ ทั้งสองอย่างมีวัตถุประสงค์ที่แตกต่างกัน และมักใช้ร่วมกัน

การพิมพ์เป็น PDF หลังจากปิดบังข้อความ เป็นวิธีการปกปิดข้อมูลที่ถูกต้องหรือไม่?

ไม่น่าเชื่อถือ ไดรเวอร์บางตัวที่พิมพ์เป็น PDF จะทำให้ชั้นภาพแบนราบและลบข้อความที่อยู่เบื้องล่าง ไดรเวอร์บางตัวจะเก็บรักษาไว้ วิธีนี้ไม่ควรนำมาใช้สำหรับการปกปิดข้อมูลที่ละเอียดอ่อน ควรใช้เครื่องมือปกปิดข้อมูลโดยเฉพาะ

ฉันสามารถปกปิด PDF ที่มีการป้องกันด้วยรหัสผ่านได้หรือไม่?

คุณต้องปลดล็อก PDF ก่อนทำการปกปิด หาก PDF มีรหัสผ่านของเจ้าของ (จำกัดการแก้ไข) หรือรหัสผ่านของผู้ใช้ (จำกัดการเปิด) คุณต้องมีรหัสผ่านนั้นก่อน เมื่อปลดล็อกแล้ว กระบวนการปกปิดข้อมูลจะเหมือนกับ PDF ที่ไม่ได้รับการป้องกันทั่วไป

บทสรุป

เอกสารที่ดูเหมือนปกปิดข้อมูลแล้ว แต่จริงๆ แล้วไม่ได้ปกปิด เป็นสิ่งที่แย่กว่าเอกสารที่ไม่ได้ปกปิด — เพราะมันสร้างความรู้สึกปลอดภัยที่ผิดๆ ซึ่งนำไปสู่การที่ผู้คนแชร์ข้อมูลที่ละเอียดอ่อนที่พวกเขาอาจจะป้องกันไว้หากไม่รู้สึกเช่นนั้น

สามประเด็นสำคัญ:

ใช้เครื่องมือปกปิดข้อมูลจริง การวาดรูปร่างทับข้อความไม่ได้ปกปิดอะไรเลย ข้อความยังคงอยู่ในไฟล์ ใช้เครื่องมือที่ลบเนื้อหาที่อยู่เบื้องล่าง
ตรวจสอบทุกครั้ง ลองเลือกข้อความในบริเวณที่ปกปิด ค้นหาเนื้อหาที่ถูกลบ และทดสอบในแอปพลิเคชันอื่น
ปกป้องเอกสารระหว่างการประมวลผล หากเครื่องมือของคุณอัปโหลด PDF ของคุณไปยังเซิร์ฟเวอร์ เอกสารที่ละเอียดอ่อนของคุณก็จะไปอยู่บนเซิร์ฟเวอร์ของบุคคลที่สามแล้ว เครื่องมือ Redact PDF ของ PDFSub ประมวลผลเอกสารในเบราว์เซอร์ของคุณ — ไฟล์จะไม่ไปไหนจากอุปกรณ์ของคุณ

ค่าใช้จ่ายในการปกปิดข้อมูลผิดพลาด คือการเปิดเผยหมายเลขประกันสังคม, การรั่วไหลของบันทึกทางการแพทย์, การเปิดเผยความลับทางการค้า และค่าปรับตามกฎระเบียบที่สูงถึงหลายล้าน การทำให้ถูกต้องมีค่าใช้จ่ายเพียงไม่กี่นาทีของคุณ

ลองใช้เครื่องมือ Redact PDF ของ PDFSub ฟรี 7 วัน และตรวจสอบด้วยตัวคุณเองว่าข้อมูลที่ละเอียดอ่อนนั้นหายไปอย่างถาวร