วิธีลบข้อมูลที่ละเอียดอ่อนออกจากไฟล์ PDF อย่างปลอดภัยและถาวร (Redaction) | PDFSub Blog
แนวปฏิบัติที่ดีที่สุดในการปกปิดข้อมูล
การมีเครื่องมือปกปิดข้อมูลที่ถูกต้องเป็นเพียงครึ่งหนึ่งของสมการ กระบวนการที่เกี่ยวข้องกับการปกปิดข้อมูลก็มีความสำคัญไม่แพ้กัน
1. ตรวจสอบเสมอหลังจากการปกปิด
หลังจากใช้การปกปิดแล้ว ให้ทดสอบผลลัพธ์ ลองเลือกข้อความในบริเวณที่ปกปิด หากคุณสามารถไฮไลต์อะไรที่อยู่ใต้กล่องสีดำได้ แสดงว่าการปกปิดล้มเหลว ค้นหา (Ctrl+F / Cmd+F) เนื้อหาที่ควรจะถูกลบ เปิดไฟล์ในโปรแกรมดู PDF อื่น เนื่องจากบางโปรแกรมจัดการคำอธิบายประกอบแตกต่างกัน สำหรับการปกปิดข้อมูลที่มีความสำคัญสูง (การดำเนินคดีทางกฎหมาย การยื่นเอกสารต่อหน่วยงานกำกับดูแล) ให้ใช้เครื่องมือแยกข้อความเพื่อดึงข้อความทั้งหมดออกมาและยืนยันว่าเนื้อหาที่ปกปิดนั้นไม่มีอยู่จริง
2. ลบข้อมูลเมตา (Metadata)
การปกปิดข้อความที่มองเห็นได้เป็นสิ่งจำเป็นแต่ไม่เพียงพอ PDF มีข้อมูลเมตาที่สามารถเปิดเผยข้อมูลที่ละเอียดอ่อนได้: คุณสมบัติเอกสาร (ผู้เขียน องค์กร วันที่สร้าง) ความคิดเห็นและคำอธิบายประกอบ ข้อมูลช่องกรอกแบบฟอร์ม ไฟล์แนบที่ฝังไว้ บุ๊กมาร์ก JavaScript และข้อมูลเมตา XMP กระบวนการปกปิดข้อมูลที่สมบูรณ์จะต้องลบข้อมูลทั้งหมดนี้ออก นอกเหนือจากเนื้อหาที่มองเห็นได้
3. ทำงานจากสำเนา
ห้ามปกปิดเอกสารต้นฉบับเด็ดขาด ให้สร้างสำเนา เก็บต้นฉบับไว้ในที่ปลอดภัย ดำเนินการปกปิดข้อมูลทั้งหมดบนสำเนา ตรวจสอบ และแจกจ่ายเฉพาะเวอร์ชันที่ปกปิดแล้ว ต้นฉบับที่ยังไม่ได้ปกปิดอาจจำเป็นต้องใช้ในภายหลังสำหรับการดำเนินคดี บันทึกการตรวจสอบ หรือการตรวจสอบภายใน
4. ใช้รูปลักษณ์การปกปิดที่สอดคล้องกัน
สร้างมาตรฐานรูปลักษณ์ของการปกปิดข้อมูลทั่วทั้งองค์กรของคุณ กล่องสีดำเป็นมาตรฐานสำหรับเอกสารทางกฎหมายและเอกสารราชการ พิจารณาเพิ่มป้ายกำกับการปกปิด (เช่น "REDACTED", "PRIVILEGED", "PII REMOVED") เพื่อให้ผู้อ่านทราบว่าทำไมเนื้อหาจึงถูกลบออก
5. บันทึกและทบทวน
เพื่อวัตถุประสงค์ทางกฎหมายและการปฏิบัติตามข้อกำหนด ให้เก็บบันทึกว่าใครเป็นผู้ดำเนินการปกปิดข้อมูล เมื่อใด หมวดหมู่ข้อมูลใดที่ถูกลบออก และใช้เครื่องมือใด สิ่งนี้จะสร้างบันทึกการตรวจสอบหากความเพียงพอของการปกปิดข้อมูลถูกตั้งคำถาม
ให้บุคคลที่สองทบทวนเอกสารที่ปกปิดแล้วก่อนที่จะออกจากองค์กรของคุณ สายตาที่สองจะช่วยจับการปกปิดที่พลาด การลบที่ไม่สมบูรณ์ และเบาะแสบริบทที่อาจทำให้ผู้อ่านอนุมานเนื้อหาที่ปกปิดได้จากข้อความโดยรอบ การทบทวนโดยสองคนเป็นแนวปฏิบัติมาตรฐานในสำนักงาน FOIA ของรัฐบาล
การปกปิดข้อมูลแบบกลุ่ม: การค้นหาและลบรูปแบบ
เมื่อคุณต้องการปกปิดข้อมูลประเภทเดียวกันในเอกสารขนาดใหญ่ การเลือกด้วยตนเองจะทำได้ไม่สะดวก การปกปิดข้อมูลแบบกลุ่มจะทำให้กระบวนการเป็นอัตโนมัติโดยการค้นหารูปแบบและทำเครื่องหมายการจับคู่ทั้งหมดในครั้งเดียว
รูปแบบทั่วไปสำหรับการปกปิดข้อมูลแบบกลุ่ม:
| ประเภทข้อมูล | รูปแบบ |
|---|---|
| หมายเลขประกันสังคม | XXX-XX-XXXX, XXX XX XXXX, XXXXXXXXX |
| ที่อยู่อีเมล | [email protected] |
| หมายเลขโทรศัพท์ | (XXX) XXX-XXXX, XXX-XXX-XXXX, +1XXXXXXXXXX |
| หมายเลขบัตรเครดิต | ลำดับตัวเลข 13-19 หลัก มักจะแบ่งเป็นกลุ่มละสี่หลัก |
| หมายเลขบัญชี | ลำดับตัวเลข 8-17 หลัก ตามหลัง "Account #" หรือ "Acct" |
| วันเกิด | MM/DD/YYYY, Month DD, YYYY, DD-MM-YYYY |
ขั้นตอนการทำงาน: กำหนดรูปแบบของคุณ ค้นหาในทุกหน้า ทบทวนการจับคู่แต่ละรายการ (ไม่ใช่ทุกรูปแบบที่จับคู่ได้นั้นละเอียดอ่อนจริงๆ) ใช้ทั้งหมดในครั้งเดียว จากนั้นทำการกวาดด้วยตนเองสำหรับเนื้อหาที่ไม่ตรงกับรูปแบบของคุณ ชื่อ ที่อยู่ และคำอธิบายที่เป็นข้อความอิสระ มักจะไม่ตรงกับรูปแบบง่ายๆ และต้องอาศัยการตรวจสอบโดยมนุษย์
ข้อกำหนดทางกฎหมายสำหรับการปกปิดข้อมูล
การปกปิดข้อมูล (Redaction) ไม่ใช่แค่แนวปฏิบัติที่ดีที่สุด แต่ในหลายบริบทถือเป็นข้อกำหนดทางกฎหมาย
FOIA (Freedom of Information Act). หน่วยงานรัฐบาลกลางที่ตอบสนองต่อคำขอ FOIA จะต้องเปิดเผยเอกสาร แต่มีข้อกำหนดให้ปกปิดข้อมูลที่เข้าข่ายการยกเว้นเก้าประการ ซึ่งรวมถึงข้อมูลความมั่นคงแห่งชาติ ความลับทางการค้า การละเมิดความเป็นส่วนตัวของบุคคล และบันทึกการบังคับใช้กฎหมาย กฎหมายเกี่ยวกับบันทึกสาธารณะของรัฐก็มีข้อกำหนดที่คล้ายคลึงกัน การปกปิดข้อมูลที่ไม่ถูกต้องอาจนำไปสู่การฟ้องร้อง คำสั่งศาล และการลงโทษหน่วยงาน
GDPR. ภายใต้กฎระเบียบการคุ้มครองข้อมูลทั่วไปของสหภาพยุโรป (EU General Data Protection Regulation) องค์กรที่ตอบสนองต่อคำขอเข้าถึงข้อมูลของเจ้าของข้อมูล (มาตรา 15) จะต้องปกปิดข้อมูลส่วนบุคคลของบุคคลที่สามในเอกสารเดียวกัน "สิทธิ์ในการลบ" (มาตรา 17) อาจกำหนดให้ต้องปกปิดข้อมูลส่วนบุคคลจากเอกสารที่องค์กรต้องเก็บรักษาไว้ การละเมิดอาจส่งผลให้ถูกปรับเป็นเงินสูงสุด 20 ล้านยูโร หรือ 4% ของรายได้ทั่วโลกต่อปี
HIPAA. ข้อมูลสุขภาพที่ได้รับการคุ้มครอง (Protected health information) จะต้องถูกระบุตัวตนก่อนการเปิดเผยเพื่อวัตถุประสงค์อื่นนอกเหนือจากการรักษา วิธีการ "Safe Harbor" กำหนดให้ต้องลบตัวระบุทั้ง 18 ประเภทที่กล่าวไว้ก่อนหน้านี้ การลงโทษมีตั้งแต่ 100 ถึง 50,000 ดอลลาร์สหรัฐต่อการละเมิดหนึ่งครั้ง
คำสั่งศาล. ศาลมักมีคำสั่งให้ปกปิดชื่อบุคคลทั่วไป ความลับทางการค้า ตัวตนของผู้ให้ข้อมูล และข้อมูลที่ถูกปิดผนึกในการยื่นเอกสารต่อสาธารณะ การไม่ปฏิบัติตามอาจส่งผลให้ถูกลงโทษฐานละเมิดอำนาจศาล การยกฟ้องคดี หรือการลงโทษทางวินัยต่อนักกฎหมาย
กฎหมายความเป็นส่วนตัวของรัฐ. CCPA/CPRA ของแคลิฟอร์เนีย, CDPA ของเวอร์จิเนีย, CPA ของโคโลราโด และกฎหมายของรัฐอื่นๆ ที่คล้ายคลึงกัน กำหนดภาระผูกพันคล้ายกับ GDPR องค์กรที่ตอบสนองต่อคำขอข้อมูลของผู้บริโภคจะต้องปกปิดข้อมูลของบุคคลที่สามก่อนการเปิดเผย
คำถามที่พบบ่อย
ข้อมูลที่ปกปิดไปแล้วสามารถกู้คืนได้หรือไม่?
หากการปกปิดข้อมูลดำเนินการอย่างถูกต้องโดยใช้เครื่องมือปกปิดข้อมูลที่แท้จริง — ไม่ ข้อมูลอักขระจะถูกลบอย่างถาวร ไม่มีชั้นซ่อน ไม่มีสำรองข้อมูลที่เข้ารหัส ไม่มีเส้นทางการกู้คืนทางนิติเวช หาก "การปกปิด" เป็นเพียงรูปร่างที่วาดทับข้อความ (การปกปิดปลอม) ก็สามารถทำได้ — ใครก็ตามสามารถเลือก คัดลอก และวางข้อความที่ซ่อนอยู่ได้ด้วยโปรแกรมดู PDF ทั่วไป
ฉันสามารถปกปิดข้อมูลในรูปภาพภายใน PDF ได้หรือไม่?
ได้ เครื่องมือปกปิดข้อมูลสามารถวางกล่องทับบริเวณของรูปภาพที่ฝังอยู่ โดยการประมวลผลภาพบริเวณที่ได้รับผลกระทบด้วยสีทึบ เพื่อทำลายพิกเซลต้นฉบับ สิ่งนี้สำคัญสำหรับเอกสารสแกนที่ข้อความปรากฏเป็นส่วนหนึ่งของรูปภาพ แทนที่จะเป็นอักขระที่เลือกได้
แล้วการปกปิดช่องกรอกแบบฟอร์มล่ะ?
ช่องกรอกแบบฟอร์ม PDF จะเก็บข้อมูลแยกต่างหากจากเนื้อหาหน้าจอที่มองเห็นได้ การวางกล่องปกปิดทับตำแหน่งที่มองเห็นของช่องกรอกแบบฟอร์ม ไม่ได้หมายความว่าจะลบข้อมูลที่เก็บไว้ออก การปกปิดข้อมูลที่สมบูรณ์จะต้องทำให้ช่องกรอกแบบฟอร์มและข้อมูลที่เกี่ยวข้องแบนราบหรือลบออก
การปกปิดข้อมูลจะเปลี่ยนเค้าโครงหน้ากระดาษหรือไม่?
ไม่ บริเวณที่ปกปิดจะถูกแทนที่ด้วยกล่องสีทึบที่กินพื้นที่เท่ากับเนื้อหาที่ถูกลบออก ข้อความและเค้าโครงโดยรอบจะยังคงอยู่ในตำแหน่งเดิม
ฉันสามารถยกเลิกการปกปิดข้อมูลได้หรือไม่?
ไม่ได้ — นั่นคือประเด็น การปกปิดข้อมูลเป็นการถาวรและไม่สามารถย้อนกลับได้ นี่คือเหตุผลที่คุณควรทำงานจากสำเนาเสมอ และเก็บต้นฉบับที่ยังไม่ได้ปกปิดไว้ในที่ปลอดภัย
การปกปิดข้อมูลแตกต่างจากการเข้ารหัสอย่างไร?
การเข้ารหัสจำกัด ว่าใครสามารถเข้าถึง เอกสารทั้งหมดได้ การปกปิดข้อมูลจำกัด เนื้อหาใด ที่มองเห็นได้ภายในเอกสารที่ทุกคนสามารถเข้าถึงได้ ทั้งสองอย่างมีวัตถุประสงค์ที่แตกต่างกัน และมักใช้ร่วมกัน
การพิมพ์เป็น PDF หลังจากปิดบังข้อความ เป็นวิธีการปกปิดข้อมูลที่ถูกต้องหรือไม่?
ไม่น่าเชื่อถือ ไดรเวอร์บางตัวที่พิมพ์เป็น PDF จะทำให้ชั้นภาพแบนราบและลบข้อความที่อยู่เบื้องล่าง ไดรเวอร์บางตัวจะเก็บรักษาไว้ วิธีนี้ไม่ควรนำมาใช้สำหรับการปกปิดข้อมูลที่ละเอียดอ่อน ควรใช้เครื่องมือปกปิดข้อมูลโดยเฉพาะ
ฉันสามารถปกปิด PDF ที่มีการป้องกันด้วยรหัสผ่านได้หรือไม่?
คุณต้องปลดล็อก PDF ก่อนทำการปกปิด หาก PDF มีรหัสผ่านของเจ้าของ (จำกัดการแก้ไข) หรือรหัสผ่านของผู้ใช้ (จำกัดการเปิด) คุณต้องมีรหัสผ่านนั้นก่อน เมื่อปลดล็อกแล้ว กระบวนการปกปิดข้อมูลจะเหมือนกับ PDF ที่ไม่ได้รับการป้องกันทั่วไป
บทสรุป
เอกสารที่ดูเหมือนปกปิดข้อมูลแล้ว แต่จริงๆ แล้วไม่ได้ปกปิด เป็นสิ่งที่แย่กว่าเอกสารที่ไม่ได้ปกปิด — เพราะมันสร้างความรู้สึกปลอดภัยที่ผิดๆ ซึ่งนำไปสู่การที่ผู้คนแชร์ข้อมูลที่ละเอียดอ่อนที่พวกเขาอาจจะป้องกันไว้หากไม่รู้สึกเช่นนั้น
สามประเด็นสำคัญ:
- ใช้เครื่องมือปกปิดข้อมูลจริง การวาดรูปร่างทับข้อความไม่ได้ปกปิดอะไรเลย ข้อความยังคงอยู่ในไฟล์ ใช้เครื่องมือที่ลบเนื้อหาที่อยู่เบื้องล่าง
- ตรวจสอบทุกครั้ง ลองเลือกข้อความในบริเวณที่ปกปิด ค้นหาเนื้อหาที่ถูกลบ และทดสอบในแอปพลิเคชันอื่น
- ปกป้องเอกสารระหว่างการประมวลผล หากเครื่องมือของคุณอัปโหลด PDF ของคุณไปยังเซิร์ฟเวอร์ เอกสารที่ละเอียดอ่อนของคุณก็จะไปอยู่บนเซิร์ฟเวอร์ของบุคคลที่สามแล้ว เครื่องมือ Redact PDF ของ PDFSub ประมวลผลเอกสารในเบราว์เซอร์ของคุณ — ไฟล์จะไม่ไปไหนจากอุปกรณ์ของคุณ
ค่าใช้จ่ายในการปกปิดข้อมูลผิดพลาด คือการเปิดเผยหมายเลขประกันสังคม, การรั่วไหลของบันทึกทางการแพทย์, การเปิดเผยความลับทางการค้า และค่าปรับตามกฎระเบียบที่สูงถึงหลายล้าน การทำให้ถูกต้องมีค่าใช้จ่ายเพียงไม่กี่นาทีของคุณ
ลองใช้เครื่องมือ Redact PDF ของ PDFSub ฟรี 7 วัน และตรวจสอบด้วยตัวคุณเองว่าข้อมูลที่ละเอียดอ่อนนั้นหายไปอย่างถาวร