PDF файлаас мэдээллийг хэрхэн арилгах вэ
PDF дээрх текстийг хар зургаар будсанаар устгахгүй. Текст нь сонгох, хайх, гаргаж авах боломжтой хэвээр байна. Мэдрэмтгий мэдээллийг бүрмөсөн устгахын тулд PDF файлыг хэрхэн бодит байдлаар арилгах талаар энд тайлбарласан болно.
Таны PDF файл дээр 3-р хуудсанд Нийгмийн даатгалын дугаар, 7-р хуудсанд үйлчлүүлэгчийн гэрийн хаяг, 12-р хуудсанд хүснэгтэнд нуугдсан банкны дансны дугаар байна. Та энэ баримт бичгийг өрсөлдөгч хуульч, зохицуулах байгууллага, бизнесийн түнш эсвэл олон нийттэй хуваалцах шаардлагатай боловч тэрхүү мэдрэмтгий мэдээллийг зайлшгүй арилгах ёстой.
Тиймээс та PDF файлыг нээгээд, SSN дээр хар тэгш өнцөгт зурж, хадгалж, илгээдэг.
Та дэлхий дээрх хамгийн түгээмэл арилгах алдааг гаргасан байна. Текст нь хэвээрээ байна. Энэ PDF файлыг хүлээн авсан хэн ч "арилгасан" хэсгийг сонгож, нуугдсан текстийг хуулж, текст редактор руу буулгаж болно. Таны үйлчлүүлэгчийн SSN одоо хэн нэгний санах ойд байна.
Энэ бол зөвхөн онолын эрсдэл биш. АНУ-ын Хууль зүйн яам, TSA, Fortune 500 компаниуд болон өндөр профильтай хэргүүдийг хариуцдаг хуулийн фирмүүдэд ийм явдал тохиолдож байсан. Бодит арилгах ажиллагаа нь мэдээллийг үнэхээр бүрмөсөн устгах зорилготой бөгөөд тусгай журам шаарддаг. Текстэн дээр дүрс зурах нь тийм биш юм.
Энэхүү гарын авлага нь бодит арилгах ажиллагаа гэж юу болох, хуурамч хувилбараас юугаараа ялгаатай болох, мөн үүнийг зөв хийх гурван аргыг багтаасан болно. Үүнд таны баримт бичгийг бүхэлд нь таны хөтөч дээр боловсруулдаг арга багтсан бөгөөд ингэснээр мэдрэмтгий агуулга нь хэзээ ч серверт хүрэхгүй.
Арилгах гэдэг нь үнэндээ юу гэсэн үг вэ?
Арилгах гэдэг нь баримт бичгээс мэдээллийг бүрмөсөн, эргэлт буцалтгүй устгах явдал юм. Нуух биш. Далдлах биш. Устгах.
Та PDF файлыг зөв арилгах үед: харагдаж буй текст нь хар хайрцгаар солигдож, доорх тэмдэгт өгөгдөл нь PDF-ийн агуулгын урсгалаас устгагдаж, текст нь хайлтаас хасагдаж, хуулж-буулгах эсвэл програмчлалаар гаргаж авах боломжгүй болж, холбогдох мета өгөгдөл (тэмдэглэл, сэтгэгдэл, маягтын талбар) цэвэрлэгдэнэ. Эдгээр нөхцөлүүдийн аль нэг нь биелэгдээгүй бол та зөвхөн харагдах байдлыг өөрчилсөн байна - арилгасан биш.
PDF нь текстийг хэрхэн хадгалдаг (Мөн яагаад давхарлалт бүтэлгүйтдэг)
Хар хайрцгууд яагаад ажилладаггүйг ойлгохын тулд PDF нь текстийг хэрхэн хадгалдаг талаар мэдэх хэрэгтэй.
PDF хуудас нь агуулгын урсгал юм - энэ нь тодорхой x, y координат дээр хуудасны гадаргуу дээр тэмдэгтүүдийг байрлуулах операторуудын дараалал юм. "SSN: 123-45-6789" гэсэн текст нь тус бүрийн тэмдэгтийг тодорхой байрлалд байрлуулах байршлын командыг хадгалдаг. Энэ текстийн дээр хар тэгш өнцөгт зурах нь агуулгын урсгал дээр шинэ график элементийг нэмдэг боловч анхны текстийн операторууд өөрчлөгдөөгүй хэвээр байна. Текст нь файлаас устгаагүй хэвээр байна. Энэ нь сонгогдох боломжтой хэвээр байна. Энэ нь гаргаж авах боломжтой хэвээр байна.
Үүнийг хэвлэмэл баримт бичгийн мөрийг хар цаасаар хучсан мэт төсөөлөөд үз. Бэх нь доорх хуудсанд хэвээрээ байна. Бодит арилгах ажиллагаа нь энэ мөрийг хуудаснаас бүхэлд нь хайчлан, үлдэгдлийг нь шатаахтай адил юм.
Бодит арилгах ажиллагаа ба хуурамч арилгах ажиллагаа
| Бодит арилгах ажиллагаа | Хуурамч арилгах ажиллагаа | |
|---|---|---|
| Харагдах байдал | Агуулгын дээр хар хайрцаг | Агуулгын дээр хар хайрцаг |
| Доорх текст | Бүрсэн устгагдсан | Файлд хэвээр байна |
| Сонгох ба хуулах | Сонгох зүйл байхгүй | Текстийг хуулж болно |
| Текст хайлт | Олдохгүй | Олдоно |
| Програмчлалаар гаргаж авах | Өгөгдөл гарахгүй | Бүх текст гаргаж авна |
| Мета өгөгдөл | Цэвэрлэгдсэн | Өөрчлөгдөөгүй |
| Эргэлт буцалттай юу? | Үгүй — мэдээлэл устгагдсан | Тийм — давхарлалтыг арилгах боломжтой |
Гаднаас нь харахад бодит болон хуурамч арилгах ажиллагаа нь адилхан харагддаг. Хоёр тохиолдолд хар хайрцаг байдаг. Ялгаа нь зөвхөн доорх нөхцөл байдалд үүсдэг бөгөөд энэ ялгаа нь сүүлийн үеийн түүхэн дэх хамгийн ичгүүртэй мэдээллийн алдагдлын зарим шалтгаан болсон юм.
Алдартай арилгах алдаанууд
Эдгээр нь таамаглал биш юм. Доорх бүх тохиолдолд томоохон байгууллагуудын мэргэжилтнүүд мэдрэмтгий мэдээллийг арилгасан гэж бодож байсан. Гэвч тэд арилгаагүй байсан.
Манафортын хэрэг (2019)
Пол Манафортын өмгөөлөгчид АНУ-ын тойргийн шүүхэд гаргасан баримт бичигт тэд үйлчлүүлэгчийнхээ Оросын тагнуултай харилцах харилцааны дэлгэрэнгүй мэдээллийг арилгахыг хүссэн байв. "Арилгасан" хэсгүүд нь хар хайрцаг байсан боловч доорх текст нь бүрэн бүтэн байсан. Судлаачид зүгээр л нуугдсан текстийг хуулж, буулгаад Манафорт Оросын хамтрагчтай санал асуулгын өгөгдлийг хуваалцсан болохыг илрүүлсэн. Энэ түүх нь бүхэл бүтэн мэдээллийн мөчлөгийг эзэлсэн. Хуулийн баг нь үгийн процессорын өнгө тодруулах функцийг (хар өнгө нь хар текстэн дээр) ашиглан, текст давхаргыг хадгалж үлдсэнийг анзааралгүйгээр PDF руу экспортолсон.
TSA нисэх онгоцны буудлын аюулгүй байдлын зураг төсөл (2009)
Нисэх онгоцны буудлын аюулгүй байдлын шалгалтын журмын гарын авлагын арилгасан хувилбарыг Тээврийн аюулгүй байдлын газар нийтэлжээ. Арилгах ажиллагаа нь PDF дээрх текстийн дээр хар тэгш өнцөгтүүдийг зурсан байв. Аюулгүй байдлын судлаачид давхарлалтыг арилгаж, бүхэлд нь арилгаагүй баримт бичгийг олж авсан бөгөөд энэ нь шалгалтын хөнгөлөлт, хууль сахиулах байгууллагын таних журам, шалгалтын цэгийн эмзэг байдлын талаархи дэлгэрэнгүй мэдээллийг агуулсан байв. TSA нь бүх шалгалтын журмаа шинэчлэх шаардлагатай болсон.
AT&T / NSA хууль бус чагнах хэрэг (2006)
AT&T-ийн эсрэг хууль бус чагнах ажиллагааны талаархи Электрон хил хамгаалалтын сангийн нэхэмжлэлд AT&T нь "арилгасан" худалдааны нууцыг агуулсан хуулийн товч мэдээллийг гаргасан. Арилгах ажиллагаа нь PDF дээрх текстийн дээр хар хайрцагнууд байсан. AT&T байгууламж дахь NSA-ийн хяналтын дэд бүтцийн талаархи дэлгэрэнгүй текстийг ямар ч хүндрэлгүйгээр гаргаж авч болно. Баримт бичгийг татаж авахаас өмнө мянга мянган удаа татаж авсан.
Хэв маяг
Бүх тохиолдолд алдааны горим нь ижил байсан: текст өөрөө устгалгүйгээр түүний дээр график элемент зурсан. Мөн эдгээр алдааг гаргасан хүмүүс бол хайхрамжгүй хүмүүс биш байсан — тэд хуульч, төрийн албан хаагчид, аюулгүй байдлын мэргэжилтнүүд байсан. Тэдний ашигласан хэрэгслүүд (үгийн процессорууд, үндсэн PDF редакторууд, тайлбарлах функцууд) нь бодит арилгах ажиллагааг хийдэггүй.
Та ямар мэдээллийг арилгах ёстой вэ?
Хариулт нь таны зохицуулах орчноос хамаарна, гэхдээ дараах ангиллууд нь бизнесийн баримт бичгүүд дэх хамгийн түгээмэл мэдрэмтгий өгөгдлийг хамардаг.
Хувь хүн таних боломжтой мэдээлэл (PII)
- Нийгмийн даатгалын дугаар (SSN) болон татвар төлөгчийн таних дугаар (TIN)
- Банкны дансны дугаар болон дамжуулах дугаар
- Зээл, дебит картны дугаар
- Жолооны үнэмлэх, паспортын дугаар
- Төрсөн огноо
- Гэрийн хаяг болон хувийн утасны дугаар
- Имэйл хаяг (бусад PII-тэй холбоотой үед)
- Биометрик танигч
Санхүүгийн мэдээлэл
- Дансны үлдэгдэл болон гүйлгээний түүх
- Цалин, нөхөн олговор
- Татварын тайлангийн мэдээлэл
- Хөрөнгө оруулалтын дансны дэлгэрэнгүй
- Зээл, ипотекийн мэдээлэл
- Зээлийн оноо ба зээлийн тайлангийн мэдээлэл
Эрүүл мэнд, эмнэлгийн мэдээлэл (HIPAA)
- Өвчтөний нэр нь эрүүл мэдээлэлтэй хослуулсан байх
- Эмнэлгийн бүртгэлийн дугаар
- Оношлогоо ба эмчилгээний дэлгэрэнгүй
- Жорны мэдээлэл
- Эрүүл мэндийн даатгалын гэрээний дугаар
- Лабораторийн үр дүн ба эмнэлгийн зураг авалтын тайлан
Хууль зүйн болон бизнесийн мэдээлэл
- Шүүхийн баримт бичиг дэх насанд хүрээгүй хүүхдийн нэр
- Эрүүгийн хэрэг хянан шийдвэрлэх ажиллагаанд хохирогч, гэрч нарын танигч
- Өмгөөлөгч-үйлчлүүлэгчийн нууцын харилцаа
- Худалдааны нууц ба өмчийн томъёо
- Хаалттай шүүхийн бүртгэл ба тангарагтны зөвлөлийн материал
- Хэргийн дугаар ба шүүх хуралдааны мэдээлэл (зарим шүүх засаг захиргаанд)
- Нууцлагдсан тохиролцлын нөхцөл
Хүний нөөц ба ажилд авах бүртгэл
- Ажилтны SSN ба татварын хасагдуулгын мэдээлэл
- Цалингийн хэмжээ ба шагналт олговроос
- Сахилгын тэмдэглэл ба ажлын гүйцэтгэлийн үнэлгээ
- Эрүүл мэндийн чөлөөний дэлгэрэнгүй
- Шалгалтын үр дүн
- Дотоод мөрдөн шалгах тэмдэглэл
Ерөнхий дүрэм: Хэрэв мэдээлэл нь тодорхой хүнийг таниулах, санхүүгийн байдлыг нь илчлэх, эрүүл мэндийн түүхийг нь дэлгэх, эсвэл нууцлагдсан харилцааг илчлэх боломжтой бол түүнийг зохих ёсоор шаардлагатай хүмүүсээс бусадтай хуваалцахаас өмнө арилгах ёстой.
Баримт бичгийн төрлөөр
Өөр өөр баримт бичиг нь мэдрэмтгий мэдээллийг өөр өөр газарт нуудаг:
- Хууль зүйн баримт бичиг: Талуудын нэр, хаяг (ялангуяа гэр бүлийн/хүүхдийн хэрэгт), нууцлагдсан харилцаа, гэрчийн танигч, тохиролцлын нөхцөл, санхүүгийн баримт дахь SSN, хүүхдийн нэр
- Санхүүгийн баримт бичиг: Данс ба дамжуулах дугаар, SSN/TIN, гүйлгээний дэлгэрэнгүй, үлдэгдэл, цалингийн мэдээлэл
- Эмнэлгийн бүртгэл (HIPAA): HIPAA-ийн Нууцлалын дүрмээр де-идентификаци хийхийн тулд арилгах ёстой 18 тодорхой танигчийг заасан байдаг. Үүнд нэр, газарзүйн мэдээлэл, огноо, утас/факс/имэйл, SSN, эмнэлгийн бүртгэлийн дугаар, эрүүл мэндийн даатгалын ID, дансны дугаар, лицензийн дугаар, төхөөрөмжийн танигч, биометрик өгөгдөл, гэрэл зураг орно. Зөрчлийн торгууль нь нэг зөрчилд 100-50,000 доллар хүртэл байдаг.
- Хүний нөөцийн баримт бичиг: Татварын маягт дээрх ажилтны SSN (W-2, W-4, I-9), цалингийн хэмжээ, сахилгын тэмдэглэл, эрүүл мэндийн чөлөөний дэлгэрэнгүй, шалгалтын үр дүн, хувийн холбоо барих мэдээлэл
Арга 1: PDFSub Арилгах хэрэгсэл (Санал болгож байна)
PDFSub-ийн PDF арилгах хэрэгсэл нь жинхэнэ арилгах ажиллагааг хийдэг — арилгах тэмдэглэлийн доорх текст нь файлаас бүрмөсөн устдаг, зөвхөн харагдах байдлаар хучигддаггүй. Мөн хэрэгсэл нь таны хөтөч дээр бүхэлдээ ажилладаг тул таны мэдрэмтгий мэдээллийг агуулсан баримт бичиг таны төхөөрөмжөөс хэзээ ч гарахгүй.
Хэрхэн ажилладаг
Алхам 1: Таны PDF файлыг байршуулна уу. Баримт бичгээ PDF арилгах хэрэгсэл руу чирч эсвэл дарж сонгоно уу. Файл нь шууд таны хөтөч рүү ачаалагддаг — серверт байршуулах шаардлагагүй.
Алхам 2: Арилгах газруудыг тэмдэглэнэ үү. Устгахыг хүссэн текст эсвэл бүсийг сонгоно уу. Та тодорхой үгс, өгүүлбэр, бүхэл бүтэн хэсгийг тодруулж эсвэл зураг, диаграм дээр арилгах хайрцаг зурж болно. Хэрэгсэл нь таныг баталгаажуулахаас өмнө юу арилгахыг тодорхой харуулна.
Алхам 3: Арилгах ажиллагааг хэрэглэнэ үү. Хэрэглэхийн тулд дарна уу. Хэрэгсэл нь тэмдэглэгдсэн агуулгыг PDF-ийн агуулгын урсгалаас бүрмөсөн устгадаг. Текст нь устгагддаг — нуугддаггүй, давхарлагддаггүй, устгагддаг. Агуулга байсан газар хар хайрцаг дүүргэнэ.
Алхам 4: Татаж авна уу. Арилгасан PDF файлыг хадгална уу. Татаж авсан файл нь устгагдсан мэдээллийн ул мөргүй байдаг. Арилгасан хэсэгт текстийг сонгож үзэх (сонгох зүйл байхгүй) эсвэл устгагдсан агуулгыг хайх (олддоггүй) замаар үүнийг баталгаажуулж болно.
Энэ аргыг мэдрэмтгий баримт бичгүүдэд яагаад хамгийн сайн болох вэ
Хөтөч дээр суурилсан боловсруулалт. Арилгах бүх үйл явц таны хөтөч дээр явагддаг. Таны PDF нь интернетээр хэзээ ч дамжихгүй, гуравдагч этгээдийн серверт хэзээ ч хүрэхгүй, мөн хэзээ ч бүртгэгдэхгүй, санах ойд хадгалагдахгүй, хадгалагдахгүй. Зохицуулалтын мэдрэмтгий ажлын урсгалд энэ нь зүгээр л нэмэлт зүйл биш — энэ нь шаардлага юм.
Жинхэнэ арилгах ажиллагаа, тайлбар биш. Текст нь PDF-ийн дотоод өгөгдлийн бүтэцээс үнэхээр устгагддаг, зүгээр л хучигддаггүй. Арилгасны дараа агуулгыг эргүүлэн авч чадахгүй.
Боломжийн үнэтэй. Жилийн 240 доллараар зарагддаг Adobe Acrobat Pro-оос ялгаатай нь PDFSub нь мэргэжлийн арилгах ажиллагааг бага зардлаар хангадаг. Хэрэгсэл нь таны хэрэгцээг хангаж байгаа эсэхийг баталгаажуулахын тулд 7 хоногийн турш үнэгүй туршилтаар эхэлнэ үү.
Ямар ч төхөөрөмж дээр ажиллана. Windows, Mac, Linux, Chromebook болон таблет дээрх PDF файлыг арилгана уу — орчин үеийн вэб хөтөчтэй хаана ч байсан.
Арга 2: Adobe Acrobat Pro
Adobe Acrobat Pro нь жинхэнэ арилгах ажиллагааг гүйцэтгэдэг тусгай зориулалттай арилгах хэрэгслийг агуулдаг. Энэ нь хууль зүйн болон засгийн газрын ажлын урсгалд салбарын стандарт юм.
Acrobat Pro дээр хэрхэн арилгах вэ
Алхам 1: Арилгах хэрэгслийг нээнэ үү. Хэрэгслүүд > Арилгах руу очно уу. Энэ нь арилгах хэрэгслийн самбарыг нээнэ.
Алхам 2: Арилгах агуулгыг тэмдэглэнэ үү. Текстийг сонгохын тулд дарж чирнэ үү, бүхэл бүтэн хуудсыг арилгана уу, эсвэл баримт бичгийн турш хэв маягийг (SSN формат гэх мэт) хайхын тулд "Олж, арилгах" функцыг ашиглана уу.
Алхам 3: Арилгах ажиллагааг хэрэглэнэ үү. Энэ бол олон хэрэглэгчдээс алддаг чухал алхам юм. Тэмдэглэх нь текстийн эргэн тойронд улаан хүрээ тавьдаг — энэ нь одоог хүртэл устгахгүй. Та агуулгыг бүрмөсөн устгахын тулд "Хэрэглэх" товчийг дарна уу.
Алхам 4: Нуугдсан мэдээллийг арилгана уу. Мета өгөгдөл, сэтгэгдэл, маягтын талбар болон хавсаргасан файлуудыг цэвэрлэхийн тулд "Нуугдсан мэдээллийг арилгах" функцыг ашиглана уу.
Давуу болон сул талууд
Acrobat Pro нь салбарын стандарт бөгөөд хууль зүйн/засгийн газрын өргөн хүлээн зөвшөөрөлтэй, багц "Олж, арилгах" функцтэй, мөн нуугдсан мэдээллийг арилгадаг. Гэсэн хэдий ч энэ нь жилд 240 доллар үнэтэй, ширээний компьютер дээр суулгах шаардлагатай, мөн хоёр шаттай процесс (тэмдэглэх, дараа нь хэрэглэх) нь хэрэглэгчид хэрэглэх алхмыг мартах үед алдаа гаргах түгээмэл шалтгаан болдог.
Хоёр шаттай төвөг
Энэ нь бодит мэдээллийн алдагдлыг үүсгэдэг тул онцлон тэмдэглэх нь зүйтэй: арилгах зорилгоор агуулгыг тэмдэглэх нь үүнийг арилгахтай адил биш юм. Тэмдэглэх нь харагдах байдлын тэмдэглэгчийг байрлуулдаг. Текст нь файлаас устгаагүй хэвээр байна. Зөвхөн хэрэглэх нь үүнийг устгадаг. Хэрэв та хэрэглэхээсээ өмнө тэмдэглэсний дараа хадгалж, хуваалцвал та хуурамч арилгах ажиллагаатай баримт бичгийг хуваалцсан байна.
Арга 3: Mac дээрх Preview
Apple-ийн Preview програм (macOS-д суурилсан) нь текстийн дээр хар тэгш өнцөгтүүдийг байрлуулж болох тайлбарлах хэрэгслүүдтэй. Олон Mac хэрэглэгчид үүнийг арилгах ажиллагаа гэж үздэг. Энэ нь тийм биш юм.
Preview үнэндээ юу хийдэг
Preview-ийн тэгш өнцөгт тайлбарлах хэрэгслийг ашиглан текстийг хучих үед:
- PDF агуулгын дээр хар хэлбэр дүрс зурна
- Доорх текст бүрэн бүтэн хэвээр байна
- Текстийг тэгш өнцөгтийн доор дарж чирч сонгож болно
- Текст нь хайлтын үр дүнд (Cmd+F) гарч ирдэг
- Текстийг ямар ч PDF задлах хэрэгслээр гаргаж авч болно
- Тайлалтыг бүхэлд нь арилгаж, анхны текстийг ил гаргаж болно
АНХААРУУЛГА: Preview нь бодит арилгах ажиллагааг хийдэггүй
Preview-ийн тайлбар нь арилгах ажиллагаа биш юм. Тэд Манафорт, TSA, болон AT&T-ийн өмнө дурдагдсан бүтэлгүйтлийг үүсгэсэн яг ижил харагдах байдлын давхарлалт юм. PDF файлыг "арилгах" зорилгоор Preview ашиглан хуваалцах нь үнэндээ арилгаагүй баримт бичгийг хуваалцахтай адил юм.
macOS Sequoia (2025) хүртэл Preview нь жинхэнэ арилгах функц агуулаагүй болно. Хэрэв та Mac дээр байгаа бол PDFSub-ийн хөтөч дээр суурилсан PDF арилгах хэрэгсэл эсвэл Adobe Acrobat Pro-г ашиглана уу.
Preview-ийн бүтэлгүйтлийг хэрхэн баталгаажуулах
Өөрөө туршиж үз: дурын PDF файлыг Preview дээр нээж, зарим текстийн дээр хар дүүргэсэн тэгш өнцөгт зурж, хадгалж, дахин нээгээд, "нуугдсан" текстийг хайхын тулд Cmd+F дарна уу. Энэ нь олддог болно. Энэ нь хэзээ ч устгагдаагүй. Энэ 30 секундын туршилт нь тайлбарлах хэрэгслүүд арилгах зорилгоор ашиглагдвал яагаад аюултай болохыг харуулж байна.
Арилгах шилдэг туршлагууд
Арилгах хэрэгслийг зөв сонгох нь зөвхөн тал хувь нь юм. Арилгах ажиллагааны эргэн тойрон дахь үйл явц нь адил чухал.
1. Арилгасны дараа үргэлж баталгаажуулна уу
Арилгах ажиллагааг хэрэглэсний дараа үр дүнг нь туршиж үзнэ үү. Арилгасан хэсэгт текстийг сонгож үзээрэй — хэрэв та хар хайрцгийн доор ямар нэгэн зүйлийг тодруулж чадвал арилгах ажиллагаа бүтэлгүйтсэн байна. Устгагдсан агуулгыг хайх (Ctrl+F / Cmd+F). Өөр PDF үзэгч дээр файлыг нээнэ үү, учир нь зарим нь тайлбарыг өөр өөрөөр боловсруулдаг. Өндөр эрсдэлтэй арилгах ажиллагаа (хууль зүйн процесс, зохицуулалтын материал) нь бүх текстийг гаргаж, арилгасан агуулга байхгүй эсэхийг баталгаажуулахын тулд текст гаргаж авах хэрэгслийг ашиглана уу.
2. Мета өгөгдлийг арилгана уу
Харагдах текстийг арилгах нь шаардлагатай боловч хангалттай биш. PDF нь мэдрэмтгий мэдээллийг илчилж болох мета өгөгдлийг агуулдаг: баримт бичгийн шинж чанарууд (зохиогч, байгууллага, үүсгэсэн огноо), сэтгэгдэл ба тайлбар, маягтын талбарын өгөгдөл, хавсаргасан файлууд, тэмдэглэл, JavaScript болон XMP мета өгөгдөл. Цогц арилгах ажлын урсгал нь харагдах агуулгаас гадна эдгээрийг бүгдийг нь арилгадаг.
3. Хуулбар дээр ажиллана уу
Хэзээ ч анхны баримт бичгийг арилгахгүй байх. Хуулбар хийж, анхны хувийг аюулгүй газар хадгалж, бүх арилгах ажиллагааг хуулбар дээр гүйцэтгэж, баталгаажуулж, зөвхөн арилгасан хувилбарыг тараана уу. Арилгаагүй анхны хувийг хууль зүйн процесс, хяналтын ул мөр эсвэл дотоод хяналт шалгалтанд дараа нь ашиглах шаардлагатай байж болно.
4. Арилгах байдлыг тогтвортой болгоно уу
Танай байгууллага даяар арилгах ажиллагааны харагдах байдлыг стандартчилна уу. Хууль зүйн болон засгийн газрын баримт бичгүүдэд хар хайрцаг нь стандарт юм. Агуулгыг яагаад арилгасныг уншигчдад мэдэгдэхийн тулд арилгах шошгыг (жишээ нь, "REDACTED", "PRIVILEGED", "PII REMOVED") нэмэхийг авч үзнэ үү.
5. Баримтжуулж, хянана уу
Хууль зүйн болон зохицуулалтын зорилгоор, хэн арилгах ажиллагааг гүйцэтгэсэн, хэзээ, ямар ангиллын мэдээлэл устгагдсан, мөн ямар хэрэгсэл ашиглагдсан талаар тэмдэглэл хөтөлнө. Энэ нь арилгах ажиллагааны хангалттай байдал хэзээ нэгэн цагт эргэлзээтэй болсон тохиолдолд хяналтын ул мөрийг бий болгоно.
Арилгасан баримт бичгийг танай байгууллагаас гаргахаас өмнө хоёр дахь хүн хянана уу. Шинэ нүд нь алдагдсан арилгах ажиллагаа, бүрэн бус устгал, мөн орчны текстийг үндэслэн арилгасан агуулгыг таамаглах боломжтой контекстийн тэмдэглэлийг олж хардаг. Хоёр хүний хяналт нь засгийн газрын FOIA албадын стандарт туршлага юм.
Багц арилгах ажиллагаа: Хэв маягийг олох ба устгах
Хэрэв та том баримт бичгийн турш ижил төрлийн мэдээллийг арилгах шаардлагатай бол гараар сонгох нь боломжгүй болно. Багц арилгах ажиллагаа нь хэв маягийг хайж, бүх тохиолдлыг нэг дор тэмдэглэснээр үйл явцыг автоматжуулдаг.
Багцаар арилгах түгээмэл хэв маягууд:
| Мэдээллийн төрөл | Хэв маягийн формат |
|---|---|
| Нийгмийн даатгалын дугаар | XXX-XX-XXXX, XXX XX XXXX, XXXXXXXXX |
| Имэйл хаяг | [email protected] |
| Утасны дугаар | (XXX) XXX-XXXX, XXX-XXX-XXXX, +1XXXXXXXXXX |
| Зээлийн картны дугаар | 13-19 оронтой тоон дараалал, ихэвчлэн дөрвөн бүлэгт хуваагдсан |
| Дансны дугаар | "Дансны #" эсвэл "Acct" гэсэн үгнүүдийн дараа 8-17 оронтой тоон дараалал |
| Төрсөн огноо | MM/DD/YYYY, Сар DD, YYYY, DD-MM-YYYY |
Ажлын урсгал: таны хэв маягийг тодорхойлж, бүх хуудсаар хайлтыг гүйцэтгэж, тохирол бүрийг хянана уу (бүх хэв маягийн тохирол нь үнэхээр мэдрэмтгий биш байдаг), бүгдийг нь нэг дор хэрэглэнэ үү, дараа нь таны хэв маягт тохироогүй агуулгыг гараар шалгана уу. Нэр, хаяг, чөлөөт текст тайлбарууд нь энгийн хэв маягт ховор тохирдог бөгөөд хүний хяналт шаарддаг.
Арилгах хуулийн шаардлага
Арилгах ажиллагаа нь зөвхөн шилдэг туршлага биш. Олон тохиолдолд энэ нь хуулийн шаардлага юм.
FOIA (Мэдээлэл авах эрхийн тухай хууль). Холбооны агентлагууд FOIA хүсэлтэд хариу өгөхдөө баримт бичгийг нийтлэх ёстой боловч есөн тусгай хязгаарлалтад хамаарах мэдээллийг арилгах шаардлагатай — үүнд үндэсний аюулгүй байдлын мэдээлэл, худалдааны нууц, хувийн нууцлал, хууль сахиулах байгууллагын бүртгэл орно. Мужийн нээлттэй мэдээллийн хуулиуд нь ижил төстэй шаардлагыг тулгадаг. Зохисгүй арилгах нь шүүх хэргүүд, шүүхийн захиалга, агентлагийн шийтгэлд хүргэж болзошгүй.
GDPR. ЕХ-ны Ерөнхий мэдээллийн хамгаалалтын дүрмийн дагуу, байгууллагууд мэдээллийн эзний хандалтын хүсэлт (Зүйл 15) -д хариу өгөхдөө бусад гуравдагч этгээдийн хувийн мэдээллийг ижил баримт бичигт арилгах ёстой. "Устгах эрх" (Зүйл 17) нь байгууллага нь хадгалах ёстой баримт бичгүүдээс хувийн мэдээллийг арилгах шаардлагатай байж болно. Зөрчлийн торгууль нь 20 сая еврогоос эсвэл жилийн дэлхийн орлогын 4% хүртэл байдаг.
HIPAA. Хамгаалагдсан эрүүл мэндийн мэдээлэл нь эмчилгээнээс бусад зорилгоор нийтлэхээс өмнө де-идентификаци хийх ёстой. "Аюулгүй байдлын" арга нь дээр дурдсан 18 танигч ангиллыг бүгдийг нь арилгахыг шаарддаг. Торгууль нь нэг зөрчилд 100-50,000 доллар хүртэл байдаг.
Шүүхийн захиалга. Шүүх нь олон нийтийн баримт бичигт насанд хүрээгүй хүүхдийн нэр, худалдааны нууц, мэдээлэгчийн танигч, битүүмжилсэн материалыг арилгахыг тогтмол захиалдаг. Дагаж мөрдөөгүй тохиолдолд шүүх хуралдааны шийтгэл, хэргийг хэрэгсэхгүй болгох, эсвэл өмгөөлөгчийн сахилгын арга хэмжээ авахуулж болно.
Мужийн нууцлалын хуулиуд. Калифорнийн CCPA/CPRA, Виржинийн CDPA, Колорадогийн CPA болон бусад ижил төстэй мужийн хуулиуд нь GDPR-тэй төстэй үүрэг хүлээлгэдэг. Хэрэглэгчийн мэдээллийг хандах хүсэлтэд хариу өгөх байгууллагууд гуравдагч этгээдийн мэдээллийг нийтлэхээс өмнө арилгах ёстой.
Түгээмэл асуултууд
Арилгасан текстийг хэзээ нэгэн цагт эргүүлэн авч болох уу?
Хэрэв арилгах ажиллагаа нь жинхэнэ арилгах хэрэгслийг ашиглан зөв хийгдсэн бол — үгүй. Тэмдэгт өгөгдөл нь бүрмөсөн устгагдсан. Нуугдсан давхарлалт, шифрлэгдсэн нөөцлөлт, шүүх шинжилгээний сэргээх зам байхгүй. Хэрэв "арилгах" нь зүгхэн текстэн дээр дүрс зурах байсан бол (хуурамч арилгах), тийм ээ — үндсэн PDF үзэгчээр хэн ч нуугдсан текстийг сонгож, хуулж, буулгаж болно.
PDF доторх зураг дахь мэдээллийг арилгаж болох уу?
Тийм ээ. Арилгах хэрэгслүүд нь хавсаргасан зургуудын бүсүүд дээр хайрцаг байрлуулж, нөлөөлсөн хэсгийг нь жигд дүүргэлтээр растержуулж, анхны пикселийг устгадаг. Энэ нь текст нь сонгогдох тэмдэгтүүд биш, харин зураг хэлбэрээр байдаг скан хийсэн баримт бичгүүдэд чухал юм.
Маягтын талбаруудыг арилгах тухай юу?
PDF маягтын талбарууд нь харагдах хуудасны агуулгаас тусад нь өгөгдлийг хадгалдаг. Маягтын талбарын харагдах байрлал дээр арилгах хайрцаг нь хадгалагдсан өгөгдлийг зайлшгүй устгадаггүй. Цогц арилгах ажиллагаа нь маягтын талбар болон тэдгээрийн холбогдох өгөгдлийг хавтгайруулах эсвэл устгах ёстой.
Арилгах нь хуудасны зохион байгуулалтыг өөрчилдөг үү?
Үгүй. Арилгасан хэсгүүд нь устгагдсан агуулгын орон зайг эзэлдэг жигд өнгөтэй хайрцгаар солигддог. Эргэн тойрон дахь текст болон зохион байгуулалт нь анхны байрлалдаа хэвээр байна.
Арилгах ажиллагааг цуцалж болох уу?
Үгүй — энэ нь гол санаа юм. Арилгах ажиллагаа нь бүрмөсөн бөгөөд эргэлт буцалтгүй юм. Тийм учраас та үргэлж хуулбар дээр ажиллаж, арилгаагүй анхны хувийг аюулгүй хадгалах ёстой.
Арилгах нь шифрлэлтээс юугаараа ялгаатай вэ?
Шифрлэлт нь бүхэл бүтэн баримт бичгийг хэн хандаж болохыг хязгаарладаг. Арилгах нь хэн ч хандаж болох баримт бичгийн ямар агуулгыг харахыг хязгаарладаг. Тэд өөр өөр зорилготой бөгөөд ихэвчлэн хамтдаа ашиглагддаг.
Текстийг хучиж байгаад PDF руу хэвлэх нь хүчинтэй арилгах арга мөн үү?
Найдвартай бус. Зарим хэвлэх-PDF драйверууд нь харагдах давхаргыг хавтгайруулж, доорх текстийг арилгадаг. Зарим нь үүнийг хадгалдаг. Энэ аргыг мэдрэмтгий арилгах ажиллагаанд хэзээ ч найдаж болохгүй. Тусгай арилгах хэрэгслийг ашиглана уу.
Нууц үгээр хамгаалагдсан PDF файлыг арилгаж болох уу?
Арилгахаас өмнө та PDF файлыг түгжээг тайлах хэрэгтэй. Хэрэв PDF нь эзэмшигчийн нууц үгтэй (засварлахыг хязгаарладаг) эсвэл хэрэглэгчийн нууц үгтэй (нээхийг хязгаарладаг) бол танд эхлээд тэр нууц үг хэрэгтэй болно. Нээгдсэний дараа арилгах үйл явц нь хамгаалалтгүй PDF-тэй адил юм.
Дүгнэлт
Арилгагдсан мэт харагддаг боловч үнэндээ арилгаагүй баримт бичиг нь арилгаагүй баримт бичгээс илүү муу — энэ нь хүмүүсийг хамгаалж байсан мэдрэмтгий мэдээллийг хуваалцахад хүргэдэг хуурамч аюулгүй байдлын мэдрэмжийг бий болгодог.
Гурав дахь дүгнэлт:
- Жинхэнэ арилгах хэрэгслийг ашиглана уу. Текстэн дээр дүрс зурах нь юу ч арилгадаггүй. Текст нь файлаас устгаагүй хэвээр байна. Доорх агуулгыг устгадаг хэрэгслийг ашиглана уу.
- Үргэлж баталгаажуулна уу. Арилгасан хэсэгт текстийг сонгож үзнэ үү, устгагдсан агуулгыг хайна уу, мөн хоёр дахь програмаар туршиж үзнэ үү.
- Боловсруулалтын явцад баримт бичгийг хамгаална уу. Хэрэв таны хэрэгсэл таны PDF файлыг серверт байршуулвал таны мэдрэмтгий баримт бичиг гуравдагч этгээдийн сервер дээр байх болно. PDFSub-ийн PDF арилгах хэрэгсэл нь таны хөтөч дээр баримт бичгийг боловсруулдаг — файл таны төхөөрөмжөөс хэзээ ч гарахгүй.
Арилгах ажиллагааг буруу хийсний үр дагавар нь ил болсон SSN, алдагдсан эрүүл мэндийн бүртгэл, ил болсон худалдааны нууц, мөн сая саяар тоологдох зохицуулалтын торгууль юм. Зөв хийсний үр дүн нь таны хэдэн минутын цаг хугацаа юм.
PDFSub-ийн PDF арилгах хэрэгслийг 7 хоногийн турш үнэгүй туршиж үзнэ үү болон мэдрэмтгий агуулга нь бүрмөсөн алга болсон эсэхийг өөрөө баталгаажуулна уу.