Paano Mag-redact ng Sensitibong Impormasyon sa isang PDF file
Mga Pinakamahusay na Kasanayan sa Pagbura
Ang pagkuha ng tamang kasangkapan sa pagbura ay kalahati lamang ng laban. Ang proseso sa paligid ng pagbura ay kasinghalaga.
1. Laging Beripikahin Pagkatapos Magbura
Pagkatapos ilapat ang mga pagbura, subukan ang output. Subukang piliin ang teksto sa mga binurang lugar — kung maaari kang mag-highlight ng anuman sa ilalim ng itim na kahon, nabigo ang pagbura. Maghanap (Ctrl+F / Cmd+F) para sa nilalaman na dapat na natanggal. Buksan ang file sa ibang PDF viewer, dahil ang ilan ay iba ang paghawak sa mga anotasyon. Para sa mga pagbura na may mataas na pusta (legal na paglilitis, mga pagsumite sa regulasyon), gumamit ng tool sa pagkuha ng teksto upang ilabas ang lahat ng teksto at kumpirmahin na wala ang nilalaman na binura.
2. Tanggalin ang Metadata
Ang pagbura ng nakikitang teksto ay kinakailangan ngunit hindi sapat. Ang mga PDF ay nagdadala ng metadata na maaaring magbunyag ng sensitibong impormasyon: mga katangian ng dokumento (may-akda, organisasyon, petsa ng paglikha), mga komento at anotasyon, data ng form field, mga naka-embed na file attachment, bookmark, JavaScript, at XMP metadata. Ang isang masusing daloy ng trabaho sa pagbura ay nagtatanggal ng lahat ng ito bilang karagdagan sa nakikitang nilalaman.
3. Magtrabaho mula sa Kopya
Huwag kailanman burahin ang orihinal na dokumento. Gumawa ng kopya, itago ang orihinal sa isang ligtas na lugar, isagawa ang lahat ng pagbura sa kopya, beripikahin, at ipamahagi lamang ang binurang bersyon. Ang hindi binurang orihinal ay maaaring kailanganin sa ibang pagkakataon para sa mga legal na paglilitis, mga audit trail, o panloob na pagsusuri.
4. Gumamit ng Pare-parehong Hitsura ng Pagbura
I-standardize ang hitsura ng mga pagbura sa iyong organisasyon. Ang mga itim na kahon ay ang pamantayan para sa mga legal at dokumentong pang-gobyerno. Isaalang-alang ang pagdaragdag ng mga label ng pagbura (hal., "BINURA," "PRIVILEGED," "NAKATANGGAL ANG PII") upang malaman ng mga mambabasa kung bakit tinanggal ang nilalaman.
5. Idokumento at Suriin
Para sa mga layuning legal at pagsunod, panatilihin ang isang talaan kung sino ang nagsagawa ng pagbura, kailan, anong mga kategorya ng impormasyon ang tinanggal, at anong tool ang ginamit. Lumilikha ito ng isang audit trail kung ang pagiging sapat ng pagbura ay kailanman pagdudahan.
Hayaan ang pangalawang tao na suriin ang binurang dokumento bago ito umalis sa iyong organisasyon. Ang isang sariwang pares ng mata ay nakakakita ng mga napalampas na pagbura, hindi kumpletong pagtanggal, at mga pahiwatig ng konteksto na maaaring magpahintulot sa isang mambabasa na mahinuha ang binurang nilalaman mula sa nakapaligid na teksto. Ang dalawang-taong pagsusuri ay karaniwang kasanayan sa mga tanggapan ng FOIA ng gobyerno.
Batch Redaction: Paghahanap at Pagtanggal ng mga Pattern
Kapag kailangan mong burahin ang parehong uri ng impormasyon sa isang malaking dokumento, ang manu-manong pagpili ay nagiging hindi praktikal. Ang batch redaction ay nag-a-automate ng proseso sa pamamagitan ng paghahanap ng mga pattern at pagmamarka ng lahat ng tugma nang sabay-sabay.
Karaniwang mga pattern na ibu-batch-redact:
| Uri ng Data | Mga Format ng Pattern |
|---|---|
| Mga numero ng Social Security | XXX-XX-XXXX, XXX XX XXXX, XXXXXXXXX |
| Mga email address | [email protected] |
| Mga numero ng telepono | (XXX) XXX-XXXX, XXX-XXX-XXXX, +1XXXXXXXXXX |
| Mga numero ng credit card | 13-19 digit na pagkakasunod-sunod, madalas sa mga grupo ng apat |
| Mga numero ng account | 8-17 digit na pagkakasunod-sunod pagkatapos ng "Account #" o "Acct" |
| Mga petsa ng kapanganakan | MM/DD/YYYY, Month DD, YYYY, DD-MM-YYYY |
Ang daloy ng trabaho: tukuyin ang iyong mga pattern, patakbuhin ang paghahanap sa lahat ng pahina, suriin ang bawat tugma (hindi lahat ng tugma ng pattern ay talagang sensitibo), ilapat ang lahat nang sabay-sabay, pagkatapos ay magsagawa ng manu-manong paglilinis para sa nilalaman na hindi tumugma sa iyong mga pattern. Ang mga pangalan, address, at mga deskripsyon na malayang teksto ay bihirang tumugma sa mga simpleng pattern at nangangailangan ng pagsusuri ng tao.