PDFSub
ÁrazásMergeSplitCompressEditE-SignBankszámlakivonatok
Vissza a bloghoz
OktatóanyagPDF szerkesztésePDF EszközökAdatvédelemBiztonságÚtmutató

Hogyan lehet bizalmas információkat kivonni egy PDF-ből

2026. március 2.
PDFSub Team

A fekete doboz rajzolása egy PDF szövege fölé nem távolítja el azt. A szöveg továbbra is ott marad, kiválasztható, kereshető és kinyerhető. Íme, hogyan lehet valóban eltávolítani egy PDF-ből az érzékeny információkat, hogy azok véglegesen megsemmisüljenek.


Valódi anonimizálás vs. Látszólagos anonimizálás

Valódi anonimizálás Látszólagos anonimizálás
Vizuális megjelenés Fekete doboz a tartalom felett Fekete doboz a tartalom felett
Alatta lévő szöveg Véglegesen törölve Még mindig jelen van a fájlban
Kijelölés és másolás Nincs mit kijelölni A szöveg másolható
Szövegkeresés Nincs találat Találatok vannak
Programatikus kinyerés Nincs adat visszaadva Teljes szöveg kinyerve
Metaadatok Tisztítva Érintetlenül hagyva
Visszafordítható? Nem — az információ megsemmisült Igen — távolítsa el a fedvényt

Kívülről nézve a valódi és a látszólagos anonimizálás megegyezik. A fekete doboz mindkét esetben ott van. A különbség teljes mértékben a felszín alatti történésekben rejlik — és ez a különbség okozott néhányat a leginkább kínos információkiszivárgások közül a közelmúltban.

Híres anonimizálási hibák

Ezek nem elméleti forgatókönyvek. Az alábbi esetek mindegyikében nagy szervezetek szakemberei hittek abban, hogy bizalmas információkat anonimizáltak. Nem tették meg.

A Manafort-ügy (2019)

Paul Manafort ügyvédei egy bírósági dokumentumot nyújtottak be, amelyben ügyfelük orosz hírszerzési ügynökökkel folytatott interakcióinak részleteit kívánták anonimizálni. Az „anonimizált” részek fekete dobozok voltak — de az alatta lévő szöveg teljesen ép maradt. Az újságírók egyszerűen kimásolták a rejtett szöveget, felfedve, hogy Manafort megosztott adatközlési adatokat egy orosz kapcsolattartójával. A történet egy teljes hírciklust uralt. Az ügyvédi csapat egy szövegszerkesztő kiemelési funkcióját használta (fekete kiemelés fekete szövegen), és PDF-ként exportálta anélkül, hogy tudta volna, hogy a szövegréteg megmaradt.

TSA repülőtéri biztonsági tervrajz (2009)

A Közlekedésbiztonsági Hivatal (TSA) közzétette repülőtéri biztonsági ellenőrzési eljárások kézikönyvének anonimizált változatát. Az anonimizálások egyszerű fekete téglalapok voltak, amelyeket szövegre rajzoltak egy PDF-ben. A biztonsági kutatók eltávolították a fedvényeket, és hozzáfértek a teljes, nem anonimizált dokumentumhoz, amely részleteket tartalmazott az ellenőrzési kivételekről, a rendfenntartói azonosítási eljárásokról és a ellenőrzőpontok sérülékenységéről. A TSA-nak át kellett dolgoznia teljes ellenőrzési protokollját.

AT&T / NSA lehallgatási ügy (2006)

Az Electronic Frontier Foundation (EFF) perében az AT&T ellen a lehallgatás miatt, az AT&T egy jogi beadványt nyújtott be „anonimizált” üzleti titkokkal. Az anonimizálások fekete dobozok voltak a szövegen egy PDF-ben. A teljes szöveg — amely az NSA megfigyelési infrastruktúráját írta le az AT&T létesítményein belül — triviálisan kinyerhető volt. A dokumentumot több ezer alkalommal töltötték le, mielőtt eltávolították volna.

A minta

Minden esetben a hiba oka azonos volt: egy vizuális elem került a szövegre anélkül, hogy magát a szöveget törölték volna. És az emberek, akik ezeket a hibákat elkövették, nem voltak gondatlanok — ügyvédek, kormányzati tisztviselők és biztonsági szakemberek voltak. Az általuk használt eszközök (szövegszerkesztők, alapvető PDF-szerkesztők, annotációs funkciók) egyszerűen nem végeznek valódi anonimizálást.

Milyen információkat kell anonimizálni?

A válasz a szabályozási környezettől függ, de az alábbi kategóriák fedik le a leggyakoribb bizalmas adatokat az üzleti dokumentumokban.

Személyazonosításra alkalmas adatok (PII)

  • Társadalombiztosítási számok (SSN) és adófizetői azonosító számok (TIN)
  • Bankszámlaszámok és utalási számok
  • Hitel- és bankkártyaszámok
  • Vezetői engedély- és útlevélszámok
  • Születési dátumok
  • Lakcímek és személyes telefonszámok
  • E-mail címek (ha más PII-vel együtt szerepelnek)
  • Biometrikus azonosítók

Pénzügyi információk

  • Számlaegyenlegek és tranzakciós előzmények
  • Bér- és kompenzációs adatok
  • Adóbevallási adatok
  • Befektetési számla részletei
  • Kölcsön- és jelzálog információk
  • Hitelpontszámok és hiteljelentési adatok

Orvosi és egészségügyi információk (HIPAA)

  • Betegnevek egészségügyi adatokkal együtt
  • Orvosi nyilvántartási számok
  • Diagnózisok és kezelési részletek
  • Recept információk
  • Egészségbiztosítási számlaszámok
  • Laboreredmények és orvosi képalkotó jelentések

Jogi és üzleti információk

  • Kiskorúak nevei bírósági dokumentumokban
  • Áldozatok és tanúk személyazonossága büntetőeljárásokban
  • Ügyvédi-ügyfél bizalmas kommunikációk
  • Üzleti titkok és szabadalmaztatott formulák
  • Lezárt bírósági iratok és esküdtszéki anyagok
  • Ügyszámok és nyilvántartási információk (bizonyos joghatóságokban)
  • Bizalmas egyezségi feltételek

HR és munkavállalói nyilvántartások

  • Munkavállalói SSN-ek és adó-visszatartási adatok
  • Béradatok és bónusz összegek
  • Fegyelmi nyilvántartások és teljesítményértékelések
  • Orvosi szabadság részletei
  • Háttérellenőrzési eredmények
  • Belső vizsgálati jegyzetek

A általános szabály: ha az információ azonosíthat egy konkrét személyt, feltárhatja pénzügyi helyzetét, felfedheti egészségügyi előzményeit, vagy védett jogi kommunikációt hozhat nyilvánosságra, azt anonimizálni kell, mielőtt a dokumentumot megosztanák bárkivel, akinek nincs rá jogos szüksége.

Dokumentumtípus szerint

Különböző dokumentumok hajlamosak a bizalmas adatokat különböző helyeken rejteni:

  • Jogi dokumentumok: Félnevek és címek (különösen családjogi/kiskorú ügyekben), bizalmas kommunikációk, tanúk személyazonossága, egyezségi feltételek, SSN-ek pénzügyi mellékletekben, kiskorúak nevei
  • Pénzügyi dokumentumok: Számla- és utalási számok, SSN-ek/TIN-ek, tranzakciós részletek, egyenlegek, béradatok
  • Orvosi nyilvántartások (HIPAA): A HIPAA adatvédelmi szabályzata 18 specifikus azonosítót határoz meg, amelyeket el kell távolítani az azonosításmentesítéshez, beleértve a neveket, földrajzi adatokat, dátumokat, telefon-/fax-/e-mail címeket, SSN-eket, orvosi nyilvántartási számokat, egészségügyi terv azonosítókat, számlaszámokat, engedélyszámokat, eszközazonosítókat, biometrikus adatokat és fényképeket. A büntetések 100 és 50 000 dollár között mozognak szabálysértésenként.
  • HR dokumentumok: Munkavállalói SSN-ek adóformákon (W-2, W-4, I-9), béradatok, fegyelmi nyilvántartások, orvosi szabadság részletei, háttérellenőrzési eredmények, személyes elérhetőségi adatok

1. módszer: PDFSub PDF anonimizáló eszköz (Ajánlott)

A PDFSub Redact PDF eszközünk valódi anonimizálást végez — a jelölések alatti szöveg véglegesen eltávolításra kerül a fájlból, nem csupán vizuálisan fedett. És mivel az eszköz teljes egészében a böngészőben fut, a bizalmas információkat tartalmazó dokumentum soha nem hagyja el az eszközt.

Hogyan működik

1. lépés: Töltse fel PDF-jét. Húzza és ejtse a dokumentumot a Redact PDF eszközre, vagy kattintson a tallózáshoz. A fájl közvetlenül a böngészőbe töltődik — nincs szerverre történő feltöltés.

2. lépés: Jelölje meg az anonimizálandó területeket. Válassza ki a törölni kívánt szöveget vagy régiókat. Kiemelhet konkrét szavakat, mondatokat, teljes bekezdéseket, vagy rajzolhat anonimizáló dobozokat képekre és diagramokra. Az eszköz pontosan megmutatja, mi lesz anonimizálva, mielőtt véglegesítené.

3. lépés: Alkalmazza az anonimizálásokat. Kattintson az alkalmazáshoz. Az eszköz véglegesen eltávolítja a megjelölt tartalmat a PDF tartalomfolyamából. A szöveg törlődik — nem elrejtve, nem fedve, hanem törölve. Egy fekete doboz tölti ki a helyet, ahol a tartalom volt.

4. lépés: Letöltés. Mentse el az anonimizált PDF-et. A letöltött fájl nem tartalmaz nyomot a törölt információról. Ezt úgy ellenőrizheti, hogy megpróbálja kiválasztani a szöveget az anonimizált területeken (nincs mit kiválasztani), vagy futtat egy szövegkeresést a törölt tartalomra (nem lesz találat).

Miért ez a legjobb módszer bizalmas dokumentumokhoz

Böngésző alapú feldolgozás. A teljes anonimizálási folyamat a böngészőben történik. A PDF soha nem utazik az interneten, soha nem kerül harmadik fél szerverére, és soha nem naplózódik, gyorsítótárazódik vagy tárolódik. Kompatibilitás-érzékeny munkafolyamatok esetén ez nem egy „nice-to-have” — ez követelmény.

Valódi anonimizálás, nem annotáció. A szöveg ténylegesen törlődik a PDF belső adatstruktúrájából, nem csupán lefedve. Anonimizálás után a tartalom visszafordíthatatlan.

Megfizethető. Ellentétben az Adobe Acrobat Pro 240 dolláros éves díjával, a PDFSub professzionális anonimizálást kínál ennek töredékéért. Kezdje egy 7 napos ingyenes próbaverzióval, hogy ellenőrizze, az eszköz megfelel-e az Ön igényeinek.

Bármilyen eszközön működik. Anonimizáljon PDF-eket Windows, Mac, Linux, Chromebook és táblagépeken — bárhol, ahol modern webböngészője van.


2. módszer: Adobe Acrobat Pro

Az Adobe Acrobat Pro dedikált anonimizáló eszközzel rendelkezik, amely valódi anonimizálást végez. Ez az iparági szabvány a jogi és kormányzati munkafolyamatokhoz.

Hogyan anonimizáljunk az Acrobat Pro-ban

1. lépés: Nyissa meg az Anonimizálás eszközt. Menjen a Tools > Redact menüpontra. Ez megnyitja az anonimizáló eszköztárat.

2. lépés: Jelölje meg az anonimizálandó tartalmat. Kattintson és húzza a szöveg kijelöléséhez, jelölje anonimizálni az egész oldalakat, vagy használja a "Find and Redact" (Keresés és anonimizálás) funkciót minták (például SSN formátumok) keresésére az egész dokumentumban.

3. lépés: Alkalmazza az anonimizálásokat. Ez a kritikus lépés, amelyet sok felhasználó kihagy. A jelölés piros keretet helyez a szöveg köré — ez még nem távolítja el. A tartalom végleges törléséhez kattintson az „Apply” (Alkalmaz) gombra.

4. lépés: Távolítsa el a rejtett információkat. Használja a „Remove Hidden Information” (Rejtett információ eltávolítása) funkciót a metaadatok, megjegyzések, űrlapmezők és beágyazott fájlok tisztításához.

Erősségek és gyengeségek

Az Acrobat Pro az iparági szabvány, széles körű jogi/kormányzati elfogadottsággal, kötegelt „Find and Redact” funkciót kínál, és eltávolítja a rejtett információkat. Azonban évente 240 dollárba kerül, asztali telepítést igényel, és a kétlépéses folyamat (jelölés, majd alkalmazás) gyakori hibaforrás, amikor a felhasználók elfelejtik az alkalmazás lépést.

A kétlépéses csapda

Ez hangsúlyt érdemel, mert valós adatvesztést okoz: a tartalom anonimizálásra való jelölése nem ugyanaz, mint az anonimizálása. A jelölés vizuális jelzőt helyez el. A szöveg még mindig a fájlban van. Csak az alkalmazás törli azt. Ha ment és megoszt jelölés után, de alkalmazás előtt, akkor egy olyan dokumentumot osztott meg, amely látszólagos anonimizálásokat tartalmaz.


3. módszer: Előnézet (Preview) Mac-en

Az Apple Előnézet (Preview) alkalmazása (amely beépül a macOS-be) rendelkezik annotációs eszközökkel, amelyek fekete téglalapokat helyezhetnek a szövegre. Sok Mac felhasználó azt hiszi, hogy ez anonimizálást jelent. Ez nem így van.

Mit csinál valójában az Előnézet

Amikor az Előnézet téglalap annotációs eszközét használja a szöveg lefedésére:

  1. Egy fekete alakzat rajzolódik a PDF tartalom fölé
  2. Az alatta lévő szöveg teljesen ép marad
  3. A szöveg továbbra is kijelölhető a téglalap alatti kattintással és húzással
  4. A szöveg továbbra is megjelenik a keresési eredményekben (Cmd+F)
  5. A szöveg bármely PDF-elemző eszköz által kinyerhető
  6. Az annotáció teljesen eltávolítható, felfedve az eredeti szöveget

FIGYELEM: Az Előnézet nem végez valódi anonimizálást

Az Előnézet annotációi nem anonimizálások. Ezek pontosan ugyanazok a vizuális fedvények, amelyek a korábban leírt Manafort-, TSA- és AT&T-hibákat okozták. Az Előnézet használata egy PDF „anonimizálására” és annak megosztása funkcionálisan megegyezik a nem anonimizált dokumentum megosztásával.

A macOS Sequoia (2025) verziójától kezdve az Előnézet nem tartalmaz valódi anonimizáló funkciót. Ha Mac-en van, használja a PDFSub böngésző alapú Redact PDF eszközét vagy az Adobe Acrobat Pro-t helyette.

Hogyan ellenőrizhető az Előnézet hibája

Próbálja ki maga: nyisson meg egy PDF-et az Előnézetben, rajzoljon egy fekete színű téglalapot valamilyen szövegre, mentse el, nyissa meg újra, és nyomja meg a Cmd+F gombot a „rejtett” szöveg kereséséhez. Meg fogja találni. Soha nem lett eltávolítva. Ez a 30 másodperces teszt demonstrálja, miért veszélyesek az annotációs eszközök, ha anonimizálásra használják őket.


Vörösítés legjobb gyakorlatai

A vörösítési eszköz helyes használata csak a fele a csatának. Maga a vörösítési folyamat ugyanolyan fontos.

1. Mindig ellenőrizze a vörösítés után

A vörösítések alkalmazása után tesztelje az eredményt. Próbálja meg kiválasztani a szöveget a vörösített területeken – ha bármit ki tud emelni egy fekete doboz alatt, a vörösítés sikertelen volt. Keressen (Ctrl+F / Cmd+F) a törölni kívánt tartalomra. Nyissa meg a fájlt egy másik PDF-nézegetőben, mivel egyesek eltérően kezelik az annotációkat. Magas tétű vörösítések (jogi eljárások, szabályozási beadványok) esetén használjon szövegkinyerő eszközt az összes szöveg kinyeréséhez, és győződjön meg arról, hogy a vörösített tartalom hiányzik.

2. Távolítsa el a metaadatokat

A látható szöveg vörösítése szükséges, de nem elegendő. A PDF-ek metaadatokat tartalmazhatnak, amelyek érzékeny információkat tárhatnak fel: dokumentumtulajdonságok (szerző, szervezet, létrehozási dátum), megjegyzések és annotációk, űrlapmező-adatok, beágyazott fájlmellékletek, könyvjelzők, JavaScript és XMP metaadatok. Egy alapos vörösítési munkafolyamat mindezt eltávolítja a látható tartalom mellett.

3. Másolatról dolgozzon

Soha ne vörösítse az eredeti dokumentumot. Készítsen egy másolatot, tárolja az eredetit biztonságos helyen, végezze el az összes vörösítést a másolaton, ellenőrizze, és csak a vörösített verziót terjessze. Az eredeti, vörösítetlen verzióra később szükség lehet jogi eljárások, audit nyomvonalak vagy belső felülvizsgálatok során.

4. Használjon egységes vörösítési megjelenést

Szabványosítsa a vörösítések megjelenését a szervezetében. A fekete dobozok a szabványosak jogi és kormányzati dokumentumok esetén. Fontolja meg a vörösítési címkék hozzáadását (pl. "VÖRÖSÍTVE", "BIZALMAS", "SZEMÉLYES ADATOK TÁVOLÍTVA"), hogy az olvasók tudják, miért lett eltávolítva a tartalom.

5. Dokumentáljon és vizsgáljon felül

Jogi és megfelelőségi célokból vezessen nyilvántartást arról, hogy ki végezte el a vörösítést, mikor, milyen típusú információkat távolítottak el, és milyen eszközt használtak. Ez audit nyomvonalat hoz létre, ha a vörösítés megfelelőségét valaha is megkérdőjelezik.

Vizsgáltassa felül egy második személlyel a vörösített dokumentumot, mielőtt az elhagyja a szervezetét. Egy friss szem meglátja az elmulasztott vörösítéseket, a hiányos eltávolításokat és azokat a kontextuális utalásokat, amelyek alapján az olvasó következtethet a vörösített tartalomra a környező szövegből. A kétfős felülvizsgálat a kormányzati FOIA irodákban bevett gyakorlat.


Kötegelt vörösítés: Mintázatok keresése és eltávolítása

Amikor ugyanazt az információtípust kell vörösíteni egy nagy dokumentumban, a manuális kiválasztás kivitelezhetetlenné válik. A kötegelt vörösítés automatizálja a folyamatot azáltal, hogy mintázatokat keres és egyszerre jelöli meg az összes egyezést.

Gyakori mintázatok kötegelt vörösítésre:

Adattípus Mintázati formátumok
Társadalombiztosítási számok XXX-XX-XXXX, XXX XX XXXX, XXXXXXXXX
E-mail címek né[email protected]
Telefonszámok (XXX) XXX-XXXX, XXX-XXX-XXXX, +1XXXXXXXXXX
Hitelkártyaszámok 13-19 számjegyű sorozatok, gyakran négyes csoportokban
Számlaszámok 8-17 számjegyű sorozatok "Számla #" vagy "Számla" után
Születési dátumok HH/NN/ÉÉÉÉ, Hónap NN, ÉÉÉÉ, NN-HH-ÉÉÉÉ

A munkafolyamat: határozza meg a mintázatokat, futtassa a keresést az összes oldalon, vizsgálja felül az egyes egyezéseket (nem minden mintázategyezés valójában érzékeny), alkalmazza az összeset egyszerre, majd végezzen manuális áttekintést azokra a tartalmakra, amelyek nem egyeztek a mintázatokkal. A nevek, címek és szabad szöveges leírások ritkán egyeznek egyszerű mintázatokkal, és emberi felülvizsgálatot igényelnek.


PDF Security GuideRedact PDFPermanently Remove Sensitive InformationEXPOSEDName:SSN:123-45-6789Account:4532-XXXX-8901Address:RedactREDACTEDName:SSN:Account:Address:What Gets Redacted#Social Security NumbersXXX-XX-XXXX patterns detected$Account & Card NumbersFinancial identifiers removed@Personal InformationNames, addresses, phone numbersRedaction is permanent — data cannot be recovered1. Upload PDFSelect document to redact2. Select & RedactMark sensitive areas3. Download Secure PDFPermanently redactedPermanently redact sensitive data — social security numbers, account numbers, personal infoRedacted content is permanently removed — not just hidden behind a black box

Real Redaction vs. Fake RedactionDrawing a black box over text does NOT remove it — only true redaction destroys the dataFake Redaction (Overlay)Black box on top — text still in the fileName: John SmithAccount: Balance: $14,832.19⚠ Text still selectable and copyable underneath!✕Text remains in PDF content stream✕Select, copy, paste recovers hidden data✕Ctrl+F search finds 'redacted' content✕PDF extraction tools expose everything✕Removing annotation reveals originalReal Redaction (PDFSub)Content permanently deleted from the fileName: John SmithAccount: Balance: $14,832.19✓ Underlying text permanently deleted — nothing to select✓Character data deleted from content stream✓Nothing to select, copy, or extract✓Search returns no matches✓Metadata and hidden data cleaned✓Irreversible — permanent destructionAlways verify: try selecting text in redacted areas after saving — if you can highlight it, the redaction failed

Vissza a bloghoz

Kérdése van? Kapcsolatfelvétel

PDFSub

Minden PDF és dokumentumkezelő eszköz egy helyen. Gyors, biztonságos és privát.

GDPR-megfelelőCCPA-megfelelőSOC 2 Ready
Powered by PDFSub Engine

PDF eszközök

  • PDF-ek egyesítése
  • PDF szétválasztása
  • Oldalak átrendezése
  • PDF forgatása
  • Oldalak törlése
  • Oldalak kinyerése
  • Vízjel hozzáadása
  • PDF szerkesztő
  • PDF bélyegző
  • PDF űrlapkitöltő
  • Oldalak vágása
  • Oldalméret módosítása
  • Oldalszámozás
  • Fejlécek és láblécek
  • PDF tömörítése
  • Kereshetővé tétel
  • Clean Scanned PDF
  • Photo to Document
  • Auto-Crop PDF
  • PDF javítása
  • Metaadatok szerkesztése
  • Metaadatok eltávolítása
  • PDF-ből Word
  • Word-ből PDF
  • Excel-ből PDF
  • PDF-ből PowerPoint
  • PDF-ből kép
  • Képből PDF
  • HTML-ből PDF
  • HEIC-ből kép
  • WEBP-ből JPG
  • WEBP-ből PNG
  • PowerPoint-ból PDF
  • PDF-ből HTML
  • EPUB-ból PDF
  • TIFF-ből PDF
  • PNG-ből PDF
  • PDF-ből PNG
  • Szövegből PDF
  • SVG-ből PDF
  • WEBP-ből PDF
  • PDF-ből EPUB
  • RTF-ből PDF
  • ODT-ből PDF
  • ODS-ből PDF
  • PDF-ből ODT
  • PDF-ből ODS
  • PDF-ből SVG
  • PDF-ből RTF
  • PDF-ből szöveg
  • ODP-ből PDF
  • PDF-ből ODP
  • ODG-ből PDF
  • PDF nézegető
  • PDF/A konvertálás
  • PDF létrehozása
  • Kötegelt konvertálás
  • Oldalak laponként
  • Jelszavas védelem
  • PDF feloldása
  • PDF kitakarása
  • PDF e-aláírás
  • PDF-ek összehasonlítása
  • Táblázatok kinyerése
  • PDF to Excel
  • Bankszámlakivonat konvertáló
  • Számla kinyerő
  • Nyugta szkenner
  • Pénzügyi jelentés
  • OCR - Szöveg kinyerése
  • Kézírás konvertálása
  • PDF összegzése
  • PDF fordítása
  • Csevegés PDF-fel
  • Adatok kinyerése
  • Design Stúdió

Termék

  • Privacy & Security
  • Összes eszköz
  • Funkciók
  • Bankszámlakivonatok
  • Árazás
  • GYIK
  • Blog

Támogatás

  • Súgóközpont
  • Kapcsolat
  • GYIK

Jogi nyilatkozat

  • Adatvédelmi irányelvek
  • Felhasználási feltételek
  • Süti szabályzat

© 2026 PDFSub. Minden jog fenntartva.

Amerikában készült -vel az embereknek világszerte