Hur PDFSub bearbetar dina PDF:er: Webbplats, motor och AI
De flesta online-PDF-verktyg laddar upp dina filer till en fjärrserver. PDFSub använder tre bearbetningsnivåer – webbläsarbaserad redigering, den isolerade PDFSub Engine för konverteringar och AI för intelligent analys – var och en utformad för att skydda dina data. Här är exakt hur det fungerar.
Du behöver konvertera ett kontoutdrag till Excel. Eller slå ihop två kontrakt till en PDF. Eller komprimera en skattedeklaration innan du skickar den via e-post till en kund.
Så du googlar "PDF-konverterare", klickar på det första resultatet och drar din fil till uppladdningsrutan. Ett förloppsfält fylls. En snurrande ikon snurrar. Trettio sekunder senare laddar du ner resultatet.
Enkelt. Snabbt. Och ditt känsliga dokument har precis rest över internet, landat på en främlings server, bearbetats av programvara du inte kan inspektera och (förhoppningsvis) raderats därefter.
Det är integritetsparadoxen med online-dokumentverktyg. De dokument du mest behöver bearbeta – kontoutdrag, skattedeklarationer, juridiska kontrakt, medicinska journaler, finansiella rapporter – är exakt de du bör vara mest försiktig med att dela. Ändå kräver standardarbetsflödet för varje större PDF-verktyg att du lämnar över dessa filer till en tredjepart.
PDFSub byggdes för att bryta det mönstret. För de flesta operationer lämnar dina filer aldrig din enhet. Den här artikeln förklarar exakt hur det fungerar, när serverbaserad bearbetning verkligen är nödvändig och hur du själv kan verifiera varje påstående.
Hur de flesta online-PDF-verktyg fungerar
Innan vi förklarar vad PDFSub gör annorlunda, är det bra att förstå standardmetoden. Nästan alla online-PDF-verktyg – gratis eller betalda – följer samma mönster:
- Du väljer en fil på din enhet
- Filen laddas upp till leverantörens server via internet
- Servern bearbetar filen (slå ihop, komprimera, konvertera, extrahera data)
- Resultatet skickas tillbaka till dig som en nedladdning
- Originalfilen ligger kvar på deras server tills den (förmodligen) raderas
Denna arkitektur är logisk ur leverantörens perspektiv. Serverbaserad bearbetning är enklare att bygga, enklare att skala och ger leverantören full kontroll. Men ur ditt perspektiv innebär det att ditt dokument berör infrastruktur som du inte kontrollerar.
Även om leverantören använder HTTPS, även om de lovar att radera filer efter bearbetning, och även om de har en betryggande integritetspolicy – så var din fil på deras server. Den fanns i deras minne, på deras hårddisk, potentiellt i deras säkerhetskopior och loggar. Supportpersonal kan ha tillgång. Underleverantörer kan få kopior. Och om deras infrastruktur bryts, kan ditt dokument exponeras tillsammans med miljontals andra.
Detta gäller för nästan alla online-PDF-verktyg du har använt. De stora namnen, gratisverktygen, de "integritetsfokuserade" verktygen – nästan alla följer denna uppladdnings-bearbetnings-nedladdningsmodell.
Vad "integritetsfokuserad" vanligtvis betyder
Vissa verktyg marknadsför sig som integritetsmedvetna. Men titta noga på vad det vanligtvis innebär:
- "Filer krypteras under överföring" – Detta är bara HTTPS. Varje webbplats använder det. Det skyddar din fil medan den reser, inte medan den ligger på deras server.
- "Filer raderas efter 2 timmar" – Två timmar är lång tid för ett känsligt dokument på en tredjepartsserver. Och "raderas" betyder inte alltid raderas från säkerhetskopior.
- "Vi läser inte dina filer" – Tekniskt sett sant – automatiserad programvara bearbetar dem. Men filen finns fortfarande på deras infrastruktur, tillgänglig för alla med serveråtkomst.
- "SOC 2-certifierad" – Detta certifierar att säkerhetsprocesser finns, inte att intrång inte kan hända. Tre av de fyra stora revisionsfirmorna hade SOC 2 när MOVEit-intrånget exponerade 93,3 miljoner människors data.
Ingen av dessa åtgärder är dåliga. De är bara otillräckliga för dokument som är genuint känsliga. Den säkraste metoden är inte bättre kryptering eller kortare lagringstid – det är att inte skicka filen alls.
Hur PDFSub skiljer sig: Webbplatsbaserad bearbetning
PDFSub använder ett fundamentalt annorlunda arkitektoniskt tillvägagångssätt. Istället för att ladda upp din fil till en server för bearbetning, kör PDFSub bearbetningsprogramvaran direkt i din webbläsare.
När du öppnar PDFSub och laddar en PDF, läses filen från din enhet in i din webbläsares minne. Bearbetningskoden – skriven i JavaScript och WebAssembly – körs på din dator och använder din processor och ditt RAM-minne. Resultatet genereras lokalt och laddas ner direkt från din webbläsare till din hårddisk.
Filen korsar aldrig nätverket. Den rör aldrig en fjärrserver. Det finns ingen uppladdning, ingen nedladdning av rå fildata, ingen lagring på servern, ingen lagringsperiod och ingen tredjepartsåtkomst.
Detta är inte ett marknadsföringspåstående som kräver förtroende. Det är en teknisk arkitektur som du själv kan verifiera (mer om det senare).
Hur webbläsarbaserad bearbetning faktiskt fungerar
Du behöver inte vara mjukvaruingenjör för att förstå detta. Tänk på ett traditionellt PDF-verktyg som en fotoutskriftskiosk. Du lämnar din bild till kiosken, den bearbetar och skriver ut den, och (förhoppningsvis) förstör ditt original. Du måste lita på kioskoperatören.
Webbläsarbaserad bearbetning är mer som att ha en fotoskrivare hemma. Bilden lämnar aldrig ditt hus. Bearbetningen sker på din utrustning, under din kontroll.
När PDFSub laddas i din webbläsare, laddas bearbetningsprogramvaran ner till din enhet. Den programvaran körs sedan helt på din maskin. Din webbläsare tillhandahåller en säker, isolerad miljö där koden kan läsa och bearbeta din fil utan någon möjlighet att skicka rå fildata någon annanstans.
Här är steg-för-steg-flödet för en typisk operation:
- Du öppnar PDFSub – Din webbläsare laddar ner applikationskoden (JavaScript, WebAssembly). Detta är bearbetningsmotorn.
- Du väljer en PDF-fil – Din webbläsare läser filen från din hårddisk in i lokalt minne. Ingen nätverksbegäran görs.
- Bearbetning sker lokalt – JavaScript/WebAssembly-koden tolkar PDF-strukturen, extraherar text, manipulerar sidor eller utför den operation du valt. All beräkning använder din enhets processor.
- Resultatet genereras i minnet – Utfilen (sammanslagen PDF, Excel-kalkylblad, komprimerad PDF, etc.) skapas i din webbläsares minne.
- Du laddar ner resultatet – Filen sparas direkt från webbläsarens minne till din hårddisk. Ingen server inblandad.
Vid ingen tidpunkt lämnar originalfilen – eller dess innehåll – din enhet. Webbläsarens säkerhetsmodell upprätthåller detta: JavaScript som körs i en webbsida kan inte tyst överföra data utan att göra en nätverksbegäran, och du kan övervaka nätverksbegäranden i realtid.
Webbplatsens säkerhetsmodell skyddar dig
Moderna webbläsare tillhandahåller flera skyddsnivåer som gör denna arkitektur genuint säker:
- Policy för samma ursprung – Kod från en webbplats kan inte komma åt data från en annan. Ingen annan flik eller webbplats kan läsa filen du bearbetar i PDFSub.
- Processisolering – Varje webbläsarflik körs i en separat isolerad process. Andra applikationer på din dator kan inte komma åt data som bearbetas.
- Ingen beständig lagring – När du stänger fliken förstörs all data i minnet. Till skillnad från serverbaserad bearbetning finns inga kvarvarande kopior på disken, inga säkerhetskopior, inga loggfiler som innehåller dina data.
- Granskningsbar nätverksaktivitet – Varje nätverksbegäran din webbläsare gör är synlig i utvecklarverktygen. Du kan i realtid verifiera att ingen fil data överförs.
Detta är inte ett proprietärt säkerhetssystem som PDFSub har byggt. Det är säkerhetsmodellen för webbplattformen själv, upprätthållen av Chrome, Firefox, Safari och Edge – webbläsare som stöds av miljarder dollar i säkerhetsinvesteringar.
Fungerar även offline
När PDFSubs sida har laddats fungerar många operationer även om du kopplar bort internet. Bearbetningskoden finns redan i din webbläsare. Filen finns redan i minnet. Ingen nätverksanslutning behövs för att slå ihop PDF:er, komprimera ett dokument eller extrahera text.
Ladda PDFSub, slå på flygplansläge och bearbeta en fil. Det fungerar – eftersom filen ändå aldrig skulle laddas upp.
När serverbaserad bearbetning är nödvändig
Transparens är viktigt, så låt oss vara direkta: inte alla operationer kan ske i din webbläsare. Vissa uppgifter kräver funktioner som webbläsare inte har, och för dessa använder PDFSub serverbaserad bearbetning.
Här är de specifika scenarierna:
Skannade PDF:er som kräver OCR
När en PDF är en skannad bild – ett fotografi av ett tryckt dokument – kan din webbläsare se pixlarna men inte läsa texten. Att extrahera text från bilder kräver optisk teckenigenkänning (OCR), vilket i sin tur kräver AI-modeller som är för stora och beräkningsintensiva för att köras i en webbläsare.
För skannade dokument skickas PDF:en till PDFSubs server, där AI-driven OCR läser texten från bilden, extraherar data och returnerar resultatet.
AI-drivna funktioner
Funktioner som AI-sammanfattning, AI-översättning, AI-dataextraktion och AI-chatt om dokument kräver stora språkmodeller som körs på specialiserad hårdvara. Dessa funktioner kan för närvarande inte köras i en webbläsare – modellerna kräver betydande beräkningsresurser som överstiger vad konsumentenheter kan erbjuda.
När du använder en AI-funktion skickas relevant dokumentinnehåll till servern för bearbetning.
Komplex serverbaserad parsning
Vissa PDF-dokument har ovanlig kodning, skadad struktur eller kantfall som den webbläsarbaserade parsaren inte kan hantera. I dessa fall återgår PDFSub till en serverbaserad parsare som har tillgång till mer robusta parsingsverktyg.
Vad som händer under serverbaserad bearbetning
När serverbaserad bearbetning krävs, är detta exakt vad som händer:
- Krypterad överföring – Din fil skickas via TLS (samma kryptering som används av online-banker) till PDFSubs servrar
- Bearbetning i minnet – Filen bearbetas omedelbart. Den lagras i serverns minne under bearbetningen, inte på permanent lagring
- Resultat returneras – Det bearbetade resultatet skickas tillbaka till din webbläsare
- Omedelbar radering – Originalfilen och eventuella mellanliggande data raderas från serverns minne så snart bearbetningen är klar
- Ingen lagring – PDFSub lagrar inte dina filer, loggar inte filinnehåll och behåller inga dokumentdata efter bearbetning
- Ingen AI-träning – Dina dokument används aldrig för att träna AI-modeller. Filinnehåll bearbetas och kasseras
Huvudskillnaden från andra verktyg: PDFSub använder serverbaserad bearbetning endast när det är tekniskt nödvändigt, och endast för de specifika operationer som kräver det. De flesta verktyg skickar varje fil till sina servrar oavsett om det behövs.
Vad detta innebär för dina dokument
Olika dokumenttyper har olika bearbetningsvägar. Här är en praktisk uppdelning:
Kontoutdrag (digitala PDF:er)
Om du laddar ner ett kontoutdrag från din online-bankportal är det en digital PDF – texten är faktisk text, inte en skannad bild. För dessa dokument körs PDFSubs extraktionsmotor helt i din webbläsare.
Transaktionsdatum, beskrivningar, belopp och saldon parsas och struktureras lokalt. Utdata – oavsett om det är Excel, CSV, QBO, OFX eller något annat format – genereras på din enhet. Ditt kontoutdrag, med sina kontonummer, transaktionshistorik och saldon, lämnar aldrig din dator.
Detta är det vanligaste scenariot för konvertering av kontoutdrag, eftersom de allra flesta kontoutdrag idag laddas ner digitalt.
Kontoutdrag (skannade)
Om du arbetar med ett fysiskt utdrag som har fotograferats eller skannats, innehåller PDF:en bilder istället för text. Dessa kräver serverbaserad AI för att läsa texten från bilden. Filen skickas till servern, bearbetas och raderas omedelbart efteråt.
Fakturor och kvitton
Textutvinning från digitala fakturor och kvitton sker i din webbläsare. Om du vill ha AI-driven analys – automatisk identifiering av leverantörsnamn, produktposter, skattebelopp och totaler – kräver det serverbaserad AI-bearbetning.
Kontrakt och juridiska dokument
Sammanfogning av kontrakt, komprimering av juridiska handlingar, extrahering av specifika sidor, lägg till vattenstämpel, redigering av innehåll och de flesta andra PDF-manipulationsoperationer sker helt i din webbläsare. Dokumentet stannar på din enhet under hela processen.
Finansiella rapporter
Konvertering av tabeller i finansiella rapporter till Excel sker i webbläsaren för digitala PDF:er. AI-driven analys – generering av sammanfattningar, extrahering av nyckeltal eller ställande av frågor om innehållet – kräver serverbaserad bearbetning.
Allmän regel
Om operationen är strukturell (sammanslagning, delning, komprimering, rotering, sidextrahering, formatkonvertering, vattenstämpel) – sker den i din webbläsare.
Om operationen kräver AI-förståelse (sammanfattning, översättning, dataextraktion från komplexa eller skannade dokument, frågor och svar) – kräver den serverbaserad bearbetning.
PDFSub erbjuder över 77 verktyg. Majoriteten är webbläsarbaserade operationer som aldrig rör en server.
För reglerade branscher
Om du arbetar inom ett område med strikta krav på datahantering har skillnaden mellan webbläsarbaserad och serverbaserad bearbetning verkliga efterlevnadskonsekvenser.
Hälsovård (HIPAA)
HIPAA kräver att täckta enheter och affärspartners skyddar patientinformation (PHI). När du använder ett molnbaserat verktyg för att bearbeta ett dokument som innehåller PHI, blir verktygsleverantören en affärspartner – vilket kräver ett signerat Business Associate Agreement (BAA), dokumenterade säkerhetskontroller och skyldigheter att anmäla intrång.
När du bearbetar en PDF som innehåller PHI med PDFSubs webbläsarbaserade verktyg, lämnar dokumentet aldrig din enhet. Ingen PHI delas, så inget BAA krävs för dessa operationer. Detta förenklar efterlevnaden och eliminerar en kategori av leverantörsrisk.
För AI-drivna funktioner som kräver serverbaserad bearbetning gäller standardutvärdering av HIPAA-leverantörer.
Finansiella tjänster
Banker, investmentbolag, försäkringsbolag och finansiella rådgivare hanterar data som styrs av Gramm-Leach-Bliley Act, SEC-regler, FINRA-krav och delstatliga regleringar. Dessa kräver dokumenterade datahanteringsprocedurer, riskbedömningar av leverantörer och begränsningar för delning av kunddata med tredje parter.
Webbläsarbaserad bearbetning innebär att kundens finansiella data stannar lokalt för operationer som inte kräver AI. Detta minskar antalet tredjepartsdatabehandlare i din efterlevnadsdokumentation och förenklar riskbedömningar av leverantörer.
Juridik
Advokater hanterar dokument som skyddas av advokatsekretess. Att ladda upp ett privilegierat dokument till en tredjepartsserver skapar en risk att sekretessen kan ifrågasättas om dokumentet nås, utsätts för intrång eller begärs ut från leverantören.
För grundläggande PDF-operationer på privilegierade dokument – sammanfogning av utredningsfiler, komprimering av utställningar, extrahering av sidor – innebär webbläsarbaserad bearbetning att dokumentet aldrig lämnar advokatens enhet. Sekretessen bibehålls utan tvekan.
Redovisning och skatteförberedelse
IRS kräver att alla skatteexperter upprätthåller en skriftlig säkerhetsplan (WISP). AICPA begränsar spridning av konfidentiell klientinformation till tredje parter. Att använda molnbaserade verktyg för klienters finansiella dokument skapar efterlevnadskrav.
Webbläsarbaserad bearbetning eliminerar dessa krav för operationer som inte kräver serverbaserad AI. Din WISP blir enklare, din inventering av leverantörsrisker kortare och din efterlevnadsposition starkare.
Hur du verifierar detta själv
Du behöver inte lita på PDFSubs ord för något av detta. Den webbläsarbaserade arkitekturen är fullt granskningsbar med verktyg som redan finns inbyggda i din webbläsare.
Steg 1: Öppna utvecklarverktyg
I valfri modern webbläsare, tryck på F12 (eller högerklicka var som helst på sidan och välj "Inspektera"). Detta öppnar utvecklarverktygspanelen.
Steg 2: Gå till fliken Nätverk
Klicka på fliken Nätverk. Detta visar varje nätverksbegäran din webbläsare gör – varje nedladdad fil, varje API-anrop, varje dataöverföring. Ingenting kan skickas från din webbläsare utan att synas här.
Steg 3: Rensa loggen
Klicka på rensningsknappen (en cirkel med ett streck igenom) för att börja med en ren tavla.
Steg 4: Bearbeta ett dokument
Ladda en PDF i PDFSub och kör en webbläsarbaserad operation – slå ihop, komprimera, extrahera text, konvertera ett kontoutdrag.
Steg 5: Inspektera nätverksloggen
Titta på de begäranden som dök upp under bearbetningen. För webbläsarbaserade operationer ser du:
- Ingen filuppladdningsbegäran – Det finns ingen POST- eller PUT-begäran som skickar dina PDF-data till en server
- Inget dokumentinnehåll i någon begäran – Filens bytes stannar i din webbläsares minne
- Endast små metadataförfrågningar – Saker som användningsanalys (sidvisningar, funktionsanvändning) som inte innehåller dokumentdata
Detta är samma teknik som säkerhetsforskare använder för att granska webbapplikationer. Om PDFSub i hemlighet skulle ladda upp dina filer, skulle det omedelbart synas.
Vad sägs om AI-operationer?
Om du använder en funktion som kräver serverbaserad AI, kommer du att se en nätverksbegäran i Nätverksfliken. Detta är förväntat – innehållet måste nå servern för AI-bearbetning. Skillnaden är att PDFSub är transparent om vilka operationer som kräver detta, istället för att tyst ladda upp varje fil.
Vad PDFSub samlar in kontra vad det inte gör
Fullständig transparens innebär att vara specifik om vilken data PDFSub hanterar och inte hanterar.
Vad PDFSub samlar in
- Kontoinformation – Din e-postadress, namn och prenumerationsdetaljer om du skapar ett konto
- Användningsanalys – Vilka verktyg du använder, hur ofta, sidvisningar och funktionsinteraktioner. Detta är standard webbanalys som hjälper till att förbättra produkten
- Felrapporter – Om något går fel, hjälper anonymiserad felinformation (inte ditt dokumentinnehåll) till att diagnostisera och fixa problem
- Betalningsinformation – Bearbetas av betalningsleverantören (lagras inte direkt av PDFSub)
Vad PDFSub INTE samlar in för webbläsarbaserade operationer
- Ditt filinnehåll – Bytesen av din PDF överförs aldrig till PDFSubs servrar för webbläsarbaserade operationer
- Extraherad text – Transaktionsbeskrivningar, namn, belopp, datum – inget av dessa data lämnar din enhet för lokala operationer
- Dokumentmetadata – Filnamn, författarfält, skapandedatum i PDF:en stannar på din enhet
- Bearbetad utdata – Excel-filen, CSV, sammanslagen PDF eller komprimerad dokument skapas i din webbläsare och sparas till din enhet
För serverbaserade operationer
När en operation kräver serverbaserad bearbetning (AI-funktioner, OCR för skannade dokument), skickas dokumentinnehållet till servern för bearbetning och raderas omedelbart efteråt. Det lagras, loggas, indexeras eller används inte för något annat syfte än att slutföra den begärda operationen.
Jämförelse med andra metoder
För att sätta PDFSubs metod i kontext, här är hur den jämförs med vanliga alternativ:
| Metod | Var bearbetningen sker | Filuppladdning krävs | Data lagring | Integritetsnivå |
|---|---|---|---|---|
| PDFSub (webbläsarbaserade verktyg) | Din enhet | Nej | Ingen | Högst – filen lämnar aldrig |
| PDFSub (AI-funktioner) | PDFSub server | Ja (vid behov) | Ingen – raderas omedelbart | Hög – minimal exponering |
| Typiskt molnbaserat PDF-verktyg | Leverantörens server | Ja, alltid | Timmar till dagar | Måttlig – beror på leverantör |
| Enterprise molnverktyg | Leverantörens server | Ja, alltid | Enligt lagringspolicy | Måttlig – dokumenterade kontroller |
| Skrivbordsprogramvara | Din enhet | Nej | Lokala filer | Hög – men kräver installation |
Skrivbordsprogramvara är den närmaste jämförelsen när det gäller integritet – båda bearbetar lokalt. Fördelen med webbläsarbaserad: ingen installation, fungerar på alla enheter med en webbläsare, alltid uppdaterad och tillgänglig från Chromebooks och surfplattor som inte kan köra skrivbordsprogramvara.
De ärliga kompromisserna
Ingen metod är perfekt, och att vara trovärdig innebär att vara ärlig om begränsningar.
Webbläsarbaserad bearbetning kan vara långsammare för mycket stora filer. Dedikerade servrar med optimerad hårdvara kan vara snabbare för extremt stora dokument (100+ sidor). För typiska dokument är skillnaden omärkbar.
AI-funktioner kräver serverbaserad bearbetning. Om du behöver AI-sammanfattning, översättning eller OCR för skannade dokument måste innehållet nå servern. PDFSub minimerar detta genom att först använda lokal bearbetning och bara eskalera när det är nödvändigt.
Webbläsarfunktioner har begränsningar. Kantfall – skadade PDF:er, ovanliga kodningar, extremt komplexa layouter – kan behöva serverbaserad återkoppling. PDFSub hanterar detta smidigt, men filen lämnar din enhet i dessa fall.
Filosofin: bearbeta lokalt närhelst det är möjligt, använd serverbaserat endast när det verkligen krävs, var transparent om vilken som är vilken, och radera allt omedelbart när serverbearbetning behövs.
Varför denna arkitektur spelar roll
Trenden inom mjukvara går mot mer molnbearbetning, mer datainsamling, mer serverbaserad beräkning. För känsliga dokument – kontoutdrag, skattedeklarationer, juridiska kontrakt, medicinska journaler och finansiella rapporter – är den trenden exakt bakvänd.
Den säkraste filen är den som aldrig lämnar din enhet. Den säkraste servern är den som aldrig tar emot dina data. Den starkaste integritetspolicyn är den som inte behöver finnas eftersom det inte finns något att skydda på leverantörens sida.
PDFSubs webbläsarbaserade arkitektur är inte en marknadsföringsdifferentiering. Det är ett grundläggande designbeslut som formar hur varje verktyg byggs. När en ny funktion kan implementeras klientsidigt, görs det. Serverbaserad bearbetning är undantaget, inte standard.
För integritetsmedvetna yrkesverksamma, efterlevnadsansvariga och IT-chefer – frågan är inte bara "har detta verktyg en bra integritetspolicy?". Det är "behöver detta verktyg alls åtkomst till mina filer?"
För det mesta av vad PDFSub gör, är svaret nej.
Prova själv
Det bästa sättet att utvärdera PDFSubs integritetsarkitektur är att uppleva den själv.
Starta din 7-dagars gratis provperiod – bläddra bland alla över 77 verktyg, bearbeta ett dokument med Nätverksfliken öppen och se själv. Ingen filuppladdning. Ingen serverbaserad bearbetning. Ditt dokument stannar på din enhet.
För konvertering av kontoutdrag, PDF-sammanslagning, komprimering, textutvinning och dussintals andra operationer – dina filer lämnar aldrig din webbläsare. Det är inte ett löfte. Det är en arkitektur du kan verifiera.