PDFSub
PriserMergeSplitCompressEditE-SignKontoutskrifter
Tilbake til bloggen
VeiledningExcelTabellerPDF-verktøy

Slik trekker du ut tabeller fra PDF til Excel: 5 metoder sammenlignet

28. februar 2026
PDFSub Team

PDF-er lagrer tabeller som spredte tekstfragmenter på x,y-koordinater — ingen rader, ingen kolonner, ingen celler. Slik får du faktisk disse dataene inn i et regneark, fra gratis nettbaserte verktøy til Python-skripting.


PDFDatoBeskrivelseBeløp01/15Payment Recv$1,250.0001/16Office Supply-$85.0001/18Wire Transfer$3,400.0001/20Utility Bill-$142.5001/22Client Inv$2,100.00Trekk utExcelABCD1234567DatoBeskrivelseBeløpBalance01/15/2026Payment Recv$1,250.00$5,25001/16/2026Office Supply-$85.00$5,16501/18/2026Wire Transfer$3,400.00$8,56501/20/2026Utility Bill-$142.50$8,42301/22/2026Client Inv$2,100.00$10,523Trekk ut tabeller fra PDF til ExcelOppdag og trekk ut strukturerte tabell-data automatisk

Du har en PDF med en tabell du trenger i Excel. Kanskje det er en finansiell rapport, en kontoutskrift, en faktura eller en forskningsartikkel. Dataene er der — pent organisert i rader og kolonner på skjermen. Men når du prøver å få dem ut, faller alt fra hverandre.

Dette skjer fordi PDF ikke er et dataformat. Det er et visningsformat. Det finnes ingen "tabell", "rad" eller "kolonne" i PDF-spesifikasjonen. Det som ser ut som en strukturert tabell, er faktisk dusinvis av tekstfragmenter plassert på spesifikke x,y-koordinater på et lerret. Å trekke ut den strukturen tilbake til et regneark er et omvendt konstruksjonsproblem — og forskjellige verktøy håndterer det med varierende grad av suksess.

Denne guiden dekker 5 metoder for å trekke ut tabeller fra PDF-er, når hver av dem fungerer best, og hva du skal gjøre når ting går galt.

Hvorfor tabelluttrekk fra PDF-er er vanskelig

5 Methods for Extracting PDF Tables to ExcelAccuracy comparison across table types — choose the right tool for your PDFMethodBordered TablesBorderless TablesScanned PDFsCostPDFSub (Free+AI)★90–99%75–95%85–95%FreePower Query85–95%40–60%N/A$0 (built-in)Adobe Acrobat90–95%70–80%80–90%$240/yrTabula/Camelot68–73%55–75%N/AFreeCopy-Paste30–50%10–30%0%FreeHigh (80%+)Medium (50–79%)Low (<50%)Not supported★ Recommended for sensitive financial data

PDF-formatet har ingen tabeller

PDF-spesifikasjonen (ISO 32000-2:2020) definerer en innholdsstrøm — en sekvens av operatorer som plasserer individuelle tegn på presise koordinater. En enkel tabellrad som "Dato | Beskrivelse | Beløp" kan lagres som:

BT /F1 10 Tf 72 650 Td (01/15/2026) Tj 200 0 Td (Kontorrekvisita) Tj 180 0 Td (125.00) Tj ET

Det finnes ingen <table>, <tr> eller <td> tagger. Ingen radidentifikatorer. Ingen kolonneavgrensninger. De visuelle linjene du ser rundt celler er separate tegneoperasjoner som er helt frakoblet teksten. Et uttrekksverktøy må utlede hele strukturen fra romlige forhold.

Tre typer tabellgrenser

Tabeller med grenser (gitter) har synlige linjer rundt hver celle. Disse er de enkleste å trekke ut fordi linjene eksplisitt definerer celleavgrensninger. Vanlig i formelle finansrapporter, offentlige skjemaer og standardiserte rapporter.

Tabeller uten grenser (strøm) har ingen linjer i det hele tatt. Strukturen defineres utelukkende av mellomromsjustering — tekstobjekter som deler konsekvente x-koordinater på tvers av rader, danner implisitte kolonner. Vanlig i forskningsartikler, fakturaer og produktkataloger.

Semi-grense-tabeller har bare delvise grenser — vanligvis horisontale linjer mellom seksjoner, men ingen vertikale skillelinjer. Ekstremt vanlig i kontoutskrifter, meglerrapporter og strømregninger. Disse er de vanskeligste å trekke ut fordi delvise grenser villeder gittermodus-parsere, mens manglende grenser reduserer strømmmodus-konfidensen.

Taggede vs. utaggede PDF-er

Taggede PDF-er inkluderer strukturell metadata som identifiserer overskrifter, avsnitt og tabellceller. Utaggede PDF-er har ingen av dette — uttrekksverktøyet får bare rå koordinater. De aller fleste PDF-er er utaggede, inkludert praktisk talt alle kontoutskrifter, fakturaer og finansrapporter.


Metode 1: PDFSub Tabelluttrekk (Gratis + AI-reserve)

PDFSubs Verktøy for tabelluttrekk bruker en tre-nivå tilnærming som maksimerer nøyaktighet samtidig som kostnadene minimeres:

Nivå 1: Koordinatbasert deteksjon (Nettleser, Gratis)

Verktøyet forsøker først uttrekk helt i nettleseren din:

  • Analyserer PDF-innholdsstrømmen for å trekke ut hvert tekstobjekt med dets x,y-koordinater
  • Grupperer tekstobjekter i linjer basert på nærhet til y-koordinat
  • Analyserer x-koordinatjusteringsmønstre på tvers av linjer for å oppdage kolonneavgrensninger
  • Krever minimum 3 rader, 2 kolonner og 70%+ konfidens

Hvis gode tabeller blir funnet, får du strukturerte data umiddelbart — ingen serveropplasting, ingen AI-kreditter brukt, og filen din forlater aldri enheten din.

Nivå 2: Server-side uttrekk (pdfplumber, Gratis)

Hvis koordinatbasert deteksjon ikke finner noen tabeller, bruker verktøyet pdfplumber (MIT-lisens) på serveren. Dette oppdager både eksplisitte linjer (tegnede grenser) og implisitte linjer (ordjusteringsmønstre), finner skjæringspunkter, identifiserer rektangler og mapper tekst til celler.

Nivå 3: AI-uttrekk (Bruker kreditter)

For skannede PDF-er, komplekse layouter eller tabeller som regelbaserte metoder ikke kan parse, faller verktøyet tilbake til AI-drevet visuell uttrekking. Du kan også slå på "Tving AI-uttrekk" for å hoppe direkte til dette nivået når du vet at tabellen er kompleks.

Utdataformater: Excel (.xlsx), CSV, JSON.

Best for: Raskt uttrekk uten å installere programvare. Digitale PDF-er behandles helt i nettleseren din for maksimal personvern.


Metode 2: Power Query i Excel (Kun Windows)

Tilgjengelig i Excel 2019+ og Microsoft 365 på Windows: Data → Hent data → Fra fil → Fra PDF.

Slik fungerer det

  1. Klikk Data → Hent data → Fra fil → Fra PDF
  2. Velg PDF-filen din
  3. Power Query viser et Navigator-panel med oppdagede tabeller per side
  4. Velg tabellene du vil ha, klikk Transformer data for å rydde opp, deretter Last inn

Styrker

  • Innebygd i Excel — ingen ekstra kostnad for Microsoft 365-abonnenter
  • Power Query's transformasjonsmotor håndterer etterbehandling godt (fyll ned, pivoter, flett kolonner)
  • Kan oppdatere data hvis kilde-PDF-en oppdateres
  • Støtter tilkobling av flere tabeller fra samme PDF

Begrensninger

  • Kun Windows — ikke tilgjengelig i Excel for Mac, Excel Online eller mobil
  • Sliter med tabeller uten grenser — fungerer best med tydelig avgrensede tabeller
  • Ingen OCR — kan ikke trekke ut fra skannede/bilde-PDF-er
  • Tabeller med flere sider er problematiske — hver side importeres ofte som en separat tabell, noe som krever manuell sammenslåing
  • Rader med flere linjer — innpakket tekst i celler deles ofte i flere rader, noe som krever opprydding

Best for: Windows-brukere med Microsoft 365 som har enkle, avgrensede tabeller.


Metode 3: Adobe Acrobat (Betalt)

Fil → Eksporter en PDF → Regneark → Microsoft Excel-arbeidsbok

Priser (2026)

  • Acrobat Standard: $12.99/måned (årsplan)
  • Acrobat Pro: $19.99/måned (årsplan)
  • Eksporter PDF (stående): lavere nivå plan kun for konvertering

Styrker

  • Innebygd OCR for skannede dokumenter
  • Bevarer generelt formatering for enkle avgrensede tabeller
  • Batch-behandling tilgjengelig i Pro

Begrensninger

  • Dyr for kun tabelluttrekk — $156–$240/år
  • Komplekse tabeller med flettede celler og tabeller som strekker seg over flere sider, gir fortsatt feiljustert utdata
  • Filer kan lastes opp til Adobes sky for behandling — problematisk for sensitive finansdata
  • Krever installasjon på skrivebordet

Best for: Brukere som allerede betaler for Acrobat Pro og trenger sporadiske tabell-eksporter med OCR.


Metode 4: Kopier-lim inn (Manuell)

Den mest intuitive tilnærmingen — og den som oftest feiler for tabeller.

Vanlige problemer

  • Alle data i én kolonne — hele tabellen limes inn uten kolonnebrudd
  • Tall blir tekst — valutasymboler, parenteser og skilletegn bryter numerisk formatering
  • Innhold med flere linjer i cellen skaper spøkelsesrader — en beskrivelse som brytes over to linjer i cellen, blir til to separate rader
  • Overskrifter atskilt fra data — overskriftsraden blir koblet fra
  • Kolonner feiljustert — data forskyves fordi tegnavstand ikke oversettes til tabulatorer

Delvis løsning

Lim inn i Excel, deretter bruk Data → Tekst til kolonner med mellomrom eller faste bredde-delimitere. Aktiver "Behandle påfølgende skilletegn som én". Dette fungerer for svært enkle, godt avsatte tabeller, men feiler for alt med innhold i celler med flere ord.

Best for: Uttrekk av en enkelt liten, enkel tabell som en siste utvei.


Metode 5: Python-biblioteker (For utviklere)

Tre MIT-lisensierte biblioteker håndterer PDF-tabelluttrekk programmatisk:

Tabula-py

Python-wrapper rundt Tabula (Java). Krever Java runtime.

  • Gittermodus for avgrensede tabeller (finner linjer og skjæringspunkter)
  • Strømmmodus for tabeller uten grenser (bruker tekstjustering)
  • Bra for batch-behandling i skript
  • Ingen OCR-støtte

Camelot

Tilbyr også gitter- og strømmmodus.

  • Yter generelt bedre enn Tabula for avgrensede tabeller
  • Strømmmodus har flere konfigurasjonsparametere for finjustering
  • Gir nøyaktighetsrapporter med hvert uttrekk
  • Krever Ghostscript-avhengighet. Ingen OCR-støtte

pdfplumber

Koordinatbasert tilnærming: trekker ut hvert tegn med sin eksakte posisjon, og utleder deretter struktur.

  • Håndterer det bredeste spekteret av tabelltyper
  • Gir mest kontroll, men krever mer konfigurasjon
  • Dette er biblioteket PDFSub bruker på serveren
  • Ingen OCR-støtte

Best for: Utviklere som automatiserer gjentakende tabelluttrekk-arbeidsflyter, behandler store mengder like dokumenter.


Vanlige problemer og hvordan løse dem

Flettede celler

Når celler strekker seg over flere rader eller kolonner, plasserer de fleste verktøy innholdet i øverste venstre celle og lar de andre være tomme, eller feiljusterer alle påfølgende kolonner. Det finnes ingen universell løsning — CSV-format har ingen flettekonsept, så fletteinformasjon går alltid tapt.

Fiks: Trekk ut tabellen, og fiks deretter manuelt fletteartefakter i Excel. For gjentakende tabeller med samme flettemønster, vurder et etterbehandlingsskript.

Innhold med flere linjer i celler

Lange beskrivelser som brytes innenfor en celle, blir til flere rader i utdata, noe som skyver alle påfølgende data ut av justering. Dette er den vanligste feilen ved uttrekk fra finansdokumenter.

Fiks: Etter uttrekk, se etter rader som mangler datoer og beløp — dette er sannsynligvis fortsettelseslinjer som tilhører raden over. I Excel, flett dem manuelt eller bruk en hjelpeformel.

Tabeller som strekker seg over flere sider

Verktøy må bestemme hvor tabellen fortsetter, om gjentatte overskrifter skal fjernes, og hvordan sideføtter skal filtreres. Mange verktøy behandler hver side uavhengig.

Fiks: Hvis verktøyet ditt gir resultater per side, kombiner arkene og fjern gjentatte overskriftsrader. Sjekk at den siste raden på side N kobles riktig til den første raden på side N+1.

Problemer med valutainnstillinger

Negative tall i parentes ((1.234,56)) limes inn som tekst, ikke tall. Valutasymboler og tusenskilletegn bryter også numerisk formatering.

Fiks: Etter uttrekk, velg beløpskolonnen og bruk Finn og erstatt for å fjerne kr, (, ) tegn. Formater deretter kolonnen som Tall. For parentes-negative tall, erstatt ( med - og fjern ), konverter deretter til Tall-format.

Datoambiguitet

01/02/2026 — er det 2. januar eller 1. februar? Uttrekksverktøyet bevarer strengen som den er, men Excel kan tolke den på nytt basert på din lokale innstilling.

Fiks: Sjekk kilde-PDF-en for ledetråder om datoformat (se etter datoer med dagverdi > 12). Still inn Excels datoformat til å matche kilden før import.


Nøyaktighetsammenligning

Metode Enkel avgrenset Uten grenser Semi-avgrenset Skannede PDF-er
PDFSub (koordinat + AI) 90–99 % 75–95 % 70–95 % 85–95 % (AI)
Power Query 85–95 % 40–60 % 50–70 % Støttes ikke
Adobe Acrobat 90–95 % 70–80 % 70–85 % 80–90 %
Tabula ~68 % 55–70 % 50–65 % Støttes ikke
Camelot ~73 % 65–75 % 60–70 % Støttes ikke
Kopier-lim inn 30–50 % 10–30 % 10–30 % Ikke mulig

Intervaller reflekterer variasjon på tvers av dokumentkompleksitet. Benchmarkdata fra Procycons 2025 PDF Extraction Benchmark og Camelot-sammenligningsstudier.


Hvilken metode bør du bruke?

Scenario Beste metode Hvorfor
Raskt engangstrekk PDFSub Ingen installasjon, nettleserbasert, gratis koordinatuttrekk
Enkel avgrenset tabell, Windows Power Query Innebygd i Excel, ingen ekstra kostnad
Skannet PDF PDFSub (AI) eller Adobe Acrobat Krever OCR-kapasitet
Sensitive finansdata PDFSub Nettleserbasert behandling, filen lastes aldri opp
Gjentakende batch-behandling Python (pdfplumber) Skriptbar, automatiserbar
Har allerede Acrobat Pro Adobe Acrobat Betaler allerede, enkle tabeller fungerer bra
Enkelt liten tabell, ingen verktøy Kopier-lim inn Siste utvei, verifiser alt

Tips for best resultat

Bruk native PDF-er. Last ned dokumenter fra kilden i stedet for å skanne papir. Native PDF-er har perfekt tekst, noe som gjør uttrekket dramatisk mer nøyaktig.

Identifiser tabelltypen først. Avgrensede tabeller fungerer med nesten ethvert verktøy. Tabeller uten grenser trenger strømmmodus eller AI-uttrekk. Å kjenne typen hjelper deg med å velge riktig metode på forhånd.

Start med gratis, regelbaserte metoder. Prøv koordinatbasert uttrekk først. Eskaler kun til AI når regelbaserte metoder gir dårlige resultater — dette sparer tid og kreditter.

Verifiser alltid utdataene. Sjekk radantall, kolonnejustering, numeriske verdier og totaler. Stol aldri blindt på uttrekk-utdata.

Se opp for tallformatering. Etter uttrekk, verifiser at tall faktisk er tall i Excel (høyrejustert), ikke tekststrenger (venstrejustert). Valutasymboler og parentes-negative tall er vanlige syndere.

For sensitive data, foretrekk nettleserbaserte verktøy. Finansrapporter, kontoutskrifter og skattedokumenter inneholder sensitiv informasjon. Verktøy som behandler PDF-er i nettleseren din, laster aldri opp filen din, noe som eliminerer risikoen for dataeksponering.


Prøv gratis

Klar til å trekke ut tabeller fra PDF-en din? Last opp en fil nå — PDFSub prøver gratis koordinatbasert uttrekk først, med AI-reserve for komplekse tabeller. Digitale PDF-er behandles helt i nettleseren din. Start en 7-dagers gratis prøveperiode.

Tilbake til bloggen

Spørsmål? Kontakt oss

PDFSub

Alle PDF- og dokumentverktøyene du trenger på ett sted. Raskt, sikkert og privat.

GDPR-kompatibelCCPA-kompatibelSOC 2 Ready
Powered by PDFSub Engine

PDF-verktøy

  • Slå sammen PDF-er
  • Del opp PDF
  • Endre siderekkefølge
  • Roter PDF
  • Slett sider
  • Hent ut sider
  • Legg til vannmerke
  • Rediger PDF
  • Stemple PDF
  • Fyll ut PDF-skjema
  • Beskjær sider
  • Endre sidestørrelse
  • Legg til sidetall
  • Topptekst og bunntekst
  • Komprimer PDF
  • Gjør søkbar
  • Clean Scanned PDF
  • Photo to Document
  • Auto-Crop PDF
  • Reparer PDF
  • Rediger metadata
  • Fjern metadata
  • PDF til Word
  • Word til PDF
  • Excel til PDF
  • PDF til PowerPoint
  • PDF til bilde
  • Bilde til PDF
  • HTML til PDF
  • HEIC til bilde
  • WEBP til JPG
  • WEBP til PNG
  • PowerPoint til PDF
  • PDF til HTML
  • EPUB til PDF
  • TIFF til PDF
  • PNG til PDF
  • PDF til PNG
  • Tekst til PDF
  • SVG til PDF
  • WEBP til PDF
  • PDF til EPUB
  • RTF til PDF
  • ODT til PDF
  • ODS til PDF
  • PDF til ODT
  • PDF til ODS
  • PDF til SVG
  • PDF til RTF
  • PDF til tekst
  • ODP til PDF
  • PDF til ODP
  • ODG til PDF
  • PDF-visning
  • PDF/A-konvertering
  • Opprett PDF
  • Massekonvertering
  • Sider per ark
  • Passordbeskytt
  • Lås opp PDF
  • Sladd PDF
  • E-signer PDF
  • Sammenlign PDF-er
  • Hent ut tabeller
  • PDF to Excel
  • Konverter kontoutskrift
  • Fakturauttrekker
  • Kvitteringsskanner
  • Økonomisk rapport
  • OCR - Hent ut tekst
  • Konverter håndskrift
  • Oppsummer PDF
  • Oversett PDF
  • Chat med PDF
  • Hent ut data
  • Designstudio

Produkt

  • Privacy & Security
  • Alle verktøy
  • Funksjoner
  • Kontoutskrifter
  • Priser
  • Ofte stilte spørsmål
  • Blogg

Brukerstøtte

  • Hjelpesenter
  • Kontakt
  • Ofte stilte spørsmål

Juridisk

  • Personvernerklæring
  • Brukervilkår
  • Informasjonskapsler

© 2026 PDFSub. Med enerett.

Laget i USA med for folk over hele verden