PDFSub
PriserMergeSplitCompressEditE-SignKontoutdrag
Tillbaka till bloggen
HandbokExcelTabellerPDF-verktyg

Extrahera tabeller från PDF till Excel: 5 jämförda metoder

28 februari 2026
PDFSub Team

PDF-filer lagrar tabeller som utspridda textfragment vid x,y-koordinater — inga rader, inga kolumner, inga celler. Här är hur du faktiskt får in den datan i ett kalkylblad, från gratis webbaserade verktyg till Python-skript.


PDFDatumBeskrivningBelopp01/15Payment Recv$1,250.0001/16Office Supply-$85.0001/18Wire Transfer$3,400.0001/20Utility Bill-$142.5001/22Client Inv$2,100.00ExtraheraExcelABCD1234567DatumBeskrivningBeloppBalance01/15/2026Payment Recv$1,250.00$5,25001/16/2026Office Supply-$85.00$5,16501/18/2026Wire Transfer$3,400.00$8,56501/20/2026Utility Bill-$142.50$8,42301/22/2026Client Inv$2,100.00$10,523Extrahera tabeller från PDF till ExcelUpptäck och extrahera strukturerad tabell data automatiskt

Du har en PDF med en tabell du behöver i Excel. Kanske är det en finansiell rapport, ett bankutdrag, en faktura eller en forskningsartikel. Datan finns där – snyggt organiserad i rader och kolumner på skärmen. Men när du försöker få ut den, faller allt isär.

Detta händer eftersom PDF inte är ett dataformat. Det är ett visningsformat. Det finns inget koncept av en "tabell", "rad" eller "kolumn" i PDF-specifikationen. Vad som ser ut som en strukturerad tabell är faktiskt dussintals textfragment placerade vid specifika x,y-koordinater på en duk. Att extrahera den strukturen tillbaka till ett kalkylblad är ett problem med omvänd ingenjörskonst – och olika verktyg hanterar det med varierande framgång.

Den här guiden täcker 5 metoder för att extrahera tabeller från PDF-filer, när var och en fungerar bäst, och vad du ska göra när saker går fel.

Varför tabellutdragning från PDF är svårt

5 Methods for Extracting PDF Tables to ExcelAccuracy comparison across table types — choose the right tool for your PDFMethodBordered TablesBorderless TablesScanned PDFsCostPDFSub (Free+AI)★90–99%75–95%85–95%FreePower Query85–95%40–60%N/A$0 (built-in)Adobe Acrobat90–95%70–80%80–90%$240/yrTabula/Camelot68–73%55–75%N/AFreeCopy-Paste30–50%10–30%0%FreeHigh (80%+)Medium (50–79%)Low (<50%)Not supported★ Recommended for sensitive financial data

PDF-formatet har inga tabeller

PDF-specifikationen (ISO 32000-2:2020) definierar en innehållsström – en sekvens av operationer som placerar enskilda tecken vid exakta koordinater. En enkel tabellrad som "Datum | Beskrivning | Belopp" kan lagras som:

BT /F1 10 Tf 72 650 Td (01/15/2026) Tj 200 0 Td (Kontorsmaterial) Tj 180 0 Td (125.00) Tj ET

Det finns inga <table>, <tr> eller <td> taggar. Inga radidentifierare. Inga kolumnavgränsningar. De visuella linjerna du ser runt celler är separata ritoperationer som är helt frikopplade från texten. Ett extraktionsverktyg måste härleda hela strukturen från rumsliga relationer.

Tre typer av tabellramar

Inramade (rutnät) tabeller har synliga linjer runt varje cell. Dessa är enklast att extrahera eftersom linjerna tydligt definierar cellgränser. Vanliga i formella finansiella rapporter, myndighetsformulär och standardiserade rapporter.

Oinramade (ström) tabeller har inga linjer alls. Strukturen definieras helt av blankstegsjustering – textobjekt som delar konsekventa x-koordinater över rader bildar underförstådda kolumner. Vanliga i forskningsartiklar, fakturor och produktkataloger.

Halvinramade tabeller har bara partiella ramar – vanligtvis horisontella linjer mellan sektioner men inga vertikala avdelare. Extremt vanliga i bankutdrag, mäklarrapporter och fakturor för allmännyttiga tjänster. Dessa är svårast att extrahera eftersom partiella ramar vilseleder rutnätsläges-tolkar medan saknade ramar minskar strömläges-konfidensen.

Taggade vs. Otaggade PDF-filer

Taggade PDF-filer innehåller strukturell metadata som identifierar rubriker, stycken och tabellceller. Otaggade PDF-filer har inget av detta – extraktionsverktyget får bara råa koordinater. De allra flesta PDF-filer är otaggade, inklusive praktiskt taget alla bankutdrag, fakturor och finansiella rapporter.


Metod 1: PDFSub Extrahera tabeller (Gratis + AI-reserv)

PDFSubs Verktyg för att extrahera tabeller använder en tre-nivåers metod som maximerar noggrannheten samtidigt som kostnaden minimeras:

Nivå 1: Koordinatbaserad detektering (Webbläsare, Gratis)

Verktyget försöker först extrahera helt i din webbläsare:

  • Parsar PDF-innehållsströmmen för att extrahera varje textobjekt med dess x,y-koordinater
  • Grupperar textobjekt i rader baserat på närhet till y-koordinater
  • Analyserar mönster för x-koordinatjustering över rader för att upptäcka kolumnavgränsningar
  • Kräver minst 3 rader, 2 kolumner och 70%+ konfidens

Om bra tabeller hittas får du strukturerad data omedelbart – ingen serveruppladdning, inga AI-krediter förbrukade, och din fil lämnar aldrig din enhet.

Nivå 2: Serverbaserad extraktion (pdfplumber, Gratis)

Om koordinatbaserad detektering inte hittar några tabeller använder verktyget pdfplumber (MIT-licens) på servern. Detta detekterar både explicita linjer (ritade ramar) och underförstådda linjer (ordjusteringsmönster), hittar skärningspunkter, identifierar rektanglar och mappar text till celler.

Nivå 3: AI-extraktion (Använder krediter)

För skannade PDF-filer, komplexa layouter eller tabeller som regelbaserade metoder inte kan tolka, faller verktyget tillbaka på AI-driven visuell extraktion. Du kan också aktivera "Tvinga AI-extraktion" för att hoppa direkt till denna nivå när du vet att tabellen är komplex.

Utdataformat: Excel (.xlsx), CSV, JSON.

Bäst för: Snabb extraktion utan att installera programvara. Digitala PDF-filer bearbetas helt i din webbläsare för maximal integritet.


Metod 2: Power Query i Excel (Endast Windows)

Tillgängligt i Excel 2019+ och Microsoft 365 på Windows: Data → Hämta data → Från fil → Från PDF.

Hur det fungerar

  1. Klicka på Data → Hämta data → Från fil → Från PDF
  2. Välj din PDF-fil
  3. Power Query visar en Navigatörspanel som listar upptäckta tabeller per sida
  4. Välj de tabeller du vill ha, klicka på Transformera data för att rensa upp, och sedan Läs in

Styrkor

  • Inbyggt i Excel – ingen extra kostnad för Microsoft 365-prenumeranter
  • Power Querys transformationsmotor hanterar efterbearbetning väl (fylla ner, pivotera, slå ihop kolumner)
  • Kan uppdatera data om käll-PDF:en uppdateras
  • Stöder anslutning av flera tabeller från samma PDF

Begränsningar

  • Endast Windows – inte tillgängligt i Excel för Mac, Excel Online eller mobil
  • Kämpar med oinramade tabeller – fungerar bäst med tydligt inramade tabeller
  • Ingen OCR – kan inte extrahera från skannade/bild-PDF-filer
  • Fler sidors tabeller är problematiska – varje sida importeras ofta som en separat tabell, vilket kräver manuell sammanfogning
  • Flerradiga rader – text som bryts inom celler delas ofta upp i flera rader, vilket kräver rensning

Bäst för: Windows-användare med Microsoft 365 som har enkla, inramade tabeller.


Metod 3: Adobe Acrobat (Betald)

Arkiv → Exportera en PDF → Kalkylblad → Microsoft Excel-arbetsbok

Prissättning (2026)

  • Acrobat Standard: 12,99 USD/månad (årsplan)
  • Acrobat Pro: 19,99 USD/månad (årsplan)
  • Export PDF (fristående): lägre nivå för enbart konvertering

Styrkor

  • Inbyggd OCR för skannade dokument
  • Bevarar generellt formateringen för enkla inramade tabeller
  • Batchbearbetning tillgänglig i Pro

Begränsningar

  • Dyr för enbart tabellutdragning – 156–240 USD/år
  • Komplexa tabeller med sammanslagna celler och tabeller över flera sidor ger fortfarande felaktigt utdata
  • Filer kan laddas upp till Adobes moln för bearbetning – problematiskt för känsliga finansiella data
  • Kräver installation på datorn

Bäst för: Användare som redan betalar för Acrobat Pro och behöver enstaka tabell-export med OCR.


Metod 4: Kopiera-Klistra (Manuell)

Det mest intuitiva tillvägagångssättet – och det som oftast misslyckas för tabeller.

Vanliga problem

  • All data i en kolumn – hela tabellen klistras in utan kolumnbrytningar
  • Siffror blir text – valutasymboler, parenteser och skiljetecken bryter numerisk formatering
  • Flerradigt cellinnehåll skapar spök-rader – en beskrivning som bryts över två rader i cellen blir två separata rader
  • Rubriker separerade från data – rubrikraden kopplas bort
  • Kolumner feljusterade – data flyttas eftersom teckenavståndet inte översätts till tabbar

Partiell lösning

Klistra in i Excel, använd sedan Data → Text till kolumner med blanksteg eller fast bredd som avgränsare. Aktivera "Behandla på varandra följande avgränsare som en". Detta fungerar för mycket enkla, välutrymmade tabeller men misslyckas för allt med cellinnehåll som består av flera ord.

Bäst för: Att extrahera en enda liten, enkel tabell som en sista utväg.


Metod 5: Python-bibliotek (För utvecklare)

Tre MIT-licensierade bibliotek hanterar PDF-tabellutdragning programmatiskt:

Tabula-py

Python-wrapper runt Tabula (Java). Kräver Java runtime.

  • Rutnätsläge för inramade tabeller (hittar linjer och skärningspunkter)
  • Strömläge för oinramade tabeller (använder textjustering)
  • Bra för batchbearbetning i skript
  • Ingen OCR-support

Camelot

Erbjuder också rutnäts- och strömlägen.

  • Presterar generellt bättre än Tabula för inramade tabeller
  • Strömläget har fler konfigurationsparametrar för finjustering
  • Ger noggrannhetsrapporter med varje extraktion
  • Kräver Ghostscript-beroende. Ingen OCR-support

pdfplumber

Koordinatbaserad metod: extraherar varje tecken med dess exakta position, härleder sedan struktur.

  • Hanterar det bredaste utbudet av tabelltyper
  • Ger mest kontroll men kräver mer konfiguration
  • Detta är biblioteket som PDFSub använder på servern
  • Ingen OCR-support

Bäst för: Utvecklare som automatiserar återkommande arbetsflöden för tabellutdragning, bearbetar stora mängder liknande dokument.


Vanliga problem och hur man löser dem

Sammanslagna celler

När celler sträcker sig över flera rader eller kolumner, placerar de flesta verktyg antingen innehållet i den övre vänstra cellen och lämnar andra tomma, eller feljusterar alla efterföljande kolumner. Det finns ingen universell lösning – CSV-formatet har inget koncept av sammanslagning, så information om sammanslagning går alltid förlorad.

Åtgärd: Extrahera tabellen, fixa sedan manuellt sammanslagningsartefakter i Excel. För återkommande tabeller med samma sammanslagningsmönster, överväg ett efterbearbetningsskript.

Flerradigt innehåll inom celler

Långa beskrivningar som bryts inom en cell blir flera rader i utdata, vilket skjuter all efterföljande data ur linje. Detta är det vanligaste extraktionsfelet för finansiella dokument.

Åtgärd: Efter extraktion, leta efter rader som saknar datum och belopp – dessa är troligen fortsättningsrader som tillhör raden ovanför. I Excel, slå ihop dem manuellt eller använd en hjälpformel.

Tabeller som sträcker sig över flera sidor

Verktyg måste bestämma var tabellen fortsätter, om upprepade rubriker ska tas bort och hur sidfötter ska filtreras. Många verktyg behandlar varje sida oberoende.

Åtgärd: Om ditt verktyg ger resultat per sida, kombinera bladen och ta bort upprepade rubrikrader. Kontrollera att den sista raden på sida N ansluter korrekt till den första raden på sida N+1.

Problem med valutainställningar

Negativa tal inom parenteser ((1.234,56)) klistras in som text, inte tal. Valutasymboler och tusentalsavgränsare bryter också numerisk formatering.

Åtgärd: Efter extraktion, markera beloppskolumnen och använd Sök och ersätt för att ta bort $-, (-, )-tecken. Formatera sedan kolumnen som Tal. För parentes-negativ, ersätt ( med - och ta bort ), konvertera sedan till Talformat.

Datumoklarhet

01/02/2026 – är det 2 januari eller 1 februari? Extraktionsverktyget bevarar strängen som den är, men Excel kan tolka om den baserat på din region.

Åtgärd: Kontrollera käll-PDF:en för ledtrådar om datumformat (leta efter datum med dagvärden > 12). Ställ in Excels datumformat så att det matchar källan innan import.


Noggrannhetsjämförelse

Metod Enkel Inramad Oinramad Halvinramad Skannade PDF-filer
PDFSub (koordinat + AI) 90–99% 75–95% 70–95% 85–95% (AI)
Power Query 85–95% 40–60% 50–70% Stöds ej
Adobe Acrobat 90–95% 70–80% 70–85% 80–90%
Tabula ~68% 55–70% 50–65% Stöds ej
Camelot ~73% 65–75% 60–70% Stöds ej
Kopiera-klistra 30–50% 10–30% 10–30% Ej möjligt

Intervall återspeglar variationer i dokumentkomplexitet. Benchmarkdata från Procycons 2025 PDF Extraction Benchmark och Camelot-jämförelsestudier.


Vilken metod ska du använda?

Scenario Bästa metod Varför
Snabb engångsextraktion PDFSub Ingen installation, webbaserad, gratis koordinatextraktion
Enkel inramad tabell, Windows Power Query Inbyggt i Excel, ingen extra kostnad
Skannad PDF PDFSub (AI) eller Adobe Acrobat Kräver OCR-kapacitet
Känsliga finansiella data PDFSub Webbaserad bearbetning, filen laddas aldrig upp
Återkommande batchbearbetning Python (pdfplumber) Skriptbar, automatiserbar
Har redan Acrobat Pro Adobe Acrobat Betalar redan, enkla tabeller fungerar bra
En enda liten tabell, inga verktyg Kopiera-klistra Sista utväg, verifiera allt

Tips för bästa resultat

Använd ursprungliga PDF-filer. Ladda ner dokument från deras källa istället för att skanna papper. Ursprungliga PDF-filer har perfekt text, vilket gör extraktionen dramatiskt mer exakt.

Identifiera tabelltypen först. Inramade tabeller fungerar med nästan alla verktyg. Oinramade tabeller behöver strömläge eller AI-extraktion. Att känna till typen hjälper dig att välja rätt metod i förväg.

Börja med gratis, regelbaserade metoder. Prova koordinatbaserad extraktion först. Eskalera bara till AI när regelbaserade metoder ger dåliga resultat – detta sparar tid och krediter.

Verifiera alltid utdata. Kontrollera radantal, kolumnjustering, numeriska värden och totaler. Lita aldrig blint på extraktionsutdata.

Var uppmärksam på nummerformatering. Efter extraktion, verifiera att siffror faktiskt är siffror i Excel (högerjusterade), inte textsträngar (vänsterjusterade). Valutasymboler och parentes-negativ är vanliga syndare.

För känsliga data, föredra webbaserade verktyg. Finansiella rapporter, bankutdrag och skattedokument innehåller känslig information. Verktyg som bearbetar PDF-filer i din webbläsare laddar aldrig upp din fil, vilket eliminerar risken för dataläckage.


Prova gratis

Redo att extrahera tabeller från din PDF? Ladda upp en fil nu – PDFSub försöker först gratis koordinatbaserad extraktion, med AI-reserv för komplexa tabeller. Digitala PDF-filer bearbetas helt i din webbläsare. Starta en 7-dagars gratis provperiod.

Tillbaka till bloggen

Frågor? Kontakta oss

PDFSub

Alla PDF- och dokumentverktyg du behöver på ett ställe. Snabbt, säkert och privat.

GDPR-kompatibelCCPA-kompatibelSOC 2 Ready
Powered by PDFSub Engine

PDF-verktyg

  • Slå ihop PDF-filer
  • Dela upp PDF
  • Ändra sidordning
  • Rotera PDF
  • Ta bort sidor
  • Extrahera sidor
  • Lägg till vattenstämpel
  • Redigera PDF
  • Stämpla PDF
  • PDF-formulärfyllare
  • Beskär sidor
  • Ändra sidstorlek
  • Lägg till sidnummer
  • Sidhuvuden och sidfötter
  • Komprimera PDF
  • Gör sökbar
  • Clean Scanned PDF
  • Photo to Document
  • Auto-Crop PDF
  • Reparera PDF
  • Redigera metadata
  • Ta bort metadata
  • PDF till Word
  • Word till PDF
  • Excel till PDF
  • PDF till PowerPoint
  • PDF till bild
  • Bild till PDF
  • HTML till PDF
  • HEIC till bild
  • WEBP till JPG
  • WEBP till PNG
  • PowerPoint till PDF
  • PDF till HTML
  • EPUB till PDF
  • TIFF till PDF
  • PNG till PDF
  • PDF till PNG
  • Text till PDF
  • SVG till PDF
  • WEBP till PDF
  • PDF till EPUB
  • RTF till PDF
  • ODT till PDF
  • ODS till PDF
  • PDF till ODT
  • PDF till ODS
  • PDF till SVG
  • PDF till RTF
  • PDF till text
  • ODP till PDF
  • PDF till ODP
  • ODG till PDF
  • PDF-visare
  • PDF/A-konvertering
  • Skapa PDF
  • Batch-konvertering
  • Sidor per ark
  • Lösenordsskydda
  • Lås upp PDF
  • Maskera PDF
  • E-signera PDF
  • Jämför PDF-filer
  • Extrahera tabeller
  • PDF to Excel
  • Kontoutdragskonverterare
  • Fakturaextraherare
  • Kvittoskanner
  • Ekonomisk rapport
  • OCR - Extrahera text
  • Konvertering av handskrift
  • Sammanfatta PDF
  • Översätt PDF
  • Chatta med PDF
  • Extrahera data
  • Designstudio

Produkt

  • Privacy & Security
  • Alla verktyg
  • Funktioner
  • Kontoutdrag
  • Priser
  • Vanliga frågor
  • Blogg

Support

  • Hjälpcenter
  • Kontakt
  • Vanliga frågor

Juridiskt

  • Integritetspolicy
  • Användarvillkor
  • Cookiepolicy

© 2026 PDFSub. Med ensamrätt.

Skapad i USA med för människor överallt