PDFSub
PrijzenMergeSplitCompressEditE-SignBankafschriften
Terug naar blog
GidsAIJaarverslagenData-extractieFinanciële analyse

Extraheer belangrijke statistieken automatisch uit jaarverslagen

2 maart 2026
PDFSub Team

Jaarverslagen begraven kritieke financiële gegevens in PDF's van 100-300 pagina's. Hier leest u hoe u omzet, nettowinst, winst per aandeel, kasstroom en andere belangrijke statistieken kunt extraheren zonder handmatig getallen uit tabellen naar spreadsheets te kopiëren.


U heeft zojuist een jaarverslag van 247 pagina's gedownload. Ergens daarin staan de twaalf getallen die u echt nodig heeft: omzet, nettowinst, winst per aandeel, totale activa, totale passiva, operationele kasstroom, EBITDA en een paar marges. De rest is standaardtekst, juridische openbaarmakingen en stockfoto's van lachende werknemers.

Het vinden van die getallen is niet het moeilijkste deel. Ze staan in het gedeelte financiële overzichten, meestal beginnend rond pagina 80. Het moeilijke deel is ze uit de PDF halen en in uw model krijgen in een formaat waarmee u daadwerkelijk kunt werken. En dan dat opnieuw doen voor de volgende twintig bedrijven in uw coverage universe. En dan dat opnieuw doen voor de laatste vijf jaar van elk bedrijf om een tijdreeks op te bouwen.

Dit is het probleem van de extractie van jaarverslagen, en het kost aandelenonderzoeksteams, kredietanalisten en portfoliomanagers duizenden uren per jaar. De wereldwijde markt voor data-extractiesoftware zal naar verwachting 3,64 miljard dollar bereiken tegen 2029, met een jaarlijkse groei van 15,9%, grotendeels gedreven door financiële professionals die het beu zijn om getallen uit PDF-tabellen naar Excel te kopiëren.

Deze gids behandelt wat de extractie van jaarverslagen uniek moeilijk maakt, welke statistieken u moet targeten en hoe u het proces kunt automatiseren, zodat u uw tijd kunt besteden aan analyse in plaats van aan gegevensinvoer.

Data ExtractionExtract Data from Annual ReportsTurn Complex PDFs into Structured DataAnnual Report2025200+ pagesFinancial Statements, KPIs, MetricsAIExtract & StructureEXTRACTED STRUCTURED DATARevenue$12.4MGrowth23%Net Margin18%ROI32%Revenue BreakdownSegmentQ1Q2Q3Q4Product Sales$2.1M$2.4M$2.8M$3.2MServices$0.4M$0.5M$0.5M$0.5MFinancial RatiosD/E Ratio0.45Current Ratio2.3P/E Ratio18.5EPS$3.42Export as:CSVXLSXJSONFrom 200-page PDF to structured data in secondsExtract financial tables, KPIs, and metrics from annual report PDFs automatically

De Uitdaging van Jaarverslag-extractie

Jaarverslagen zijn geen gewone PDF-documenten. Een bankafschrift heeft een voorspelbare structuur: datum, beschrijving, bedrag, saldo, herhaald voor elke transactie. Een factuur heeft een kop, regelitems en een totaal. Deze documenten volgen patronen die extractietools snel kunnen leren.

Jaarverslagen zijn anders. Het zijn lange, complexe en structureel inconsistente documenten die het volgende combineren:

  • Doorlopende verhalende tekst in de brief van de CEO, Management Discussion and Analysis (MD&A) en secties met risicofactoren
  • Dichte financiële tabellen in de resultatenrekening, balans en kasstroomoverzicht
  • Voetnoten en annotaties die de getallen in die tabellen kwalificeren, aanpassen of herzien
  • Grafieken en diagrammen die trends visualiseren, maar geen machineleesbare gegevens bevatten
  • Segmentrapportagetabellen met uitsplitsingen per geografie, bedrijfseenheid of productlijn
  • Meerjarige vergelijkingen die gegevens van twee of drie jaar naast elkaar presenteren

Een typische 10-K-aangifte is 100 tot 300 pagina's lang. De financiële overzichten zelf kunnen 30 tot 40 pagina's beslaan, maar de toelichtingen op de financiële overzichten – waar de echte details leven – kunnen nog eens 50 tot 60 pagina's beslaan. De rest is juridische taal, risicofactoren, tabellen met beloningen van leidinggevenden en openbaarmakingen over bestuur.

Waarom Standaard Kopiëren en Plakken Faalt

Als u ooit hebt geprobeerd een tabel in een PDF-jaarverslag te selecteren en naar Excel te plakken, kent u het resultaat: kolommen lopen in elkaar over, getallen worden in de verkeerde rijen geplaatst en voetnootmarkeringen worden in uw gegevens ingebed.

PDF's bevatten geen tabellen. Ze bevatten individuele tekens die op precieze x,y-coördinaten op een canvas zijn geplaatst. Wat eruitziet als een nette tabel, bestaat eigenlijk uit honderden afzonderlijke tekstpositioneringscommando's zonder rijafbakeningen, kolomgrenzen of celverwijzingen. Kopiëren en plakken negeert deze ruimtelijke relaties volledig.

Jaarverslagen maken dit erger, omdat meerregelige rijkoppen zoals "Nettoresultaat toerekenbaar aan gewone aandeelhouders" één rij moeten zijn. Negatieven tussen haakjes zoals $(1.234) zijn drie afzonderlijke gepositioneerde elementen die in aparte cellen worden opgesplitst. Voetnootsuperscripts beschadigen getallen. En vergelijkende kolommen lopen vaak samen.

De Nachtmerrie van Handmatige Extractie

De traditionele aanpak is brute kracht. Een analist opent het jaarverslag, navigeert naar de resultatenrekening en typt handmatig elk getal in een spreadsheet. Daarna de balans. Daarna het kasstroomoverzicht. Daarna de segmentgegevens. Daarna de voetnoten.

Voor één bedrijf duurt dit 30 tot 60 minuten. Maar financiële analyse omvat zelden één bedrijf. Aandelenonderzoekanalisten dekken doorgaans 10 tot 25 bedrijven. Kredietanalisten hebben mogelijk gegevens nodig van 50 of meer leners. Twintig bedrijven à 45 minuten per stuk is 15 uur aan gegevensinvoer per rapportageperiode – 60 uur per jaar alleen al met het kopiëren van getallen uit PDF's.

De foutmarge maakt het erger. Handmatige gegevensinvoer heeft een gedocumenteerde foutmarge van 1 tot 4 procent. Een omzetcijfer van $ 4.521 miljoen, getypt als $ 4.512 miljoen, verstoort uw groeipercentage, margeberekeningen, EV/Omzet-multiple en elke downstream-prognose die ervan afhankelijk is.

Wat Analisten Werkelijk Extraheren

Niet elk getal in een jaarverslag is even belangrijk. Financiële professionals richten zich doorgaans op een specifieke set statistieken, afhankelijk van hun gebruikssituatie. Hier is waar de meeste extractieworkflows zich op richten.

Resultatenrekening Statistieken

Statistiek Waarom het Belangrijk is Waar te Vinden
Omzet / Netto-omzet Groei aan de top, het startpunt voor de meeste waarderingsmodellen Resultatenrekening, eerste regel
Kostprijs van de Omzet (COGS) Berekening van de brutomarge, efficiëntie van de toeleveringsketen Resultatenrekening, onder omzet
Brutowinst Omzet minus COGS, meet de winstgevendheid van de productie Resultatenrekening, berekend
Bedrijfsresultaat (EBIT) Winstgevendheid van de kernactiviteiten vóór rente en belastingen Resultatenrekening, middensectie
EBITDA Winstgevendheid gericht op contanten, gebruikt in EV/EBITDA-multiples Vaak in MD&A of berekend uit resultatenrekening + D&A uit kasstroom
Nettowinst Winst aan de onderkant na alle kosten, belastingen en rente Resultatenrekening, nabij de onderkant
Winst per Aandeel (Basis & Verwaterd) Winstgevendheid per aandeel, drijft P/E-ratio's Resultatenrekening, laatste regels

Balans Statistieken

Statistiek Waarom het Belangrijk is Waar te Vinden
Totale Activa Bedrijfsgrootte, leverageberekeningen Balans, totaal activa-sectie
Totale Passiva Schuldlast, solvabiliteitsbeoordeling Balans, totaal passiva-sectie
Totaal Eigen Vermogen / Aandeelhoudersvermogen Netto waarde, boekwaarde berekeningen Balans, totaal eigen vermogen-sectie
Totale Schuld (Kortlopend + Langlopend) Leverage ratio's, rente-dekking Balans + voetnoten
Liquide Middelen en Equivalenten Liquiditeit, netto schuld berekeningen Balans, eerste kortlopende activa
Kortlopende Activa / Kortlopende Passiva Werkkapitaal, current ratio Balans sectie totalen

Kasstroomoverzicht Statistieken

Statistiek Waarom het Belangrijk is Waar te Vinden
Operationele Kasstroom Contanten gegenereerd door kernactiviteiten Kasstroomoverzicht, eerste sectie
Kapitaaluitgaven Investering in groei, berekening vrije kasstroom Kasstroom uit investeringsactiviteiten
Vrije Kasstroom Beschikbare contanten na onderhoud van operationele activiteiten Operationele kasstroom minus capex
Betaalde Dividenden Rendementen aan aandeelhouders, payout ratio Kasstroom uit financieringsactiviteiten

Afgeleide Ratio's en Marges

Zodra ruwe statistieken zijn geëxtraheerd, berekenen analisten:

  • Brutomarge: Brutowinst / Omzet
  • Operationele Marge: Bedrijfsresultaat / Omzet
  • Nettomarge: Nettowinst / Omzet
  • Return on Equity (ROE): Nettowinst / Aandeelhoudersvermogen
  • Return on Assets (ROA): Nettowinst / Totale Activa
  • Schuld/Eigen Vermogen: Totale Schuld / Totaal Eigen Vermogen
  • Current Ratio: Kortlopende Activa / Kortlopende Passiva
  • Rentabiliteit: EBIT / Rentekosten

Deze ratio's vereisen een schone, nauwkeurige extractie van de onderliggende componenten. Eén verkeerd getal corrumpeert de hele ratio.

Gestructureerde Gegevens Begraven in Ongestructureerde Documenten

De kern technische uitdaging is dat gestructureerde gegevens – getallen met precieze betekenissen en relaties – ingebed zijn in ongestructureerde documenten. Een financieel overzicht is een tabel, maar deze staat in een PDF die ook verhalende paragrafen, juridische disclaimers, afbeeldingen en paginakopteksten bevat.

Dit creëert verschillende extractieproblemen naast eenvoudige tabelherkenning:

  • Contextafhankelijke getallen. Het getal "12.345" betekent verschillende dingen, afhankelijk van waar het verschijnt. In de omzetregel betekent het $ 12.345 miljoen (of duizenden, afhankelijk van de rapportage-eenheid bovenaan de financiële overzichten). In de beloning van leidinggevenden kan het $ 12.345 in werkelijke dollars betekenen. Effectieve extractie vereist begrip van welk gedeelte een getal toebehoort en wat de kolomkoppen en de eenheid van meting aangeven.
  • Geneste en overlappende tabellen. Tabellen in jaarverslagen gebruiken samengevoegde cellen voor sectiekoppen, ingesprongen subitems onder hoofdcategorieën, subtotaalregels afgewisseld met regelitems, meerjarige vergelijkende kolommen en lege scheidingsrijen. Een naïeve extractietool behandelt elk visueel element als een datapunt, wat resulteert in verkeerd uitgelijnde spreadsheets vol met phantom-rijen en samengevoegde waarden.
  • Voetnootverwijzingen. Omzet van "12.345^(1)" wordt "12345 1" wanneer deze wordt geëxtraheerd zonder semantisch begrip. De superscript is een apart gepositioneerd teken in de PDF. Extractietools verwijderen het (waardoor de verwijzing verloren gaat) of nemen het op (waardoor het getal wordt beschadigd).

Hoe AI-extractie Jaarverslagen Verwerkt

AI-gestuurde extractie hanteert een fundamenteel andere aanpak. In plaats van puur te vertrouwen op ruimtelijke analyse – het detecteren van rijen en kolommen op basis van tekenposities – combineert het ruimtelijk bewustzijn met semantisch begrip.

Layout-bewuste tabeldetectie gaat verder dan het zoeken naar rasterlijnen (veel financiële tabellen hebben geen zichtbare randen). Het systeem analyseert tekenafstandspatronen, uitlijning van decimale punten, herhaling van opmaak en koprijen om tabelgrenzen te detecteren. Het kan een verhalende paragraaf die toevallig getallen bevat onderscheiden van een tabel met financiële gegevens met uitgelijnde kolommen.

Semantische veldherkenning identificeert wat elke kolom en rij vertegenwoordigt. Het herkent dat "Omzet", "Netto-omzet", "Totale omzet" en "Netto-omzet" allemaal naar hetzelfde concept verwijzen. Het begrijpt dat "(1.234)" in een financiële context negatief 1.234 betekent, geen voetnootverwijzing. Dit is belangrijk omdat naamgevingsconventies sterk variëren tussen bedrijven – het ene rapporteert "Aandeelhoudersvermogen" terwijl het andere "Eigen vermogen" of "Totaal eigen vermogen" gebruikt.

Meerpagina-tabelvervolgingen worden afgehandeld door herhaalde koptekstpatronen en consistente kolomuitlijning over paginastops heen te herkennen. De resultatenrekening kan beginnen op pagina 84 en doorlopen op pagina 85, en AI-extractie voegt de gegevens samen tot één coherente tabel.

Belangrijke Secties om te Targeten in Jaarverslagen

Niet elke sectie van een jaarverslag bevat extraheerbare financiële gegevens. Weten waar u zich op moet concentreren bespaart tijd en verbetert de nauwkeurigheid.

Financiële Overzichten zijn het primaire extractiedoel: de Geconsolideerde Resultatenrekeningen, Balansen, Kasstromen en Aandeelhoudersvergelijkingen. Deze vier overzichten bevatten de ruwe getallen die financiële modellen aansturen.

Management Discussion and Analysis (MD&A) is waar het management de cijfers uitlegt. Het bevat vaak niet-GAAP-statistieken zoals aangepaste EBITDA en vrije kasstroom, segmentniveau-uitsplitsingen en toekomstgerichte begeleiding – allemaal ingebed in verhalende paragrafen in plaats van tabellen. AI-extractie kan deze cijfers identificeren en ophalen, maar ze vereisen meer contextueel begrip dan tabelgegevens.

Segmentrapportage splitst resultaten uit per bedrijfseenheid, geografie of productlijn. Deze gegevens zijn essentieel voor waardering van de som-van-de-delen. Segmenttabellen hebben vaak niet-standaard structuren met segmentnamen als kolomkoppen en intersegmenteliminaties die negatieve rijen toevoegen.

Toelichtingen op de Financiële Overzichten bevatten de meest gedetailleerde gegevens: schuldschema's met vervaldata, omzetdisaggregatie per product of geografie, leaseverplichtingen, pensioengegevens, reconciliaties van belastingtarieven en goodwill-uitsplitsingen per segment. Dit zijn de moeilijkste om te extraheren omdat ze verhalende tekst combineren met kleine ingebedde tabellen.

Risicofactoren zijn grotendeels kwalitatief, maar bevatten soms kwantitatieve openbaarmakingen: concentratierisicopercentages, juridische reserves of vereisten voor regelkapitaal die begraven zijn in paragrafen met juridische taal.

Jaarverslaggegevens Extraheren met PDFSub

Annual Report Data Extraction Process1Upload Report100–300 pages10-K from SEC EDGAR orinvestor relations page2AI ExtractSemantic parsingAI identifies financialtables, metrics, andnarratives3ReviewBuilt-in cross-checksVerify balance sheetequation and spot-checkvalues4ExportXLSX / CSVDownload to Excel or CSVready for your financialmodelKey Metrics Extracted AutomaticallyRevenueIncome StatementNet IncomeIncome StatementEPS (Diluted)Income StatementEBITDAMD&A SectionTotal AssetsBalance SheetTotal DebtBalance SheetOperating Cash FlowCash Flow StmtFree Cash FlowCalculatedTime SavingsManual extraction45 minAI extraction< 5 minError rate (manual)1–4%Error rate (AI)< 0.5%pdfsub.com

PDFSub biedt twee tools die speciaal geschikt zijn voor de extractie van jaarverslagen: de Tabellen Extraheren tool en de Financieel Rapport Analysator.

Tabellen Extraheren: Financiële Overzichten naar Spreadsheets Halen

De tool Tabellen Extraheren detecteert en extraheert tabulaire gegevens uit PDF-documenten. Voor jaarverslagen betekent dit:

  1. Upload het jaarverslag PDF — Sleep het bestand erin. Voor digitale PDF's gedownload van SEC EDGAR of investor relations-pagina's van bedrijven, vindt initiële verwerking plaats in uw browser. Het bestand verlaat uw apparaat niet, tenzij server-side AI-verwerking nodig is.
  2. Automatische tabeldetectie — De tool identificeert alle tabelregio's in het document, inclusief meerpagina-tabellen die paginastops overspannen.
  3. Geëxtraheerde tabellen beoordelen — Elke gedetecteerde tabel wordt weergegeven met de geëxtraheerde gegevens. U kunt verifiëren dat kolommen correct zijn uitgelijnd en waarden nauwkeurig zijn.
  4. Exporteren naar Excel of CSV — Download de geëxtraheerde tabellen in formaten die klaar zijn voor financiële modellering.

Deze aanpak werkt goed voor de kernfinanciële overzichten (resultatenrekening, balans, kasstroom) waar de gegevens in een duidelijk tabelformaat worden gepresenteerd.

Financieel Rapport Analysator: AI-gestuurde Statistieken Extractie

De Financieel Rapport Analysator gaat verder dan tabel extractie. Het gebruikt AI om het hele document te lezen, de structuur ervan te begrijpen en specifieke financiële statistieken te extraheren – inclusief die ingebed in verhalende tekst of voetnoten.

Voor jaarverslagen kan de analysator:

  • Belangrijke financiële statistieken identificeren en extraheren uit alle secties van het document
  • Niet-GAAP-statistieken uit de MD&A-sectie halen
  • Segmentgegevens uit rapportagetabellen extraheren
  • Verschillende naamgevingsconventies voor dezelfde statistiek herkennen en verwerken
  • Context bieden voor geëxtraheerde getallen, inclusief de rapportageperiode en meeteenheid

Beide Tools Combineren

De meest effectieve workflow voor jaarverslagen combineert beide benaderingen:

  1. Gebruik Tabellen Extraheren om de gestructureerde financiële overzichten (resultatenrekening, balans, kasstroom) met volledige tabelgetrouwheid naar Excel te halen.
  2. Gebruik Financieel Rapport Analysator om specifieke statistieken uit verhalende secties, voetnoten en niet-standaard tabellen te extraheren.
  3. Kruisverwijs de resultaten om de nauwkeurigheid te verifiëren.

Beide tools zijn beschikbaar met de 7-daagse gratis proefperiode van PDFSub, zodat u ze kunt testen met uw eigen jaarverslagen voordat u zich vastlegt.

Exporteren naar Excel en CSV voor Financiële Modellering

Extractie is alleen nuttig als de uitvoer in uw workflow past. Geëxtraheerde tabellen worden geëxporteerd als .xlsx-bestanden met correct getype numerieke cellen, behouden kolomuitlijning, aparte werkbladen voor elke tabel en schone kopteksten. Voor analisten die de voorkeur geven aan CSV (gebruikelijk voor databases en scripttools), krijgt u komma-gescheiden uitvoer met UTF-8-codering en één bestand per geëxtraheerde tabel.

Een typische workflow na extractie: extraheer de resultatenrekening, balans en kasstroomoverzicht; importeer de drie tabellen in uw modeltemplate; map veldnamen naar uw gestandaardiseerde rijlabels; verifieer dat totalen overeenkomen; bereken afgeleide ratio's; en bouw tijdreeksen door herhaling voor eerdere jaarverslagen. Dit vervangt handmatig typen en vermindert de end-to-end tijd van 45 minuten naar minder dan 5 minuten per bedrijf.

Gebruiksscenario's: Wie Extraheert Jaarverslaggegevens

Aandelenonderzoek. Analisten bouwen financiële modellen met 5 tot 10 jaar historische gegevens en 3 tot 5 jaar prognoses. Een coverage universe van 15 bedrijven betekent het extraheren van gegevens uit 15 jaarverslagen en 60 kwartaalverslagen per jaar. Geautomatiseerde extractie transformeert dit van een meerdaagse gegevensinvoer-oefening naar een taak van dezelfde dag.

Kredietanalyse. Kredietanalisten evalueren de kredietwaardigheid van leners met behulp van Schuld/EBITDA (leverage), EBITDA/Rentekosten (dekking), Current Ratio (liquiditeit) en Schuld/Totale Kapitalisatie (kapitaalstructuur). Het leningenportfolio van een commerciële bank kan honderden leners bevatten, die elk jaarlijkse financiële overzichten indienen waaruit deze statistieken moeten worden geëxtraheerd.

Benchmarking en concurrentieanalyse. Het vergelijken van een bedrijf met zijn concurrenten vereist het extraheren van dezelfde statistieken uit 5 tot 15 jaarverslagen, genormaliseerd voor verschillende fiscale jaareinden, rapportage-eenheden en boekhoudkundige standaarden (US GAAP vs. IFRS).

Portfoliomonitoring. Investeringsmanagers die 30 tot 100 posities volgen, extraheren elk kwartaal een standaardset monitoringstatistieken: omzetgroei, EBITDA-margedtrend, netto schuld/EBITDA, vrije kasstroomrendement en rendement op geïnvesteerd kapitaal. Geautomatiseerde extractie maakt dit mogelijk op schaal.

Meerjarige Extractie: Tijdreeksgegevens Opbouwen

Financiële analyse gaat fundamenteel over trends: versnelt de omzet? Breiden de marges uit? Vermindert het bedrijf zijn schulden? Het beantwoorden van deze vragen vereist tijdreeksgegevens die ten minste drie tot vijf jaar overspannen.

Benadering 1: Extraheren uit Elk Jaarverslag

Jaarverslagen presenteren doorgaans twee jaar aan resultatenrekeninggegevens (huidig jaar en vorig jaar) en twee jaar aan balansgegevens. Sommige bevatten vergelijkende resultatenrekeningen van drie jaar.

Om een tijdreeks van vijf jaar op te bouwen, moet u uit drie jaarverslagen extraheren:

  • Jaarverslag 2025: Bevat gegevens van 2025 en 2024
  • Jaarverslag 2023: Bevat gegevens van 2023 en 2022
  • Jaarverslag 2021: Bevat gegevens van 2021 en 2020

Dit geeft u overlappende jaren (2024 verschijnt in zowel het jaarverslag van 2025 als dat van 2024) die dienen als kruiscontrole.

Benadering 2: Gebruik de Geselecteerde Financiële Gegevens van de 10-K

Sommige bedrijven nemen een tabel "Geselecteerde Financiële Gegevens" op die vijf tot tien jaar aan belangrijke statistieken in één tabel presenteert. Indien beschikbaar, is dit de snelste weg naar een meerjarige tijdreeks. De SEC heeft de vereiste voor deze tabel echter in 2021 afgeschaft en veel bedrijven hebben deze sindsdien laten vallen.

Benadering 3: Extraheren uit SEC EDGAR XBRL-gegevens

Voor Amerikaanse beursgenoteerde bedrijven bevatten SEC-aangiften XBRL-getagde gegevens die machineleesbaar zijn zonder PDF-extractie. Het EDGAR-systeem van de SEC biedt RESTful API's die JSON-geformatteerde gegevens leveren voor gestandaardiseerde regelitems. XBRL heeft echter beperkingen: aangepaste regelitems worden mogelijk niet consistent getagd, niet-GAAP-statistieken zijn zelden beschikbaar, segmentgegevens kunnen ontbreken en de presentatievolgorde komt mogelijk niet overeen met de oorspronkelijke indiening. PDF-extractie blijft de meest betrouwbare bron voor volledige, presentatie-consistente financiële gegevens.

De Tijdreeks Spreadsheet Opbouwen

Zodra u meerdere jaren aan geëxtraheerde gegevens heeft, maakt u een master-spreadsheet met jaren als kolommen en statistieken als rijen. Importeer de gegevens van elk jaar, verifieer dat overlappende jaren overeenkomen tussen de rapporten, voeg berekende rijen toe voor groeipercentages en ratio's, en markeer eventuele herzieningen die de vergelijkbaarheid doorbreken.

Kwaliteitscontroles: Geëxtraheerde Gegevens Verifiëren

Geautomatiseerde extractie is snel, maar u moet altijd de uitvoer verifiëren. Jaarverslagen bevatten ingebouwde kruiscontroles die verificatie eenvoudig maken.

De Balansvergelijking

De meest fundamentele controle: Totale Activa = Totale Passiva + Totaal Aandeelhoudersvermogen.

Als deze vergelijking niet klopt in uw geëxtraheerde gegevens, is er iets misgegaan. Een getal is verkeerd gelezen, een rij is overgeslagen of kolommen zijn verkeerd uitgelijnd. Deze enkele controle vangt een groot percentage van de extractiefouten.

Resultatenrekening Stroom

Omzet minus alle kosten moet gelijk zijn aan de nettowinst. Verifieer de rekenkunde:

Omzet
- Kostprijs van de Omzet
= Brutowinst
- Operationele Kosten
= Bedrijfsresultaat
- Rentekosten
+ Rente-inkomsten
- Belastingvoorziening
= Nettowinst

Als de subtotaalregels niet kloppen, onderzoek dan welke regelitems zijn gemist of verkeerd zijn geëxtraheerd.

Kasstroom Reconciliatie

Het kasstroomoverzicht begint met de nettowinst en eindigt met de verandering in contanten. Die eindverandering moet overeenkomen met het verschil tussen de begin- en eindkas op de balans.

Begin Kasaldo (van balans)
+ Netto Verandering in Kas (van kasstroomoverzicht)
= Eind Kasaldo (van balans)

Redelijkheid en Steekproeven

Scan geëxtraheerde gegevens op onmogelijke waarden: omzet die meer dan 50% jaar-op-jaar verandert, negatieve totale activa, winst per aandeel die niet overeenkomt met de nettowinst gedeeld door het uitstaande aantal aandelen, of marges buiten de sectornormen (een nettowinstmarge van 90% in de productie suggereert een decimale fout). Kies vervolgens drie tot vijf getallen willekeurig, ga terug naar de originele PDF en verifieer dat ze overeenkomen. Dit duurt 30 seconden en vangt systematische fouten op, zoals het extraheren van gegevens uit de verkeerde kolom.

Tips voor Betere Extractieresultaten

Gebruik digitale jaarverslagen, geen gescande kopieën. Digitale PDF's extraheren veel nauwkeuriger dan gescande documenten. Download voor Amerikaanse beursgenoteerde bedrijven altijd van SEC EDGAR (aangiften zijn per definitie digitaal) of van de investor relations-pagina's van bedrijven. Vermijd afgedrukte verslagen die terug zijn gescand naar PDF en "glanzende" jaarverslagen met veel afbeeldingen, ontworpen voor marketing.

Gebruik de 10-K, niet het Jaarverslag voor Aandeelhouders. Beursgenoteerde bedrijven produceren vaak zowel een 10-K-aangifte (gestandaardiseerde financiële overzichten) als een Jaarverslag voor Aandeelhouders (marketingdocument met glanzende foto's). De 10-K heeft een gestandaardiseerde GAAP-presentatie, consistente tabelopmaak, volledige voetnoten en is altijd beschikbaar als digitale PDF van EDGAR.

Identificeer de rapportage-eenheid vóór extractie. Bovenaan elk financieel overzicht staat een opmerking zoals "in miljoenen, exclusief bedragen per aandeel" of "in duizenden". Als u dit mist, kan een omzetcijfer van "45.231" $ 45,2 miljard of $ 45,2 miljoen betekenen. Controleer altijd en pas de juiste vermenigvuldiger toe.

Houd rekening met verschillen in fiscale jaren. Niet alle bedrijven gebruiken een kalenderfiscaal jaar. Apple eindigt in september, Walmart in januari, Microsoft in juni. De einddatum van het fiscale jaar staat bovenaan elk financieel overzicht.

Let op herzieningen. Wanneer een bedrijf cijfers van voorgaande jaren herzien, verschijnen de herziene cijfers in het jaarverslag van het huidige jaar. De gegevens van 2024 in het verslag van 2025 kunnen afwijken van de gegevens van 2024 in het verslag van 2024. Gebruik altijd de meest recent herziene cijfers bij het opbouwen van tijdreeksen.

Aan de Slag

De extractie van jaarverslagen hoeft geen handmatig, foutgevoelig proces te zijn. De praktische workflow: download de 10-K van SEC EDGAR, upload deze naar de Tabellen Extraheren tool of Financieel Rapport Analysator van PDFSub, beoordeel de uitvoer, exporteer naar Excel of CSV, voer de kwaliteitscontroles uit zoals hierboven beschreven, en importeer de geverifieerde gegevens in uw financiële model.

PDFSub biedt een 7-daagse gratis proefperiode zodat u de extractietools kunt testen met uw eigen jaarverslagen. Probeer het met een 10-K die u eerder handmatig hebt geëxtraheerd en vergelijk de resultaten – zowel de nauwkeurigheid als de tijdsbesparing.

Voor financiële professionals die regelmatig jaarverslagen verwerken, is geautomatiseerde extractie een concurrentievoordeel. De analist die 5 minuten besteedt aan het extraheren van gegevens en 55 minuten aan analyse, zal consequent beter presteren dan de analist die 55 minuten besteedt aan extractie en 5 minuten aan analyse.

Terug naar blog

Vragen? Neem contact op

PDFSub

Alle PDF- en documenttools die u nodig heeft op één plek. Snel, veilig en privé.

GDPR-conformCCPA-conformSOC 2 Ready
Powered by PDFSub Engine

PDF Tools

  • PDF's samenvoegen
  • PDF splitsen
  • Pagina's herschikken
  • PDF draaien
  • Pagina's verwijderen
  • Pagina's extraheren
  • Watermerk toevoegen
  • PDF bewerken
  • PDF stempelen
  • PDF-formulier invullen
  • Pagina's bijsnijden
  • Paginaformaat wijzigen
  • Paginanummers toevoegen
  • Kop- en voetteksten
  • PDF comprimeren
  • Doorzoekbaar maken
  • Clean Scanned PDF
  • Photo to Document
  • Auto-Crop PDF
  • PDF repareren
  • Metadata bewerken
  • Metadata verwijderen
  • PDF naar Word
  • Word naar PDF
  • Excel naar PDF
  • PDF naar PowerPoint
  • PDF naar afbeelding
  • Afbeelding naar PDF
  • HTML naar PDF
  • HEIC naar afbeelding
  • WEBP naar JPG
  • WEBP naar PNG
  • PowerPoint naar PDF
  • PDF naar HTML
  • EPUB naar PDF
  • TIFF naar PDF
  • PNG naar PDF
  • PDF naar PNG
  • Tekst naar PDF
  • SVG naar PDF
  • WEBP naar PDF
  • PDF naar EPUB
  • RTF naar PDF
  • ODT naar PDF
  • ODS naar PDF
  • PDF naar ODT
  • PDF naar ODS
  • PDF naar SVG
  • PDF naar RTF
  • PDF naar tekst
  • ODP naar PDF
  • PDF naar ODP
  • ODG naar PDF
  • PDF-viewer
  • PDF/A-conversie
  • PDF maken
  • Batch-conversie
  • Pagina's per vel
  • Beveiligen met wachtwoord
  • PDF ontgrendelen
  • PDF redigeren
  • PDF elektronisch ondertekenen
  • PDF's vergelijken
  • Tabellen extraheren
  • PDF to Excel
  • Bankafschrift-converter
  • Factuur-extractor
  • Bonnetjes-scanner
  • Financieel rapport
  • OCR - Tekst extraheren
  • Handgeschreven tekst converteren
  • PDF samenvatten
  • PDF vertalen
  • Chatten met PDF
  • Gegevens extraheren
  • Design Studio

Product

  • Privacy & Security
  • Alle tools
  • Functies
  • Bankafschriften
  • Prijzen
  • FAQ
  • Blog

Support

  • Helpcentrum
  • Contact
  • FAQ

Juridisch

  • Privacybeleid
  • Algemene voorwaarden
  • Cookiebeleid

© 2026 PDFSub. Alle rechten voorbehouden.

Gemaakt in Amerika met voor mensen over de hele wereld