PDFSub
PreusAPIMergeCompressEditE-SignExtractes bancarisBlog
Tornar al blog
GuiaTècnicExcelCSVQBOOFX

Comprendre els formats de extractes bancaris: La guia tècnica

16 de maig del 2026
T
Todd Lahman
Founder, PDFSub

El PDF no és un format de dades, és un format de visualització. Per això, extreure dades de transaccions dels extractes bancaris és sorprenentment difícil. Aquesta guia explica què hi ha dins d'un extracte bancari en PDF, els formats de sortida disponibles (Excel, CSV, QBO, OFX, QFX, JSON) i com triar el correcte.


Understanding Bank Statement Formats: The Technical Guide

Un extracte bancari en PDF sembla senzill: dates, descripcions, imports, saldos en columnes ordenades. Però darrere d'aquesta aparença hi ha un format de document (PDF) que mai va ser dissenyat per emmagatzemar dades estructurades, i un procés de conversió que requereix comprendre tant el format d'entrada com els molts formats de sortida disponibles.

Aquesta guia cobreix les 12 seccions que apareixen en cada extracte bancari (independentment del banc), la realitat tècnica dels extractes bancaris en PDF, les variacions de disseny entre bancs, tots els formats de sortida que trobareu (Excel, CSV, QBO, OFX, QFX, QIF, JSON), les diferències de formatació internacional i els estàndards de la indústria que governen l'intercanvi de dades financeres.


Anatomia d'un Extracte Bancari

Cada extracte bancari - Chase, Bank of America, Wells Fargo, HSBC, Deutsche Bank, el que vulguis - està construït a partir de les mateixes 12 seccions. Les etiquetes canvien ("Sostraccions" vs "Retirades"), les disposicions de columnes varien, però l'estructura subjacent és coherent. Un cop puguis identificar aquestes seccions, cada extracte et semblarà familiar.

Anatomy of a bank statement: 12 labeled sections every statement contains

Vols utilitzar aquesta infografia al teu blog? Copia aquest codi d'incrustació:

Per a anàlisis profundes específiques de cada banc, que cobreixen exactament com cada banc important dissenya aquestes 12 seccions, vegeu:

  • Extracte bancari de Chase explicat
  • Extracte bancari de Bank of America explicat
  • Extracte bancari de Wells Fargo explicat
  • Extracte bancari de Citi explicat

Per què el PDF no és un Format de Dades

PDF significa Portable Document Format, estandarditzat com a ISO 32000 (la versió 2.0 es va convertir en ISO 32000-2:2020). Va ser dissenyat amb un propòsit: fer que els documents tinguin un aspecte idèntic a cada pantalla i impressora. Això és genial per a la fidelitat visual, i terrible per a l'extracció de dades.

Què hi ha realment dins d'un PDF d'Extracte Bancari

Dins de cada pàgina PDF hi ha un flux de contingut (content stream) - una seqüència d'operadors de dibuix escrits en un llenguatge similar a PostScript. El text es renderitza utilitzant operadors específics:

  • BT / ET - Begin Text / End Text: límits d'un objecte de text
  • Tf - Establir font i mida
  • Td / Tm - Moure la posició del text o establir la matriu de transformació de text completa
  • Tj - Mostrar una cadena de text
  • TJ - Mostrar text amb ajustos de posicionament de glifs individuals (kerning)

La clau per entendre-ho: no hi ha el concepte de "taula", "fila" o "columna" a la especificació PDF. El que sembla una taula de transaccions ben formatada són en realitat desenes de fragments de text col·locats a coordenades x,y específiques de la pàgina. L'eina d'extracció ha de:

  1. Analitzar els operadors del flux de contingut
  2. Resoldre les codificacions de font per mapejar índexs de glifs a caràcters Unicode
  3. Utilitzar la matriu de text (Tm/Td) per determinar la posició x,y de cada caràcter
  4. Reconstruir paraules, línies i columnes a partir d'aquestes coordenades

Una columna que sembla perfectament alineada podria estar a x=72.0 en una línia i a x=72.5 en la següent. L'algoritme d'extracció ha de definir els límits de la columna amb tolerància per a aquestes variacions subpíxel.

PDFs Etiquetats vs. No Etiquetats

Els PDFs Etiquetats inclouen un arbre de estructura lògica ocult (similar a les etiquetes HTML) que marca el contingut com a títols, paràgrafs, taules, files de taula i cel·les de taula. Això fa que l'extracció sigui significativament més fàcil.

Els PDFs No Etiquetats no tenen metadades estructurals; l'eina d'extracció només rep dades de posicionament brutes i ha d'inferir-ho tot.

La majoria dels extractes bancaris generats per bancs són no etiquetats. Els bancs generen extractes utilitzant sistemes de processament per lots (Oracle BI Publisher, SAP Crystal Reports, o pipelines personalitzats de impressió a PDF). Les regulacions d'accessibilitat (ADA/WCAG) estan impulsant els bancs cap a PDFs etiquetats, però l'adopció és lenta. Les descàrregues estàndard de la majoria de bancs importants segueixen sent no etiquetades.


Variacions de Disseny dels Extractes Bancaris

No hi ha un estàndard de la indústria sobre com els bancs formategen els seus extractes en PDF. Les mateixes cinc peces d'informació - data, descripció, dèbit, crèdit, saldo - estan organitzades de manera diferent per cada banc.

Columna d'Import Únic (Signat)

Data Descripció Import Saldo
15/01/26 DIRECT DEP PAYROLL +3.500,00 5.200,00
16/01/26 POS PURCHASE GROCERY -87,50 5.112,50

Els dèbits són negatius, els crèdits positius (o viceversa). Comú en bancs més petits, cooperatives de crèdit i bancs digitals. Més fàcil d'analitzar perquè només hi ha una columna d'import per extreure.

Columnes Separades de Dèbit/Crèdit

Data Descripció Retirades  Dipòsits Saldo
15/01/26 DIRECT DEP PAYROLL 3.500,00 5.200,00
16/01/26 POS PURCHASE GROCERY 87,50 5.112,50

Utilitzat per Chase, Bank of America i molts bancs tradicionals. L'eina d'extracció ha d'identificar quina columna conté l'import i determinar el signe corresponent.

Agrupats per Tipus de Transacció

Els comptes empresarials i comercials sovint agrupen les transaccions:

Dipòsits i Altres Crèdits 15/01  Transferència Rebut REF#12345 10.000,00 18/01  Dipòsit Xec #4567 2.500,00 Total Dipòsits 12.500,00
 
Xecs Pagats 16/01  Xec #1234 850,00 17/01  Xec #1235 1.200,00 Total Xecs Pagats 2.050,00
 
Transaccions Electròniques 19/01  Pagament ACH - Empresa Venedora 3.200,00 20/01  Transferència Online a Estalvis 1.000,00 Total Electròniques 4.200,00

Els encapçalaments de secció determinen si les transaccions són dèbits o crèdits. Les línies de resum ("Total Dipòsits") s'han d'identificar i excloure de les dades de transacció.

Característiques Específiques del Banc

  • Chase - Columnes separades de dèbit/crèdit; agrupa per "DIPÒSITS I ADDICIONS" i "PAGAMENTS ELECTRÒNICS" i "COMISSIONS"; descripcions de diverses línies comunes per a detalls del comerç.
  • Bank of America - Columnes separades de retirada/dipòsit; inclou una secció de "Saldo Diari" al final; extens capçalera amb número de compte, període de l'extracte, número de ruta.
  • Wells Fargo - Columnes separades; inclou la secció "RESUM DEL SALDO DIARI"; anomena la seva descàrrega CSV "Comma Delimited".
  • Capital One - Disseny net d'import únic per a targetes de consum; informació mínima al capçalera.
  • Citi - Sovint inclou detalls de transaccions internacionals amb imports en moneda original i tipus de canvi en línies separades.

Variacions en la Disposició de Columnes

Més enllà de la qüestió del dèbit/crèdit, l'ordre de les columnes no està estandarditzat:

  • Ordre de columnes: Data-Descripció-Import-Saldo vs. Data-Import-Descripció-Saldo
  • Número de xec: Present en comptes empresarials, absent en personals.
  • Número de referència: Comú en extractes empresarials, rar en personals.
  • Saldo acumulat: Per transacció (més comú) vs. subtotals diaris vs. absent completament.

PDFs Digitals vs. Escanejats

El factor més important que afecta la precisió de la conversió és si el vostre PDF és digital o escanejat.

PDFs Digitals (Natius)

Creades programàticament pel sistema del vostre banc quan descarregueu un extracte. El text s'emmagatzema com a operadors de flux de contingut amb codificacions de font.

  • Precisió: 99%+ per a l'extracció de text - sense errors de reconeixement.
  • Velocitat: Mil·lisegons per pàgina.
  • Privacitat: Es pot processar completament al vostre navegador; el fitxer mai surt del vostre dispositiu.
  • Mida del fitxer: Típicament 50KB–500KB per pàgina.
  • Com identificar: Podeu seleccionar i ressaltar paraules individuals.

PDFs Escanejades

Imatges d'extractes en paper; creades escanejant o fotografiant un document físic. El contingut s'emmagatzema com a imatges rasteritzades (JPEG, JPEG2000, CCITT o comprimides amb Flate).

  • Precisió: 95–99% amb OCR professional; 65–70% amb OCR genèric.
  • Velocitat: Segons per pàgina (requereix processament d'imatges).
  • Privacitat: Típicament requereix processament al servidor (el fitxer s'ha d'enviar per a OCR).
  • Mida del fitxer: 200KB–2MB+ per pàgina.
  • Com identificar: No podeu seleccionar cap text; si feu un zoom al 400% es veu pixelat.

Per què la Precisió de l'Escaneig és Més Important per a Dades Financeres

Una taxa d'exactitud del 97% de caràcters sona excel·lent fins que l'apliqueu a dades financeres. En un extracte amb 1.000 caràcters d'imports, això són 30 caràcters mal llegits. Un sol dígit mal llegit canvia un import de transacció: "1.234,56 €" es converteix en "1.234,86 €" o "7.234,56 €". L'OCR avançat aconsegueix una precisió propera al 99%, però els errors restants cauen desproporcionadament en caràcters que s'assemblen: 0/O, 1/l/I, 5/S, 8/B, 6/G, i críticament, la coma/el punt.

Preferiu sempre les descàrregues digitals. Descarregueu els extractes del lloc web del vostre banc en lloc d'escanejar paper. Això elimina completament els errors d'OCR.


Formats de Sortida: Anàlisi Profunda

Bank Statement Output Formats Compared - Excel, CSV, QBO, OFX, QFX, JSON

Quan convertiu un extracte bancari, trieu un format de sortida. Cada format té diferents punts forts, limitacions i casos d'ús ideals.

Excel (.xlsx)

Estàndard: Office Open XML (OOXML), estandarditzat com a ECMA-376 i ISO/IEC 29500.

Què és: Un fitxer .xlsx és en realitat un arxiu ZIP que conté fitxers XML: estructura del llibre de treball, dades de cel·les, estils i cadenes compartides. Per això pot emmagatzemar tipus de dades (dates com a dates, números com a números), formatació, fórmules i múltiples fulls.

Per què és popular per als extractes bancaris:

  • Les dates segueixen sent dates (ordenables, filtrables).
  • Els números segueixen sent números (sumables, formattables).
  • Fórmules per a la conciliació (SUM, VLOOKUP).
  • Taules dinàmiques per a la categorització de despeses.
  • Format condicional per ressaltar discrepàncies.
  • Compartir amb clients que necessiten un full de càlcul llegible.

Limitacions:

  • Màxim 1.048.576 files (rarament rellevant per als extractes bancaris).
  • No es pot importar directament a la majoria de programari de comptabilitat (utilitzeu QBO/OFX en el seu lloc).
  • Requereix Excel, Google Sheets o LibreOffice Calc per obrir.

Millor per a: Revisió manual, anàlisi personalitzada, conciliació, arxivament, informes a clients.

CSV (Valors Separats per Coma)

Estàndard: RFC 4180 (2005) - "Common Format and MIME Type for Comma-Separated Values."

Regles bàsiques:

  • Registres delimitats per CRLF (retorn de carro + salt de línia).
  • Camps separats per comes.
  • Els camps que contenen comes, cometes o salts de línia s'han d'envoltar amb cometes dobles.
  • Les cometes dobles dins dels camps s'escapen duplicant-les.

Variacions de delimitador a la pràctica:

  • Coma (,) - Estàndard, utilitzat a EUA/Regne Unit.
  • Punt i coma (;) - Utilitzat en països on la coma és el separador decimal (França, Alemanya, Itàlia, Espanya, Brasil).
  • Tabulació (\t) - Format TSV, evita conflictes de delimitadors.

Problemes d'codificació:

  • UTF-8 és recomanat per a la interoperabilitat.
  • UTF-8 BOM (Byte Order Mark): No requerit per l'estàndard, però Excel a Windows el requereix per mostrar correctament caràcters no ASCII (lletres accentuades, símbols de moneda). Sense BOM, Excel pot interpretar UTF-8 com a Windows-1252, corrompent caràcters.
  • Excel utilitza punts i comes en lloc de comes com a separadors de camp en configuracions regionals europees.

Limitacions:

  • Sense tipus de dades; tot és text (els números amb zeros inicials es corrompen, els números de compte llargs es converteixen en notació científica).
  • Sense suport de múltiples fulls.
  • Sense formatació ni fórmules.
  • Sense metadades (sense informació del compte, sense IDs de detecció de duplicats).

Millor per a: Màxima compatibilitat; gairebé tots els programes de comptabilitat, bases de dades i fulls de càlcul poden importar CSV. Fallback universal quan QBO/OFX no està disponible.

QBO (QuickBooks Web Connect)

Què és: El format d'importació per a QuickBooks (tant Desktop com Online). Els fitxers QBO es basen en l'especificació OFX amb extensions específiques de QuickBooks.

Aclariment important: ".QBO" NO significa "QuickBooks Online"; significa format QuickBooks Web Connect i funciona tant amb QuickBooks Desktop com amb QuickBooks Online.

Camps requerits per transacció:

  • TRNTYPE - Tipus de transacció (DEBIT, CREDIT, CHECK, DEP, DIRECTDEP, DIRECTDEBIT, ATM, POS, XFER, PAYMENT, FEE, SRVCHG, INT, OTHER).
  • DTPOSTED - Data en format YYYYMMDD.
  • TRNAMT - Import (negatiu per dèbits).
  • FITID - ID de Transacció de la Institució Financera.
  • NAME - Pagador/descripció.

Per què FITID és important: QuickBooks fa un seguiment de cada FITID importat mai per a cada compte. Si una transacció amb el mateix FITID s'importa de nou, QuickBooks la salta silenciosament, evitant entrades duplicades quan els usuaris reimporten períodes d'extracte superposats. Aquesta detecció automàtica de duplicats és l'avantatge més gran de QBO sobre CSV.

Dades addicionals: QBO també transporta l'ID del compte, l'ID del banc (número de ruta), la moneda, el número de xec, el memo i el saldo final; el conjunt de dades més ric de qualsevol format d'importació per a QuickBooks.

Millor per a: Usuaris de QuickBooks (Desktop i Online). Ofereix l'experiència d'importació més rica amb detecció automàtica de duplicats i classificació del tipus de transacció.

OFX (Open Financial Exchange)

Història: Creat per Microsoft, Intuit i CheckFree. Versió 1.0 publicada el febrer de 1997.

Evolució de la versió:

  • OFX 1.0–1.6 (1997–1999): Sintaxi basada en SGML (no es requereixen etiquetes de tancament).
  • OFX 2.0+ (2000–actualitat): Basat en XML (etiquetes de tancament correctes, XML ben formatat).

Molts bancs encara produeixen OFX 1.x (SGML) per a la màxima compatibilitat.

Governança actual: El 2019, el consorci OFX es va fusionar al consorci Financial Data Exchange (FDX), que ara gestiona l'especificació. FDX té més de 200 organitzacions membres i 76 milions de comptes de consumidors.

Per què OFX és l'estàndard universal: OFX és el mateix format que s'utilitza quan connecteu el vostre compte bancari directament a un programari de comptabilitat mitjançant feeds bancaris; el mateix format funciona per a les importacions de fitxers.

Millor per a usuaris de Xero: Xero importa automàticament fitxers OFX sense requerir mapeig manual de columnes. Pujar el fitxer i les transaccions apareixen immediatament amb dates, imports i descripcions correctes. També funciona amb Wave, Sage, FreshBooks i la majoria de programari de comptabilitat.

QFX (Quicken Financial Exchange)

Què és: La variant propietària d'OFX d'Intuit, utilitzada exclusivament amb Quicken. Un fitxer QFX és un fitxer OFX estàndard amb camps propietaris addicionals.

Camp propietari clau: INTU.BID - Identificador Bancari de Quicken. Aquest ID numèric es mapeja a un banc a la base de dades interna de Quicken. Sense ell, Quicken es nega a importar el fitxer.

Diferències amb OFX estàndard:

  • Requereix INTU.BID al capçalera.
  • Pot incloure altres camps prefixats amb INTU.*
  • Les institucions financeres paguen una tarifa de llicència a Intuit per proporcionar descàrregues QFX.
  • Quicken no importarà fitxers OFX estàndard sense el camp INTU.BID.

Millor per a: Usuaris del programari de finances personals Quicken. Format requerit; cap alternativa funciona.

QIF (Quicken Interchange Format)

Què és: Un format antic de text pla originalment desenvolupat per Intuit per a Quicken. Parells clau-valor, un per línia, amb etiquetes d'un sol caràcter: D per data, T per import, P per pagador, L per categoria, M per memo, N per número de xec, ^ per final de registre.

Per què va ser reemplaçat: QIF no té un mecanisme de detecció de duplicats (sense equivalent a FITID), no té camps d'identificació de compte, ni informació de ruta bancària, ni dades de saldo, i format de data inconsistent entre implementacions.

Encara rellevant: Alguns programaris de comptabilitat (Xero, Sage, GnuCash) encara accepten importacions QIF. Útil per a migracions de sistemes antics.

JSON (JavaScript Object Notation)

Estat actual: JSON encara no és un estàndard per als fitxers d'extractes bancaris, però s'utilitza cada cop més en:

  • APIs d'Open Banking (UK Open Banking Standard, PSD2 Berlin Group).
  • FDX API (Financial Data Exchange - successor d'OFX, més de 200 organitzacions membres).
  • Plaid, Yodlee, MX i altres APIs d'agregadors de dades.
  • Fluxos de treball de desenvolupadors i automatització.

Adopció creixent: Les regulacions d'Open Banking (PSD2 a Europa, Secció 1033 del CFPB als EUA) estan accelerant l'adopció d'APIs JSON. La FDX API utilitza JSON/REST amb OAuth 2.0, representant la direcció futura de l'intercanvi de dades financeres.

Millor per a: Desenvolupadors que construeixen fluxos de treball automatitzats, integracions fintech, taulers personalitzats i integracions d'APIs d'Open Banking.


Comparació de Formats a Cop d'Ull

Format Tipus de Dades Detecció de Duplicats Info del Compte Suport Programari Comptable Millor per a
Excel Sí No No Limitada Revisió manual, anàlisi
CSV No No No Universal Màxima compatibilitat
QBO Sí Sí (FITID) Sí QuickBooks Usuaris de QuickBooks
OFX Sí Sí (FITID) Sí La majoria de programari Xero, Wave, Sage
QFX Sí Sí (FITID) Sí Només Quicken Usuaris de Quicken
QIF Parcial No No Alguns antics Migracions antigues
JSON Sí Personalitzat Sí Basat en API Desenvolupadors, automatització

Compatibilitat amb Programari de Comptabilitat

Quin format accepta el vostre programari de comptabilitat?

Programari QBO OFX QFX QIF CSV Millor Elecció
QuickBooks Online Sí Sí Sí No Sí QBO
QuickBooks Desktop Sí Sí Sí No Sí QBO
Quicken No No Sí Sí No QFX
Xero Sí Sí Sí Sí Sí OFX
Sage No Sí No Sí Sí OFX
Wave No Sí Yes No Yes OFX
FreshBooks No No No No Yes CSV
Zoho Books No Yes No Yes Yes OFX
GnuCash No Yes No Yes Yes OFX

Regla general: Utilitzeu QBO per a QuickBooks, QFX per a Quicken, OFX per a la resta, i CSV com a fallback universal.


Diferències de Format Internacionals

Si treballeu amb extractes bancaris internacionals, trobareu diferències de format que fan fallar la majoria d'eines de conversió.

Formats de Data

Regió Format Exemple Notes
Estats Units MM/DD/AAAA 15/03/2026 Mes primer
Europa, Amèrica Llatina DD/MM/AAAA 15/03/2026 Dia primer
Alemanya DD.MM.AAAA 15.03.2026 Separador de punt
Japó AAAA年MM月DD日 2026年03月01日 Any primer amb kanji
Xina AAAA年MM月DD日 2026年3月1日 Similar al Japó
ISO 8601 AAAA-MM-DD 2026-03-15 Estàndard internacional inequívoc

El problema de l'ambigüitat: "03/04/2026" és el 3 de març als EUA però el 4 d'abril a Europa. Quan totes les dates d'un extracte tenen valors de dia de 12 o menys, no hi ha manera algorítmica de determinar el format correcte sense conèixer el país d'origen. Les eines de conversió han d'escanejar totes les dates de l'extracte, buscant valors superiors a 12 per determinar el format.

Formats de Número

Regió Mil i Cincanta Cents Notes
EUA, Regne Unit, Austràlia, Japó 1.000,50 Coma per a milers, punt per a decimals
Alemanya, França, Espanya, Brasil, Itàlia 1.000,50 Punt per a milers, coma per a decimals
Suïssa 1'000.50 Apòstrof per a milers
Índia 1,00,000.50 Sistema de agrupació Lakh
Escandinàvia 1 000,50 Espai per a milers, coma per a decimals

"10.000,45" d'un banc europeu significa deu mil i quaranta-cinc cèntims, no deu punt zero zero zero quatre cinc. Equivocar-se en això produeix errors de magnitud 10.000x.

Col·locació del Símbol de Divisa

  • EUA/Regne Unit: Símbol abans de l'import: $1.234,56 / £1.234,56
  • França, Alemanya, Espanya: Símbol després de l'import: 1.234,56 €
  • Irlanda, Països Baixos: Símbol abans: €1.234,56
  • Japó: Símbol abans: ¥123.456

Codificacions de Caràcters

  • UTF-8 - Estàndard universal, suporta tots els scripts.
  • GBK/GB2312 - Xinès Simplificat (utilitzat per bancs xinesos).
  • Shift_JIS - Japonès (utilitzat per bancs japonesos).
  • Big5 - Xinès Tradicional (Taiwan, Hong Kong).
  • EUC-KR - Coreà.
  • ISO 8859-1 - Europeu Occidental.
  • Windows-1252 - Europeu Occidental (antic).
  • Windows-1256 - Àrab.

Obrir un extracte bancari xinès o japonès en un sistema dels EUA sense la detecció correcta de codificació produeix caràcters garbellats. PDFSub gestiona més de 130 idiomes amb detecció automàtica de formats de data, formats de número i codificacions de caràcters, incloent-hi l'àrab i l'hebreu de dreta a esquerra, caràcters CJK i tots els conjunts de caràcters europeus.


Elements Comuns dels Extractes Bancaris

Data de Transacció vs. Data de Registre vs. Data de Valor

Els extractes bancaris poden incloure múltiples dates per a una sola transacció:

  • Data de transacció - Quan es va produir realment la compra o transferència.
  • Data de registre - Quan el banc la va processar i registrar (típicament 1-3 dies hàbils més tard per a compres amb targeta de crèdit).
  • Data de valor - Quan els fons van estar realment disponibles (afecta els càlculs d'interessos, comú en la banca internacional).

La majoria dels extractes de consumidors només mostren la data de registre. Els extractes empresarials sovint inclouen tant la data de transacció com la de registre.

Representació de Dèbit/Crèdit

Els bancs representen dèbits i crèdits de manera diferent:

  • Imports signats: -87,50 per a dèbits, +3.500,00 per a crèdits.
  • Columnes separades: "Retirades" i "Dipòsits".
  • Abreviatures: "DR" per a dèbit, "CR" per a crèdit (comú al Regne Unit/Commonwealth).
  • Parèntesis: (87,50) per a dèbits (convenció comptable).

Saldo Acumulat

  • Saldo per transacció - Actualitzat després de cada transacció (més comú en extractes de consum dels EUA).
  • Només saldo diari - Saldo mostrat al final de cada dia (comú en extractes empresarials).
  • Sense saldo acumulat - Només saldos d'obertura i tancament (alguns extractes internacionals).

Els saldos acumulats són valuosos per a la validació: podeu verificar que cada transacció mou correctament el saldo d'una línia a la següent.

Informació Estàndard del Capçalera

La majoria dels extractes bancaris inclouen: nom del titular del compte, número de compte (sovint parcialment encobert), període de l'extracte, saldos d'obertura i tancament, dipòsits i retirades totals, i codi de ruta/sortida/SWIFT BIC del banc.


Protecció per Contrasenya

Com els Bancs Xifren els PDFs

Els bancs utilitzen típicament xifratge AES-128 o AES-256. Hi ha dos modes de protecció:

  • Contrasenya d'usuari (contrasenya d'obertura): Requerida per obrir el fitxer.
  • Contrasenya de propietari (contrasenya de permisos): El PDF s'obre però l'edició/còpia pot estar restringida.

Patrons Comuns de Contrasenya

Banc Contrasenya Típica
Chase SSN complet de 9 dígits
Bank of America SSN o TIN
Wells Fargo SSN o últims 4 dígits del SSN
Capital One Data de naixement (MMDDYYYY)

Altres patrons comuns inclouen els últims 4 dígits del número de compte, ID de client o número de soci. Els bancs solen comunicar el patró de contrasenya quan activeu per primera vegada els extractes electrònics.


Reptes dels Extractes de Múltiples Pàgines

Els extractes llargs (comptes empresarials amb centenars de transaccions) creen diversos reptes d'extracció:

Transaccions Dividides

La descripció d'una transacció pot començar al final d'una pàgina i continuar al principi de la següent. El convertidor ha de detectar línies de continuació i fusionar-les en una sola transacció.

Capçaleres i Peus de Pàgina Repetits

La majoria dels bancs repeteixen els encapçalaments de columna a cada pàgina, a més de números de pàgina, exempcions legals i text de màrqueting. Aquests s'han d'identificar i excloure de les dades de transacció.

Línies de Continuació

Moltes transaccions tenen descripcions de diverses línies:

15/01  DEBIT ELECTRÒNIC ACH EMPRESA VENEDORA 3.200,00 €  2.000,00 € REF#123456789 FACTURA 2026-001 EMPRESA VENEDORA COMPTES A PAGAR

Les línies 2 i 3 són línies de continuació que pertanyen a la transacció de la línia 1. Normalment manquen de data i import, apareixent indentades a la mateixa coordenada x que la columna de descripció.

Trasllat de Saldo

Alguns bancs inclouen línies "Saldo Traslladat" o "Saldo Portat Endavant" al principi de les pàgines de continuació. Aquestes són informatives, no transaccions, i s'han d'excloure de les dades extretes.


Abreviatures Comuns de Transaccions

Els extractes bancaris utilitzen abreviatures que varien entre institucions:

Abreviatura Significat
ACH Automated Clearing House (transferències electròniques)
ATM Automated Teller Machine (caixer automàtic)
POS Point of Sale (targeta de dèbit)
EFT Electronic Funds Transfer (transferència electrònica de fons)
INT Interest payment (pagament d'interessos)
CHK / CK Check (xec)
WD / W/D Withdrawal (retirada)
DEP Deposit (dipòsit)
DD Direct Deposit (dipòsit directe)
OD Overdraft (descobriment)
NSF Non-Sufficient Funds (fondos insuficients)
SRVCHG Service Charge (comissió de servei)
XFER Transfer (transferència)

Estàndards de la Indústria que Cal Conèixer

Aquests formats s'utilitzen en la gestió bancària corporativa i de tresoreria. Rarament els trobareu directament, però entendre'ls explica per què els extractes bancaris funcionen com ho fan.

BAI2 (Bank Administration Institute)

Utilitzat per a la gestió automatitzada de caixa i la conciliació bancària en sistemes ERP (SAP, Oracle). Un format ASCII de amplada fixa amb codis de tipus de transacció (p. ex., 165 = crèdit ACH preautoritzat, 455 = dèbit ACH, 495 = transferència wire sortint). Originalment publicat el 1987, ara mantingut per ASC X9.

SWIFT MT940 / MT940

Extractes bancaris de final de dia (MT940) i intradia (MT942) utilitzats per bancs de tot el món per a clients corporatius i departaments de tresoreria. SWIFT processa aproximadament 45 milions de missatges al dia. Format basat en etiquetes amb identificadors de camp separats per dos punts.

ISO 20022 (camt.053)

El modern reemplaçament basat en XML per a MT940. Part de l'estàndard universal de missatgeria financera ISO 20022. Dades més riques que MT940, sense límits de longitud de camp, XML analitzable per màquina amb validació XSD. SWIFT està migrant dels missatges MT a ISO 20022. SEPA (Single Euro Payments Area) exigeix el format camt per als pagaments europeus.

NACHA ACH

El format de fitxer per a transaccions Automated Clearing House als EUA. Amplada fixa ASCII, exactament 94 caràcters per línia. ACH processa aproximadament 30 mil milions de transaccions a l'any als EUA. Quan el vostre extracte bancari mostra "ACH CREDIT" o "ACH DEBIT", la transacció subjacent es va transmetre en format NACHA entre bancs.


Tria del Format Correcte per al vostre Flux de Treball

Guia de Decisió

Utilitzeu QBO si: Utilitzeu QuickBooks (Desktop o Online). Obteniu classificació del tipus de transacció, detecció de duplicats via FITID i les metadades d'importació més riques.

Utilitzeu OFX si: Utilitzeu Xero, Sage, Wave o altre programari compatible amb OFX. Xero mapeja automàticament els camps sense configuració manual de columnes.

Utilitzeu QFX si: Utilitzeu Quicken. És l'únic format que Quicken accepta.

Utilitzeu Excel si: Necessiteu revisar, analitzar o manipular dades abans d'importar. Creeu taules dinàmiques, executeu fórmules o prepareu informes.

Utilitzeu CSV si: El vostre programari no està a la llista anterior, o necessiteu màxima compatibilitat entre sistemes. Estigueu preparats per mapejar columnes manualment.

Utilitzeu JSON si: Esteu construint fluxos de treball automatitzats, integracions d'API o sistemes d'informes personalitzats.

Consells Pro

  • Utilitzeu sempre QBO/OFX per sobre de CSV quan el vostre programari ho suporti; només la detecció de duplicats ja estalvia hores de neteja.
  • Conserveu el PDF original al costat del fitxer convertit; és el vostre rastre d'auditoria i document font.
  • Verifiqueu després de cada importació; comproveu els saldos d'obertura/tancament i algunes transaccions aleatòries.
  • Ajusteu el format al programari; utilitzar el format natiu de la vostra plataforma de comptabilitat evita el mapeig manual de columnes i habilita funcions automàtiques.

Prova-ho Gratis

Preparat per convertir el teu primer extracte? Puja un PDF ara; PDFSub converteix a Excel, CSV, QBO, OFX, QFX i JSON. Els extractes digitals es processen completament al vostre navegador per a la màxima privacitat. Comença una prova gratuïta de 7 dies amb accés complet a tots els formats.

Tornar al blog

Preguntes? Contacta amb nosaltres

PDFSub

Totes les eines de PDF i documents que necessites en un sol lloc. Ràpid, segur i privat.

Compliment GDPRCompliment CCPAPreparat per SOC 2
Potenciat per PDFSub Engine

Producte

  • Totes les eines
  • Característiques
  • Extractes bancaris
  • API
  • Preus
  • Preguntes freqüents
  • Blog

Suport

  • Sobre nosaltres
  • Centre d'ajuda
  • Contacte
  • Preguntes freqüents

Legal

  • Política de privadesa
  • Condicions del servei
  • Política de cookies

© 2026 PDFSub. Tots els drets reservats.

Fet a Amèrica amb per a tothom