PDFSub
PreciosAPIMergeCompressEditE-SignExtractos BancariosBlog
Volver al Blog
GuíaTécnicoExcelCSVQBOOFX

Comprendiendo los Formatos de Extractos Bancarios: La Guía Técnica

16 de mayo de 2026
T
Todd Lahman
Founder, PDFSub

El PDF no es un formato de datos, es un formato de visualización. Por eso, extraer datos de transacciones de los extractos bancarios es sorprendentemente difícil. Esta guía explica qué hay dentro de un extracto bancario en PDF, los formatos de salida disponibles (Excel, CSV, QBO, OFX, QFX, JSON) y cómo elegir el adecuado.


Understanding Bank Statement Formats: The Technical Guide

Un extracto bancario en PDF parece simple: fechas, descripciones, importes, saldos en columnas ordenadas. Pero detrás de esa apariencia se esconde un formato de documento (PDF) que nunca fue diseñado para almacenar datos estructurados, y un proceso de conversión que requiere comprender tanto el formato de entrada como los múltiples formatos de salida disponibles.

Esta guía cubre las 12 secciones que aparecen en cada extracto bancario (independientemente del banco), la realidad técnica de los extractos bancarios en PDF, las variaciones de diseño entre bancos, todos los formatos de salida que encontrará (Excel, CSV, QBO, OFX, QFX, QIF, JSON), las diferencias de formato internacional y los estándares de la industria que rigen el intercambio de datos financieros.


Anatomía de un Extracto Bancario

Cada extracto bancario (Chase, Bank of America, Wells Fargo, HSBC, Deutsche Bank, por nombrar algunos) se construye a partir de las mismas 12 secciones. Las etiquetas cambian ("Sustracciones" vs "Retiros"), las disposiciones de las columnas varían, pero la estructura subyacente es consistente. Una vez que pueda identificar estas secciones, cada extracto le resultará familiar.

Anatomy of a bank statement: 12 labeled sections every statement contains

¿Quiere usar esta infografía en su blog? Copie este código de inserción:

Para análisis detallados específicos de cada banco que cubren exactamente cómo cada banco importante organiza estas 12 secciones, consulte:

  • Extracto bancario de Chase explicado
  • Extracto bancario de Bank of America explicado
  • Extracto bancario de Wells Fargo explicado
  • Extracto bancario de Citi explicado
  • Extracto bancario de Capital One explicado

Por Qué el PDF No Es un Formato de Datos

PDF significa Portable Document Format (Formato de Documento Portátil), estandarizado como ISO 32000 (la versión 2.0 se convirtió en ISO 32000-2:2020). Fue diseñado para un solo propósito: hacer que los documentos se vean idénticos en cada pantalla e impresora. Eso es genial para la fidelidad visual, y terrible para la extracción de datos.

Qué Hay Realmente Dentro de un PDF de Extracto Bancario

Dentro de cada página PDF hay un flujo de contenido (content stream), una secuencia de operadores de dibujo escritos en un lenguaje similar a PostScript. El texto se representa utilizando operadores específicos:

  • BT / ET - Begin Text / End Text: límites de un objeto de texto
  • Tf - Establecer fuente y tamaño
  • Td / Tm - Mover la posición del texto o establecer la matriz de transformación de texto completa
  • Tj - Mostrar una cadena de texto
  • TJ - Mostrar texto con posicionamiento individual de glifos (ajustes de kerning)

La idea clave: no existe el concepto de "tabla", "fila" o "columna" en la especificación PDF. Lo que parece una tabla de transacciones bien formateada es en realidad docenas de fragmentos de texto colocados en coordenadas x,y específicas en la página. La herramienta de extracción debe:

  1. Analizar los operadores del flujo de contenido
  2. Resolver las codificaciones de fuentes para mapear índices de glifos a caracteres Unicode
  3. Usar la matriz de texto (Tm/Td) para determinar la posición x,y de cada carácter
  4. Reconstruir palabras, líneas y columnas a partir de esas coordenadas

Una columna que parece perfectamente alineada podría estar en x=72.0 en una línea y x=72.5 en la siguiente. El algoritmo de extracción debe definir los límites de las columnas con tolerancia a estas variaciones subpíxel.

PDFs Etiquetados vs. No Etiquetados

Los PDFs Etiquetados incluyen un árbol de estructura lógica oculto (similar a las etiquetas HTML) que marca el contenido como encabezados, párrafos, tablas, filas de tabla y celdas de tabla. Esto facilita significativamente la extracción.

Los PDFs No Etiquetados no tienen metadatos estructurales; la herramienta de extracción solo obtiene datos de posicionamiento en bruto y debe inferir todo.

La mayoría de los PDFs de extractos generados por bancos no están etiquetados. Los bancos generan extractos utilizando sistemas de procesamiento por lotes (Oracle BI Publisher, SAP Crystal Reports o pipelines personalizados de impresión a PDF). Las regulaciones de accesibilidad (ADA/WCAG) están impulsando a los bancos hacia los PDFs etiquetados, pero la adopción es lenta. Las descargas estándar de la mayoría de los bancos principales siguen sin estar etiquetadas.


Variaciones de Diseño en Extractos Bancarios

No existe un estándar industrial sobre cómo los bancos formatean sus extractos en PDF. Las mismas cinco piezas de información (fecha, descripción, débito, crédito, saldo) se organizan de manera diferente en cada banco.

Columna de Importe Único (Con Signo)

Fecha Descripción Importe Saldo
15/01/26 DEPÓSITO NÓMINA DIRECTA +3,500.00 5,200.00
16/01/26 COMPRA TPV SUPERMERCADO -87.50 5,112.50

Los débitos son negativos, los créditos son positivos (o viceversa). Común en bancos más pequeños, cooperativas de crédito y bancos digitales. Más fácil de analizar porque solo hay una columna de importe que extraer.

Columnas Separadas de Débito/Crédito

Fecha Descripción Retiros Depósitos Saldo
15/01/26 DEPÓSITO NÓMINA DIRECTA 3,500.00 5,200.00
16/01/26 COMPRA TPV SUPERMERCADO 87.50 5,112.50

Utilizado por Chase, Bank of America y muchos bancos tradicionales. La herramienta de extracción debe identificar qué columna contiene el importe y determinar el signo en consecuencia.

Agrupados por Tipo de Transacción

Las cuentas comerciales y empresariales a menudo agrupan las transacciones:

DEPÓSITOS Y OTROS CRÉDITOS 15/01  Transferencia Bancaria Recibida REF#12345 10,000.00 18/01  Depósito Cheque #4567 2,500.00 Total Depósitos 12,500.00
 
CHèques PAGADOS 16/01  Cheque #1234 850.00 17/01  Cheque #1235 1,200.00 Total Cheques Pagados 2,050.00
 
TRANSACCIONES ELECTRÓNICAS 19/01  Pago ACH - Empresa Proveedora 3,200.00 20/01  Transferencia en Línea a Ahorros 1,000.00 Total Electrónico 4,200.00

Los encabezados de sección determinan si las transacciones son débitos o créditos. Las líneas de resumen ("Total Depósitos") deben identificarse y excluirse de los datos de la transacción.

Características Específicas del Banco

  • Chase - Columnas separadas de débito/crédito; agrupa por "DEPÓSITOS Y ADICIONES" y "PAGOS ELECTRÓNICOS" y "COMISIONES"; descripciones de varias líneas comunes para detalles del comerciante
  • Bank of America - Columnas separadas de retiro/depósito; incluye una sección de "Saldo Diario" al final; encabezado extenso con número de cuenta, período del extracto, número de ruta
  • Wells Fargo - Columnas separadas; incluye sección "RESUMEN DE SALDO DIARIO"; llama a su descarga CSV "Comma Delimited"
  • Capital One - Diseño limpio de importe único para tarjetas de consumo; información de encabezado mínima
  • Citi - A menudo incluye detalles de transacciones internacionales con importes en moneda original y tasas de conversión en líneas separadas

Variaciones en la Disposición de Columnas

Más allá de la cuestión del débito/crédito, el orden de las columnas no está estandarizado:

  • Orden de columnas: Fecha-Descripción-Importe-Saldo vs. Fecha-Importe-Descripción-Saldo
  • Número de cheque: Presente en cuentas empresariales, ausente en personales
  • Número de referencia: Común en extractos empresariales, raro en personales
  • Saldo acumulado: Por transacción (más común) vs. subtotales diarios vs. ausente por completo

PDFs Digitales vs. Escaneados

El factor más importante que afecta la precisión de la conversión es si su PDF es digital o escaneado.

PDFs Digitales (Nativos)

Creados programáticamente por el sistema de su banco al descargar un extracto. El texto se almacena como operadores de flujo de contenido con codificaciones de fuentes.

  • Precisión: 99%+ para la extracción de texto; sin errores de reconocimiento
  • Velocidad: Milisegundos por página
  • Privacidad: Se puede procesar completamente en su navegador; el archivo nunca sale de su dispositivo
  • Tamaño del archivo: Típicamente 50 KB–500 KB por página
  • Cómo identificar: Puede seleccionar y resaltar palabras individuales

PDFs Escaneados

Imágenes de extractos en papel, creadas al escanear o fotografiar un documento físico. El contenido se almacena como imágenes rasterizadas (JPEG, JPEG2000, CCITT o compresión Flate).

  • Precisión: 95–99% con OCR profesional; 65–70% con OCR genérico
  • Velocidad: Segundos por página (requiere procesamiento de imágenes)
  • Privacidad: Típicamente requiere procesamiento en el servidor (el archivo debe cargarse para OCR)
  • Tamaño del archivo: 200 KB–2 MB+ por página
  • Cómo identificar: No puede seleccionar ningún texto; al hacer zoom al 400% se ve pixelación

Por Qué la Precisión del Escaneo es Más Importante para Datos Financieros

Una tasa de precisión de caracteres del 97% suena excelente hasta que se aplica a datos financieros. En un extracto con 1,000 caracteres de importes, eso son 30 caracteres mal leídos. Un solo dígito mal leído cambia el importe de una transacción: "$1,234.56" se convierte en "$1,234.86" o "$7,234.56". El OCR avanzado logra una precisión cercana al 99%, pero los errores restantes recaen desproporcionadamente en caracteres que se parecen: 0/O, 1/l/I, 5/S, 8/B, 6/G y, críticamente, coma/punto.

Prefiera siempre las descargas digitales. Descargue los extractos del sitio web de su banco en lugar de escanear papel. Esto elimina por completo los errores de OCR.


Formatos de Salida: Análisis Profundo

Bank Statement Output Formats Compared - Excel, CSV, QBO, OFX, QFX, JSON

Al convertir un extracto bancario, usted elige un formato de salida. Cada formato tiene diferentes fortalezas, limitaciones y casos de uso ideales.

Excel (.xlsx)

Estándar: Office Open XML (OOXML), estandarizado como ECMA-376 e ISO/IEC 29500.

Qué es: Un archivo .xlsx es en realidad un archivo ZIP que contiene archivos XML: estructura del libro de trabajo, datos de celdas, estilos y cadenas compartidas. Por eso puede almacenar tipos de datos (fechas como fechas, números como números), formato, fórmulas y múltiples hojas.

Por qué es popular para extractos bancarios:

  • Las fechas siguen siendo fechas (ordenables, filtrables)
  • Los números siguen siendo números (sumables, formateables)
  • Fórmulas para la conciliación (SUMA, BUSCARV)
  • Tablas dinámicas para la categorización de gastos
  • Formato condicional para resaltar discrepancias
  • Compartir con clientes que necesitan una hoja de cálculo legible

Limitaciones:

  • Máximo 1,048,576 filas (raramente relevante para extractos bancarios)
  • No es directamente importable en la mayoría del software de contabilidad (use QBO/OFX en su lugar)
  • Requiere Excel, Google Sheets o LibreOffice Calc para abrir

Mejor para: Revisión manual, análisis personalizado, conciliación, archivo, informes a clientes.

CSV (Valores Separados por Comas)

Estándar: RFC 4180 (2005) - "Common Format and MIME Type for Comma-Separated Values."

Reglas básicas:

  • Registros delimitados por CRLF (retorno de carro + salto de línea)
  • Campos separados por comas
  • Los campos que contienen comas, comillas o saltos de línea deben ir entre comillas dobles
  • Las comillas dobles dentro de los campos se escapan duplicándolas

Variaciones de delimitador en la práctica:

  • Coma (,) - Estándar, usado en EE. UU./Reino Unido
  • Punto y coma (;) - Usado en países donde la coma es el separador decimal (Francia, Alemania, Italia, España, Brasil)
  • Tabulación (\t) - Formato TSV, evita conflictos de delimitadores

Problemas de codificación:

  • UTF-8 es recomendado para interoperabilidad
  • UTF-8 BOM (Byte Order Mark): No es requerido por el estándar, pero Excel en Windows lo necesita para mostrar correctamente caracteres no ASCII (letras acentuadas, símbolos de moneda). Sin BOM, Excel puede interpretar UTF-8 como Windows-1252, corrompiendo caracteres.
  • Excel usa punto y coma en lugar de comas como separadores de campo en configuraciones regionales europeas

Limitaciones:

  • Sin tipos de datos; todo es texto (los números con ceros iniciales se corrompen, los números de cuenta largos se convierten en notación científica)
  • Sin soporte para múltiples hojas
  • Sin formato ni fórmulas
  • Sin metadatos (sin información de cuenta, sin IDs de detección de duplicados)

Mejor para: Máxima compatibilidad; casi todos los programas de contabilidad, bases de datos y hojas de cálculo pueden importar CSV. Un recurso universal cuando QBO/OFX no está disponible.

QBO (QuickBooks Web Connect)

Qué es: El formato de importación para QuickBooks (tanto Desktop como Online). Los archivos QBO se basan en la especificación OFX con extensiones específicas de QuickBooks.

Aclaración importante: ".QBO" NO significa "QuickBooks Online"; significa formato QuickBooks Web Connect y funciona tanto con QuickBooks Desktop como con QuickBooks Online.

Campos requeridos por transacción:

  • TRNTYPE - Tipo de transacción (DEBIT, CREDIT, CHECK, DEP, DIRECTDEP, DIRECTDEBIT, ATM, POS, XFER, PAYMENT, FEE, SRVCHG, INT, OTHER)
  • DTPOSTED - Fecha en formato YYYYMMDD
  • TRNAMT - Importe (negativo para débitos)
  • FITID - ID de Transacción de la Institución Financiera
  • NAME - Beneficiario/descripción

Por qué FITID es importante: QuickBooks rastrea cada FITID importado para cada cuenta. Si se vuelve a importar una transacción con el mismo FITID, QuickBooks la omite silenciosamente, evitando entradas duplicadas cuando los usuarios reimportan períodos de extracto superpuestos. Esta detección automática de duplicados es la mayor ventaja de QBO sobre CSV.

Datos adicionales: QBO también transporta el ID de cuenta, ID del banco (número de ruta), moneda, número de cheque, memo y saldo final; el conjunto de datos más rico de cualquier formato de importación para QuickBooks.

Mejor para: Usuarios de QuickBooks (Desktop y Online). Proporciona la experiencia de importación más rica con detección automática de duplicados y clasificación de tipos de transacción.

OFX (Open Financial Exchange)

Historia: Creado por Microsoft, Intuit y CheckFree. Versión 1.0 lanzada en febrero de 1997.

Evolución de la versión:

  • OFX 1.0–1.6 (1997–1999): Sintaxis basada en SGML (no se requieren etiquetas de cierre)
  • OFX 2.0+ (2000–presente): Basado en XML (etiquetas de cierre correctas, XML bien formado)

Muchos bancos todavía producen OFX 1.x (SGML) para máxima compatibilidad.

Gobernanza actual: En 2019, el consorcio OFX se fusionó con el consorcio Financial Data Exchange (FDX), que ahora gestiona la especificación. FDX tiene más de 200 organizaciones miembro y 76 millones de cuentas de consumidores.

Por qué OFX es el estándar universal: OFX es el mismo formato que se utiliza cuando conecta su cuenta bancaria directamente al software de contabilidad a través de conexiones bancarias; el mismo formato funciona para importaciones de archivos.

Mejor para usuarios de Xero: Xero importa automáticamente archivos OFX sin requerir mapeo manual de columnas. Cargue el archivo y las transacciones aparecerán inmediatamente con fechas, importes y descripciones correctos. También funciona con Wave, Sage, FreshBooks y la mayoría del software de contabilidad.

QFX (Quicken Financial Exchange)

Qué es: La variante propietaria de OFX de Intuit, utilizada exclusivamente con Quicken. Un archivo QFX es un archivo OFX estándar con campos propietarios adicionales.

Campo propietario clave: INTU.BID - Identificador Bancario de Quicken. Este ID numérico se mapea a un banco en la base de datos interna de Quicken. Sin él, Quicken se niega a importar el archivo.

Diferencias con el OFX estándar:

  • Requiere INTU.BID en el encabezado
  • Puede incluir otros campos prefijados con INTU.*
  • Las instituciones financieras pagan una tarifa de licencia a Intuit para proporcionar descargas QFX
  • Quicken no importará archivos OFX estándar sin el campo INTU.BID

Mejor para: Usuarios del software de finanzas personales Quicken. Formato requerido; no hay alternativa que funcione.

QIF (Quicken Interchange Format)

Qué es: Un formato heredado de texto plano desarrollado originalmente por Intuit para Quicken. Pares de etiqueta-valor, uno por línea, con etiquetas de un solo carácter: D para fecha, T para importe, P para beneficiario, L para categoría, M para memo, N para número de cheque, ^ para fin de registro.

Por qué fue reemplazado: QIF carece de un mecanismo de detección de duplicados (sin equivalente a FITID), no tiene campos de identificación de cuenta, ni información de ruta bancaria, ni datos de saldo, y formato de fecha inconsistente entre implementaciones.

Todavía relevante: Algunos programas de contabilidad (Xero, Sage, GnuCash) todavía aceptan importaciones QIF. Útil para migraciones de sistemas heredados.

JSON (JavaScript Object Notation)

Estado actual: JSON aún no es un estándar para archivos de extractos bancarios, pero se utiliza cada vez más en:

  • APIs de Banca Abierta (Estándar de Banca Abierta del Reino Unido, Grupo Berlín PSD2)
  • API FDX (Financial Data Exchange - sucesor de OFX, más de 200 organizaciones miembro)
  • APIs de Plaid, Yodlee, MX y otros agregadores de datos
  • Flujos de trabajo de desarrolladores y automatización

Adopción creciente: Las regulaciones de Banca Abierta (PSD2 en Europa, Sección 1033 de la CFPB en EE. UU.) están acelerando la adopción de APIs JSON. La API FDX utiliza JSON/REST con OAuth 2.0, representando la dirección futura del intercambio de datos financieros.

Mejor para: Desarrolladores que crean flujos de trabajo automatizados, integraciones fintech, paneles personalizados e integraciones de API de Banca Abierta.


Comparación de Formatos a Simple Vista

Formato Tipos de Datos Detección de Duplicados Información de Cuenta Soporte de Software de Contabilidad Mejor Para
Excel Sí No No Limitado Revisión manual, análisis
CSV No No No Universal Máxima compatibilidad
QBO Sí Sí (FITID) Sí QuickBooks Usuarios de QuickBooks
OFX Sí Sí (FITID) Sí La mayoría del software Xero, Wave, Sage
QFX Sí Sí (FITID) Sí Solo Quicken Usuarios de Quicken
QIF Parcial No No Algunos heredados Migraciones heredadas
JSON Sí Personalizado Sí Basado en API Desarrolladores, automatización

Compatibilidad con Software de Contabilidad

¿Qué formato acepta su software de contabilidad?

Software QBO OFX QFX QIF CSV Mejor Opción
QuickBooks Online Sí Sí Sí No Sí QBO
QuickBooks Desktop Sí Sí Sí No Sí QBO
Quicken No No Sí Sí No QFX
Xero Sí Sí Sí Sí Sí OFX
Sage No Sí No Sí Sí OFX
Wave No Sí Sí No Sí OFX
FreshBooks No No No No Sí CSV
Zoho Books No Sí No Sí Sí OFX
GnuCash No Sí No Sí Sí OFX

Regla general: Use QBO para QuickBooks, QFX para Quicken, OFX para todo lo demás y CSV como último recurso universal.


Diferencias de Formato Internacional

Si trabaja con extractos bancarios internacionales, encontrará diferencias de formato que confunden a la mayoría de las herramientas de conversión.

Formatos de Fecha

Región Formato Ejemplo Notas
Estados Unidos MM/DD/AAAA 15/03/2026 Mes primero
Europa, América Latina DD/MM/AAAA 15/03/2026 Día primero
Alemania DD.MM.AAAA 15.03.2026 Separador de punto
Japón AAAA年MM月DD日 2026年03月01日 Año primero con kanji
China AAAA年MM月DD日 2026年3月1日 Similar a Japón
ISO 8601 AAAA-MM-DD 2026-03-15 Estándar internacional inequívoco

El problema de la ambigüedad: "03/04/2026" es el 4 de marzo en EE. UU. pero el 3 de abril en Europa. Cuando todas las fechas en un extracto tienen valores de día de 12 o menos, no hay forma algorítmica de determinar el formato correcto sin conocer el país de origen. Las herramientas de conversión deben escanear todas las fechas del extracto, buscando valores mayores que 12 para determinar el formato.

Formatos de Números

Región Mil Cincuenta Céntimos Notas
EE. UU., Reino Unido, Australia, Japón 1,000.50 Coma para miles, punto para decimal
Alemania, Francia, España, Brasil, Italia 1.000,50 Punto para miles, coma para decimal
Suiza 1'000.50 Apóstrofe para miles
India 1,00,000.50 Sistema de agrupación Lakh
Escandinavia 1 000,50 Espacio para miles, coma para decimal

"10.000,45" de un banco europeo significa diez mil cuarenta y cinco céntimos, no diez punto cero cero cero cuatro cinco. Equivocarse en esto produce errores de magnitud 10,000x.

Colocación del Símbolo de Moneda

  • EE. UU./Reino Unido: Símbolo antes del importe: $1,234.56 / £1,234.56
  • Francia, Alemania, España: Símbolo después del importe: 1.234,56 €
  • Irlanda, Países Bajos: Símbolo antes: €1,234.56
  • Japón: Símbolo antes: ¥123,456

Codificaciones de Caracteres

  • UTF-8 - Estándar universal, soporta todos los scripts
  • GBK/GB2312 - Chino Simplificado (usado por bancos chinos)
  • Shift_JIS - Japonés (usado por bancos japoneses)
  • Big5 - Chino Tradicional (Taiwán, Hong Kong)
  • EUC-KR - Coreano
  • ISO 8859-1 - Europa Occidental
  • Windows-1252 - Europa Occidental (legado)
  • Windows-1256 - Árabe

Abrir un extracto bancario chino o japonés en un sistema estadounidense sin la codificación correcta produce caracteres ilegibles. PDFSub maneja más de 130 idiomas con detección automática de formatos de fecha, formatos de números y codificaciones de caracteres, incluyendo árabe y hebreo de derecha a izquierda, caracteres CJK y todos los conjuntos de caracteres europeos.


Elementos Comunes de Extractos Bancarios

Fecha de Transacción vs. Fecha de Registro vs. Fecha de Valor

Los extractos bancarios pueden incluir múltiples fechas para una sola transacción:

  • Fecha de transacción: Cuándo ocurrió realmente la compra o transferencia
  • Fecha de registro: Cuándo el banco la procesó y registró (típicamente 1-3 días hábiles después para compras con tarjeta de crédito)
  • Fecha de valor: Cuándo los fondos estuvieron realmente disponibles (afecta los cálculos de intereses, común en la banca internacional)

La mayoría de los extractos de consumo solo muestran la fecha de registro. Los extractos empresariales a menudo incluyen ambas fechas, la de transacción y la de registro.

Representación de Débito/Crédito

Los bancos representan débitos y créditos de manera diferente:

  • Importes con signo: -87.50 para débitos, +3,500.00 para créditos
  • Columnas separadas: "Retiros" y "Depósitos"
  • Abreviaturas: "DR" para débito, "CR" para crédito (común en Reino Unido/Commonwealth)
  • Paréntesis: (87.50) para débitos (convención contable)

Saldo Acumulado

  • Saldo por transacción: Actualizado después de cada transacción (más común en extractos de consumo de EE. UU.)
  • Solo saldo diario: Saldo mostrado al final de cada día (común en extractos empresariales)
  • Sin saldo acumulado: Solo saldos de apertura y cierre (algunos extractos internacionales)

Los saldos acumulados son valiosos para la validación: puede verificar que cada transacción mueva correctamente el saldo de una línea a la siguiente.

Información Estándar del Encabezado

La mayoría de los extractos bancarios incluyen: nombre del titular de la cuenta, número de cuenta (a menudo parcialmente enmascarado), período del extracto, saldos de apertura y cierre, depósitos y retiros totales, y número de ruta/código de clasificación/SWIFT BIC del banco.


Protección con Contraseña

Cómo los Bancos Cifran los PDFs

Los bancos suelen utilizar cifrado AES-128 o AES-256. Existen dos modos de protección:

  • Contraseña de usuario (contraseña de apertura): Requerida para abrir el archivo
  • Contraseña de propietario (contraseña de permisos): El PDF se abre pero la edición/copia pueden estar restringidas

Patrones de Contraseña Comunes

Banco Contraseña Típica
Chase Número SSN completo de 9 dígitos
Bank of America SSN o TIN
Wells Fargo SSN o los últimos 4 dígitos del SSN
Capital One Fecha de nacimiento (MMDDYYYY)

Otros patrones comunes incluyen los últimos 4 dígitos del número de cuenta, ID de cliente o número de miembro. Los bancos suelen comunicar el patrón de contraseña cuando habilita por primera vez los extractos electrónicos.


Desafíos de Extractos de Múltiples Páginas

Los extractos largos (cuentas empresariales con cientos de transacciones) crean varios desafíos de extracción:

Transacciones Divididas

La descripción de una transacción puede comenzar al final de una página y continuar al principio de la siguiente. El convertidor debe detectar líneas de continuación y fusionarlas en una sola transacción.

Encabezados y Pies de Página Repetidos

La mayoría de los bancos repiten los encabezados de columna en cada página, además de números de página, descargos de responsabilidad legales y texto de marketing. Estos deben identificarse y excluirse de los datos de la transacción.

Líneas de Continuación

Muchas transacciones tienen descripciones de varias líneas:

15/01  DÉBITO ELECTRÓNICO ACH EMPRESA PROVEEDORA $3,200.00  $2,000.00 REF#123456789 FACTURA 2026-001 CUENTAS POR PAGAR EMPRESA PROVEEDORA

Las líneas 2 y 3 son líneas de continuación que pertenecen a la transacción de la línea 1. Normalmente carecen de fecha e importe, apareciendo con sangría en la misma coordenada x que la columna de descripción.

Transferencia de Saldo

Algunos bancos incluyen líneas de "Saldo Anterior" o "Saldo Transferido" al principio de las páginas de continuación. Son informativas, no transacciones, y deben excluirse de los datos extraídos.


Abreviaturas Comunes de Transacciones

Los extractos bancarios utilizan abreviaturas que varían entre instituciones:

Abreviatura Significado
ACH Automated Clearing House (transferencias electrónicas)
ATM Automated Teller Machine (Cajero Automático)
POS Point of Sale (tarjeta de débito)
EFT Electronic Funds Transfer (Transferencia Electrónica de Fondos)
INT Interest payment (Pago de intereses)
CHK / CK Check (Cheque)
WD / W/D Withdrawal (Retiro)
DEP Deposit (Depósito)
DD Direct Deposit (Depósito Directo)
OD Overdraft (Sobregiro)
NSF Non-Sufficient Funds (Fondos Insuficientes)
SRVCHG Service Charge (Cargo por Servicio)
XFER Transfer (Transferencia)

Estándares de la Industria que Debe Conocer

Estos formatos se utilizan en la banca corporativa y la gestión de tesorería. Raramente los encontrará directamente, pero comprenderlos explica por qué los extractos bancarios funcionan como lo hacen.

BAI2 (Bank Administration Institute)

Se utiliza para la gestión automatizada de efectivo y la conciliación bancaria en sistemas ERP (SAP, Oracle). Un formato ASCII de ancho fijo con códigos de tipo de transacción (por ejemplo, 165 = crédito ACH preautorizado, 455 = débito ACH, 495 = transferencia bancaria saliente). Lanzado originalmente en 1987, ahora mantenido por ASC X9.

SWIFT MT940 / MT942

Extractos bancarios de fin de día (MT940) e intradía (MT942) utilizados por bancos de todo el mundo para clientes corporativos y departamentos de tesorería. SWIFT procesa aproximadamente 45 millones de mensajes al día. Formato basado en etiquetas con identificadores de campo delimitados por dos puntos.

ISO 20022 (camt.053)

El reemplazo moderno basado en XML para MT940. Parte del estándar universal de mensajería financiera ISO 20022. Datos más ricos que MT940, sin límites de longitud de campo, XML interpretable por máquina con validación XSD. SWIFT está migrando de mensajes MT a ISO 20022. SEPA (Single Euro Payments Area) exige el formato camt para pagos europeos.

NACHA ACH

El formato de archivo para transacciones Automated Clearing House en EE. UU. ASCII de ancho fijo, exactamente 94 caracteres por línea. ACH procesa aproximadamente 30 mil millones de transacciones al año en EE. UU. Cuando su extracto bancario muestra "ACH CREDIT" o "ACH DEBIT", la transacción subyacente se transmitió en formato NACHA entre bancos.


Elegir el Formato Adecuado para su Flujo de Trabajo

Guía de Decisión

Use QBO si: Utiliza QuickBooks (Desktop u Online). Obtiene clasificación de tipo de transacción, detección de duplicados a través de FITID y los metadatos de importación más ricos.

Use OFX si: Utiliza Xero, Sage, Wave u otro software compatible con OFX. Xero mapea automáticamente los campos sin configuración manual de columnas.

Use QFX si: Utiliza Quicken. Es el único formato que Quicken acepta.

Use Excel si: Necesita revisar, analizar o manipular datos antes de importar. Crear tablas dinámicas, ejecutar fórmulas o preparar informes.

Use CSV si: Su software no está en la lista anterior, o necesita la máxima compatibilidad entre sistemas. Prepárese para mapear columnas manualmente.

Use JSON si: Está creando flujos de trabajo automatizados, integraciones de API o sistemas de informes personalizados.

Consejos Profesionales

  • Siempre use QBO/OFX sobre CSV cuando su software lo admita; la detección de duplicados por sí sola evita horas de limpieza.
  • Conserve el PDF original junto con su archivo convertido; es su pista de auditoría y documento fuente.
  • Verifique después de cada importación: Compruebe los saldos de apertura/cierre y algunas transacciones aleatorias.
  • Ajuste el formato al software: Usar el formato nativo de su plataforma de contabilidad evita el mapeo manual de columnas y habilita funciones automáticas.

Pruébelo Gratis

¿Listo para convertir su primer extracto? Suba un PDF ahora - PDFSub convierte a Excel, CSV, QBO, OFX, QFX y JSON. Los extractos digitales se procesan completamente en su navegador para máxima privacidad. Comience una prueba gratuita de 7 días con acceso completo a todos los formatos.

Volver al Blog

¿Preguntas? Contáctanos

PDFSub

Todas las herramientas de PDF y documentos que necesitas en un solo lugar. Rápido, seguro y privado.

Cumple con GDPRCumple con CCPAListo para SOC 2
Potenciado por PDFSub Engine

Producto

  • Todas las Herramientas
  • Funciones
  • Extractos Bancarios
  • API
  • Precios
  • Preguntas Frecuentes
  • Blog

Soporte

  • Acerca de
  • Centro de Ayuda
  • Contacto
  • Preguntas Frecuentes

Legal

  • Política de Privacidad
  • Términos de Servicio
  • Política de Cookies

© 2026 PDFSub. Todos los derechos reservados.

Hecho en América con para personas de todo el mundo