PDFSub
PreçosAPIMergeCompressEditE-SignExtratos BancáriosBlog
Voltar ao Blog
GuiaTécnicoExcelCSVQBOOFX

Compreendendo os formatos de extratos bancários: O guia técnico

16 de maio de 2026
T
Todd Lahman
Founder, PDFSub

PDF não é um formato de dados, é um formato de exibição. É por isso que extrair dados de transações de extratos bancários é surpreendentemente difícil. Este guia explica o que há dentro de um PDF de extrato bancário, os formatos de saída disponíveis (Excel, CSV, QBO, OFX, QFX, JSON) e como escolher o correto.


Understanding Bank Statement Formats: The Technical Guide

Um PDF de extrato bancário parece simples: datas, descrições, valores e saldos em colunas organizadas. Mas, por trás dessa aparência, reside um formato de documento (PDF) que nunca foi projetado para armazenar dados estruturados — e um processo de conversão que exige a compreensão tanto do formato de entrada quanto dos diversos formatos de saída disponíveis.

Este guia aborda as 12 seções que aparecem em todos os extratos bancários (independentemente do banco), a realidade técnica dos PDFs de extratos, as variações de layout entre instituições, todos os formatos de saída que você encontrará (Excel, CSV, QBO, OFX, QFX, QIF, JSON), diferenças de formatação internacional e os padrões da indústria que regem a troca de dados financeiros.


Anatomia de um extrato bancário

Todo extrato bancário — Itaú, Bradesco, Santander, Banco do Brasil, Caixa, não importa — é construído a partir das mesmas 12 seções. Os rótulos mudam ("Débitos" vs "Saídas"), a disposição das colunas varia, mas a estrutura subjacente é consistente. Uma vez que você consegue identificar essas seções, todo extrato parece familiar.

Anatomy of a bank statement: 12 labeled sections every statement contains

Deseja usar este infográfico em seu blog? Copie este código de incorporação:

Para análises detalhadas específicas sobre como cada grande banco organiza essas 12 seções, veja:

  • Extrato do Itaú explicado
  • Extrato do Bradesco explicado
  • Extrato do Santander explicado
  • Extrato do Banco do Brasil explicado
  • Extrato da Caixa explicado

Por que o PDF não é um formato de dados

PDF significa Portable Document Format (Formato de Documento Portátil), padronizado como ISO 32000 (a versão 2.0 tornou-se ISO 32000-2:2020). Ele foi projetado para um único propósito: fazer com que documentos pareçam idênticos em qualquer tela ou impressora. Isso é ótimo para fidelidade visual — e terrível para extração de dados.

O que há realmente dentro de um PDF de extrato bancário

Dentro de cada página PDF existe um fluxo de conteúdo — uma sequência de operadores de desenho escritos em uma linguagem semelhante ao PostScript. O texto é renderizado usando operadores específicos:

  • BT / ET - Begin Text / End Text: limites de um objeto de texto
  • Tf - Define fonte e tamanho
  • Td / Tm - Move a posição do texto ou define a matriz de transformação completa do texto
  • Tj - Exibe uma string de texto
  • TJ - Exibe texto com posicionamento individual de glifos (ajustes de kerning)

A percepção crítica: não existe o conceito de "tabela", "linha" ou "coluna" na especificação PDF. O que parece uma tabela de transações bem formatada é, na verdade, dezenas de fragmentos de texto colocados em coordenadas x,y específicas na página. A ferramenta de extração deve:

  1. Analisar os operadores do fluxo de conteúdo
  2. Resolver codificações de fonte para mapear índices de glifos para caracteres Unicode
  3. Usar a matriz de texto (Tm/Td) para determinar a posição x,y de cada caractere
  4. Reconstruir palavras, linhas e colunas a partir dessas coordenadas

Uma coluna que parece perfeitamente alinhada pode estar em x=72.0 em uma linha e x=72.5 na próxima. O algoritmo de extração deve definir limites de coluna com tolerância para essas variações de subpixel.

PDFs marcados (Tagged) vs. não marcados

PDFs marcados incluem uma árvore de estrutura lógica oculta (semelhante a tags HTML) que marca o conteúdo como títulos, parágrafos, tabelas, linhas de tabela e células de tabela. Isso torna a extração significativamente mais fácil.

PDFs não marcados não possuem metadados estruturais — a ferramenta de extração obtém apenas dados brutos de posicionamento e precisa inferir tudo.

A maioria dos PDFs de extratos gerados por bancos não são marcados. Os bancos geram extratos usando sistemas de processamento em lote (Oracle BI Publisher, SAP Crystal Reports ou pipelines personalizados de impressão para PDF). Regulamentações de acessibilidade (ADA/WCAG) estão pressionando os bancos em direção a PDFs marcados, mas a adoção é lenta. Downloads padrão da maioria dos grandes bancos permanecem não marcados.


Variações de layout de extratos bancários

Não existe um padrão da indústria para a formatação de extratos em PDF. As mesmas cinco informações — data, descrição, débito, crédito, saldo — são organizadas de maneira diferente por cada banco.

Coluna de valor único (com sinal)

Data Descrição Valor Saldo
15/01/26 DEPÓSITO RECEBIDO +3.500,00 5.200,00
16/01/26 COMPRA NO DÉBITO -87,50 5.112,50

Débitos são negativos, créditos são positivos (ou vice-versa). Comum em bancos menores, cooperativas de crédito e bancos digitais. Mais simples de analisar porque há apenas uma coluna de valor para extrair.

Colunas separadas de débito/crédito

Data Descrição Saídas Entradas Saldo
15/01/26 DEPÓSITO RECEBIDO 3.500,00 5.200,00
16/01/26 COMPRA NO DÉBITO 87,50 5.112,50

Usado pelo Itaú, Bradesco e muitos bancos tradicionais. A ferramenta de extração deve identificar qual coluna contém o valor e determinar o sinal adequadamente.

Agrupado por tipo de transação

Contas empresariais e comerciais frequentemente agrupam transações:

DEPÓSITOS E OUTROS CRÉDITOS 15/01  Transferência Recebida  REF#12345 10.000,00 18/01  Depósito de Cheque #4567 2.500,00 Total de Depósitos 12.500,00
 
CHEQUES PAGOS 16/01  Cheque #1234 850,00 17/01  Cheque #1235 1.200,00 Total de Cheques Pagos 2.050,00
 
TRANSAÇÕES ELETRÔNICAS 19/01  PAGTO ACH - Fornecedor Corp 3.200,00 20/01  Transferência para Poupança 1.000,00 Total Eletrônico 4.200,00

Os cabeçalhos de seção determinam se as transações são débitos ou créditos. Linhas de resumo ("Total de Depósitos") devem ser identificadas e excluídas dos dados de transação.

Características específicas dos bancos

  • Itaú - Colunas separadas de débito/crédito; agrupa por "DEPÓSITOS E ADIÇÕES", "PAGAMENTOS ELETRÔNICOS" e "TARIFAS"; descrições de várias linhas são comuns para detalhes de estabelecimentos.
  • Bradesco - Colunas separadas de saídas/entradas; inclui uma seção de "Saldo Diário" no final; cabeçalho extenso com número da conta, período do extrato, código do banco.
  • Santander - Colunas separadas; inclui seção de "RESUMO DE SALDO DIÁRIO"; chama seu download CSV de "Delimitado por vírgula".
  • Banco do Brasil - Layout limpo de valor único para cartões de consumo; informações mínimas de cabeçalho.
  • Citibank - Frequentemente inclui detalhes de transações internacionais com valores em moeda original e taxas de conversão em linhas separadas.

Variações na disposição das colunas

Além da questão débito/crédito, a ordem das colunas não é padronizada:

  • Ordem das colunas: Data-Descrição-Valor-Saldo vs. Data-Valor-Descrição-Saldo
  • Número do cheque: Presente em contas empresariais, ausente em pessoais
  • Número de referência: Comum em extratos empresariais, raro em pessoais
  • Saldo acumulado: Por transação (mais comum) vs. subtotais diários vs. totalmente ausente

PDFs digitais vs. digitalizados

O fator mais importante que afeta a precisão da conversão é se o seu PDF é digital ou digitalizado.

PDFs digitais (nativos)

Criados programaticamente pelo sistema do seu banco quando você baixa um extrato. O texto é armazenado como operadores de fluxo de conteúdo com codificações de fonte.

  • Precisão: 99%+ para extração de texto — sem erros de reconhecimento
  • Velocidade: Milissegundos por página
  • Privacidade: Pode ser processado inteiramente no seu navegador — o arquivo nunca sai do seu dispositivo
  • Tamanho do arquivo: Normalmente 50KB–500KB por página
  • Como identificar: Você pode selecionar e destacar palavras individuais

PDFs digitalizados

Imagens de extratos em papel — criadas digitalizando ou fotografando um documento físico. O conteúdo é armazenado como imagens rasterizadas (JPEG, JPEG2000, CCITT ou compactação Flate).

  • Precisão: 95–99% com OCR profissional; 65–70% com OCR genérico
  • Velocidade: Segundos por página (requer processamento de imagem)
  • Privacidade: Normalmente requer processamento no lado do servidor (o arquivo deve ser enviado para OCR)
  • Tamanho do arquivo: 200KB–2MB+ por página
  • Como identificar: Você não consegue selecionar nenhum texto; dar zoom em 400% mostra pixelização

Por que a precisão da digitalização importa mais para dados financeiros

Uma taxa de precisão de caracteres de 97% parece excelente até que você a aplique a dados financeiros. Em um extrato com 1.000 caracteres de valores, isso significa 30 caracteres lidos incorretamente. Um único dígito lido errado altera o valor de uma transação: "$1.234,56" torna-se "$1.234,86" ou "$7.234,56". O OCR avançado atinge quase 99% de precisão, mas os erros restantes recaem desproporcionalmente sobre caracteres que parecem semelhantes: 0/O, 1/l/I, 5/S, 8/B, 6/G e, criticamente, vírgula/ponto.

Sempre prefira downloads digitais. Baixe extratos do site do seu banco em vez de digitalizar papel. Isso elimina erros de OCR completamente.


Formatos de saída: Análise detalhada

Bank Statement Output Formats Compared - Excel, CSV, QBO, OFX, QFX, JSON

Ao converter um extrato bancário, você escolhe um formato de saída. Cada formato tem diferentes pontos fortes, limitações e casos de uso ideais.

Excel (.xlsx)

Padrão: Office Open XML (OOXML), padronizado como ECMA-376 e ISO/IEC 29500.

O que é: Um arquivo .xlsx é, na verdade, um arquivo ZIP contendo arquivos XML — estrutura da pasta de trabalho, dados de células, estilos e strings compartilhadas. É por isso que ele pode armazenar tipos de dados (datas como datas, números como números), formatação, fórmulas e várias planilhas.

Por que é popular para extratos bancários:

  • Datas permanecem datas (classificáveis, filtráveis)
  • Números permanecem números (somáveis, formatáveis)
  • Fórmulas para reconciliação (SOMA, PROCV)
  • Tabelas dinâmicas para categorização de gastos
  • Formatação condicional para destacar discrepâncias
  • Compartilhamento com clientes que precisam de uma planilha legível

Limitações:

  • Máximo de 1.048.576 linhas (raramente relevante para extratos bancários)
  • Não importável diretamente na maioria dos softwares de contabilidade (use QBO/OFX em vez disso)
  • Requer Excel, Google Sheets ou LibreOffice Calc para abrir

Melhor para: Revisão manual, análise personalizada, reconciliação, arquivamento, relatórios para clientes.

CSV (Valores separados por vírgula)

Padrão: RFC 4180 (2005) - "Common Format and MIME Type for Comma-Separated Values."

Regras principais:

  • Registros delimitados por CRLF (retorno de carro + avanço de linha)
  • Campos separados por vírgulas
  • Campos contendo vírgulas, aspas ou quebras de linha devem ser colocados entre aspas duplas
  • Aspas duplas dentro de campos são escapadas duplicando-as

Variações de delimitador na prática:

  • Vírgula (,) - Padrão, usado nos EUA/Reino Unido
  • Ponto e vírgula (;) - Usado em países onde a vírgula é o separador decimal (Brasil, França, Alemanha, Itália, Espanha)
  • Tabulação (\t) - Formato TSV, evita conflitos de delimitador

Problemas de codificação:

  • UTF-8 é recomendado para interoperabilidade
  • UTF-8 BOM (Byte Order Mark): Não exigido pelo padrão, mas o Excel no Windows o exige para exibir corretamente caracteres não ASCII (letras acentuadas, símbolos de moeda). Sem o BOM, o Excel pode interpretar UTF-8 como Windows-1252, corrompendo caracteres.
  • O Excel usa ponto e vírgula em vez de vírgulas como separadores de campo em localidades europeias e brasileiras.

Limitações:

  • Sem tipos de dados — tudo é texto (números com zeros à esquerda são corrompidos, números de conta longos tornam-se notação científica)
  • Sem suporte a várias planilhas
  • Sem formatação ou fórmulas
  • Sem metadados (sem informações de conta, sem IDs de detecção de duplicatas)

Melhor para: Máxima compatibilidade — quase todos os programas de contabilidade, bancos de dados e planilhas podem importar CSV. Alternativa universal quando QBO/OFX não está disponível.

QBO (QuickBooks Web Connect)

O que é: O formato de importação para o QuickBooks (Desktop e Online). Arquivos QBO são baseados na especificação OFX com extensões específicas do QuickBooks.

Esclarecimento importante: ".QBO" NÃO significa "QuickBooks Online" — significa formato QuickBooks Web Connect e funciona tanto com o QuickBooks Desktop quanto com o QuickBooks Online.

Campos obrigatórios por transação:

  • TRNTYPE - Tipo de transação (DEBIT, CREDIT, CHECK, DEP, DIRECTDEP, DIRECTDEBIT, ATM, POS, XFER, PAYMENT, FEE, SRVCHG, INT, OTHER)
  • DTPOSTED - Data no formato AAAAMMDD
  • TRNAMT - Valor (negativo para débitos)
  • FITID - ID da transação da instituição financeira
  • NAME - Favorecido/descrição

Por que o FITID importa: O QuickBooks rastreia cada FITID já importado para cada conta. Se uma transação com o mesmo FITID for importada novamente, o QuickBooks a ignora silenciosamente — evitando entradas duplicadas quando os usuários reimportam períodos de extrato sobrepostos. Essa detecção automática de duplicatas é a maior vantagem do QBO sobre o CSV.

Dados adicionais: O QBO também carrega ID da conta, ID do banco (código de roteamento), moeda, número do cheque, memorando e saldo final — o conjunto de dados mais rico de qualquer formato de importação para o QuickBooks.

Melhor para: Usuários do QuickBooks (Desktop e Online). Oferece a experiência de importação mais rica com detecção automática de duplicatas e classificação de tipo de transação.

OFX (Open Financial Exchange)

Histórico: Criado pela Microsoft, Intuit e CheckFree. Versão 1.0 lançada em fevereiro de 1997.

Evolução da versão:

  • OFX 1.0–1.6 (1997–1999): Sintaxe baseada em SGML (sem necessidade de tags de fechamento)
  • OFX 2.0+ (2000–presente): Baseado em XML (tags de fechamento adequadas, XML bem formado)

Muitos bancos ainda produzem OFX 1.x (SGML) para máxima compatibilidade.

Governança atual: Em 2019, o consórcio OFX fundiu-se ao consórcio Financial Data Exchange (FDX), que agora gerencia a especificação. O FDX possui mais de 200 organizações membros e 76 milhões de contas de consumidores.

Por que o OFX é o padrão universal: OFX é o mesmo formato usado quando você conecta sua conta bancária diretamente ao software de contabilidade via feeds bancários — o mesmo formato funciona para importações de arquivos.

Melhor para usuários do Xero: O Xero importa automaticamente arquivos OFX sem exigir mapeamento manual de colunas. Carregue o arquivo e as transações aparecem imediatamente com datas, valores e descrições corretos. Também funciona com Wave, Sage, FreshBooks e a maioria dos softwares de contabilidade.

QFX (Quicken Financial Exchange)

O que é: Variante proprietária do OFX da Intuit, usada exclusivamente com o Quicken. Um arquivo QFX é um arquivo OFX padrão com campos proprietários adicionais.

Campo proprietário chave: INTU.BID - Identificador do Banco Quicken. Este ID numérico mapeia para um banco no banco de dados interno do Quicken. Sem ele, o Quicken recusa-se a importar o arquivo.

Diferenças do OFX padrão:

  • Requer INTU.BID no cabeçalho
  • Pode incluir outros campos prefixados com INTU.*
  • Instituições financeiras pagam uma taxa de licenciamento à Intuit para fornecer download QFX
  • O Quicken não importará arquivos OFX padrão sem o campo INTU.BID

Melhor para: Usuários do software de finanças pessoais Quicken. Formato obrigatório — nenhuma alternativa funciona.

QIF (Quicken Interchange Format)

O que é: Um formato de texto simples legado desenvolvido originalmente pela Intuit para o Quicken. Pares de tag-valor, um por linha, com tags de caractere único: D para data, T para valor, P para favorecido, L para categoria, M para memorando, N para número do cheque, ^ para fim do registro.

Por que foi substituído: O QIF carece de um mecanismo de detecção de duplicatas (sem equivalente a FITID), não possui campos de identificação de conta, informações de roteamento bancário, dados de saldo e formatação de data inconsistente entre implementações.

Ainda relevante: Alguns softwares de contabilidade (Xero, Sage, GnuCash) ainda aceitam importações QIF. Útil para migrações de sistemas legados.

JSON (JavaScript Object Notation)

Status atual: JSON ainda não é um padrão para arquivos de extratos bancários, mas é cada vez mais usado em:

  • APIs de Open Banking (Padrão de Open Banking do Reino Unido, PSD2 Berlin Group)
  • API FDX (Financial Data Exchange - sucessor do OFX, mais de 200 organizações membros)
  • Plaid, Yodlee, MX e outras APIs de agregadores de dados
  • Fluxos de trabalho de desenvolvedores e automação

Adoção crescente: Regulamentações de Open Banking (PSD2 na Europa, Seção 1033 do CFPB nos EUA) estão acelerando a adoção da API JSON. A API FDX usa JSON/REST com OAuth 2.0, representando a direção futura da troca de dados financeiros.

Melhor para: Desenvolvedores que criam fluxos de trabalho automatizados, integrações fintech, painéis personalizados e integrações de API de Open Banking.


Comparação de formatos em resumo

Formato Tipos de dados Detecção de duplicatas Info da conta Suporte a software contábil Melhor para
Excel Sim Não Não Limitado Revisão manual, análise
CSV Não Não Não Universal Máxima compatibilidade
QBO Sim Sim (FITID) Sim QuickBooks Usuários do QuickBooks
OFX Sim Sim (FITID) Sim Maioria dos softwares Xero, Wave, Sage
QFX Sim Sim (FITID) Sim Apenas Quicken Usuários do Quicken
QIF Parcial Não Não Alguns legados Migrações legadas
JSON Sim Personalizado Sim Baseado em API Desenvolvedores, automação

Compatibilidade com softwares de contabilidade

Qual formato seu software de contabilidade aceita?

Software QBO OFX QFX QIF CSV Melhor escolha
QuickBooks Online Sim Sim Sim Não Sim QBO
QuickBooks Desktop Sim Sim Sim Não Sim QBO
Quicken Não Não Sim Sim Não QFX
Xero Sim Sim Sim Sim Sim OFX
Sage Não Sim Não Sim Sim OFX
Wave Não Sim Sim Não Sim OFX
FreshBooks Não Não Não Não Sim CSV
Zoho Books Não Sim Não Sim Sim OFX
GnuCash Não Sim Não Sim Sim OFX

Regra prática: Use QBO para QuickBooks, QFX para Quicken, OFX para todo o resto e CSV como alternativa universal.


Diferenças de formato internacional

Se você trabalha com extratos bancários internacionais, encontrará diferenças de formatação que confundem a maioria das ferramentas de conversão.

Formatos de data

Região Formato Exemplo Notas
Estados Unidos MM/DD/AAAA 03/15/2026 Mês primeiro
Europa, América Latina DD/MM/AAAA 15/03/2026 Dia primeiro
Alemanha DD.MM.AAAA 15.03.2026 Separador de ponto
Japão AAAA年MM月DD日 2026年03月01日 Ano primeiro com kanji
China AAAA年MM月DD日 2026年3月1日 Semelhante ao Japão
ISO 8601 AAAA-MM-DD 2026-03-15 Padrão internacional inequívoco

O problema da ambiguidade: "03/04/2026" é 4 de março nos EUA, mas 3 de abril na Europa. Quando todas as datas em um extrato têm valores de dia de 12 ou menos, não há maneira algorítmica de determinar o formato correto sem saber o país de origem. Ferramentas de conversão devem verificar todas as datas no extrato, procurando valores maiores que 12 para determinar o formato.

Formatos de número

Região Mil e cinquenta centavos Notas
EUA, Reino Unido, Austrália, Japão 1.000,50 Vírgula para milhares, ponto para decimal
Alemanha, França, Espanha, Brasil, Itália 1.000,50 Ponto para milhares, vírgula para decimal
Suíça 1'000.50 Apóstrofo para milhares
Índia 1,00,000.50 Sistema de agrupamento Lakh
Escandinávia 1 000,50 Espaço para milhares, vírgula para decimal

"10.000,45" de um banco europeu ou brasileiro significa dez mil e quarenta e cinco centavos — não dez ponto zero zero zero quatro cinco. Errar isso produz erros de magnitude de 10.000x.

Posicionamento do símbolo de moeda

  • EUA/Reino Unido: Símbolo antes do valor: $1.234,56 / £1.234,56
  • França, Alemanha, Espanha, Brasil: Símbolo depois do valor: 1.234,56 € / R$ 1.234,56
  • Irlanda, Países Baixos: Símbolo antes: €1.234,56
  • Japão: Símbolo antes: ¥123.456

Codificações de caracteres

  • UTF-8 - Padrão universal, suporta todos os scripts
  • GBK/GB2312 - Chinês simplificado (usado por bancos chineses)
  • Shift_JIS - Japonês (usado por bancos japoneses)
  • Big5 - Chinês tradicional (Taiwan, Hong Kong)
  • EUC-KR - Coreano
  • ISO 8859-1 - Europa Ocidental
  • Windows-1252 - Europa Ocidental (legado)
  • Windows-1256 - Árabe

Abrir um extrato bancário chinês ou japonês em um sistema dos EUA sem a detecção de codificação correta produz caracteres ilegíveis. O PDFSub lida com mais de 130 idiomas com detecção automática de formatos de data, formatos de número e codificações de caracteres — incluindo árabe e hebraico da direita para a esquerda, caracteres CJK e todos os conjuntos de caracteres europeus.


Elementos comuns de extratos bancários

Data da transação vs. Data de lançamento vs. Data de valor

Extratos bancários podem incluir várias datas para uma única transação:

  • Data da transação - Quando a compra ou transferência realmente ocorreu
  • Data de lançamento - Quando o banco processou e registrou (normalmente 1–3 dias úteis depois para compras com cartão de crédito)
  • Data de valor - Quando os fundos realmente ficaram disponíveis (afeta cálculos de juros, comum em bancos internacionais)

A maioria dos extratos de consumo mostra apenas a data de lançamento. Extratos empresariais frequentemente incluem tanto a data da transação quanto a de lançamento.

Representação de débito/crédito

Bancos representam débitos e créditos de forma diferente:

  • Valores com sinal: -87,50 para débitos, +3.500,00 para créditos
  • Colunas separadas: "Saídas" e "Entradas"
  • Abreviações: "DB" para débito, "CR" para crédito
  • Parênteses: (87,50) para débitos (convenção contábil)

Saldo acumulado

  • Saldo por transação - Atualizado após cada transação (mais comum em extratos de consumo)
  • Saldo diário apenas - Saldo mostrado no final de cada dia (comum em extratos empresariais)
  • Sem saldo acumulado - Apenas saldos inicial e final (alguns extratos internacionais)

Saldos acumulados são valiosos para validação: você pode verificar se cada transação move corretamente o saldo de uma linha para a próxima.

Informações padrão de cabeçalho

A maioria dos extratos bancários inclui: nome do titular da conta, número da conta (frequentemente parcialmente mascarado), período do extrato, saldos inicial e final, total de depósitos e saídas, e código do banco/agência/SWIFT BIC.


Proteção por senha

Como os bancos criptografam PDFs

Os bancos normalmente usam criptografia AES-128 ou AES-256. Existem dois modos de proteção:

  • Senha de usuário (senha de abertura): Necessária para abrir o arquivo
  • Senha de proprietário (senha de permissões): O PDF abre, mas a edição/cópia pode ser restrita

Padrões comuns de senha

Banco Senha típica
Itaú CPF ou senha eletrônica
Bradesco CPF ou data de nascimento
Santander CPF ou código de acesso
Caixa CPF ou data de nascimento

Outros padrões comuns incluem os últimos 4 dígitos do número da conta, ID do cliente ou número do membro. Os bancos normalmente comunicam o padrão de senha quando você ativa os extratos eletrônicos pela primeira vez.


Desafios de extratos de várias páginas

Extratos longos (contas empresariais com centenas de transações) criam vários desafios de extração:

Transações divididas

Uma descrição de transação pode começar na parte inferior de uma página e continuar no topo da próxima. O conversor deve detectar linhas de continuação e mesclá-las em uma única transação.

Cabeçalhos e rodapés repetidos

A maioria dos bancos repete cabeçalhos de coluna em todas as páginas, além de números de página, avisos legais e texto de marketing. Estes devem ser identificados e excluídos dos dados de transação.

Linhas de continuação

Muitas transações têm descrições de várias linhas:

15/01  PAGTO ELETRÔNICO FORNECEDOR CORP $3.200,00  $2.000,00 REF#123456789 FATURA 2026-001 CONTAS A PAGAR FORNECEDOR CORP

As linhas 2 e 3 são linhas de continuação pertencentes à transação na linha 1. Elas normalmente não possuem data e valor, aparecendo recuadas na mesma coordenada x que a coluna de descrição.

Saldo transportado

Alguns bancos incluem linhas de "Saldo Anterior" ou "Saldo Transportado" no topo das páginas de continuação. Estas são informativas, não transações, e devem ser excluídas dos dados extraídos.


Abreviações comuns de transações

Extratos bancários usam abreviações que variam entre as instituições:

Abreviação Significado
ACH Automated Clearing House (transferências eletrônicas)
ATM Caixa Eletrônico
POS Ponto de Venda (cartão de débito)
EFT Transferência Eletrônica de Fundos
INT Pagamento de juros
CHK / CK Cheque
WD / W/D Saque
DEP Depósito
DD Depósito Direto
OD Cheque especial
NSF Fundos insuficientes
SRVCHG Tarifa de serviço
XFER Transferência

Padrões da indústria que você deve conhecer

Esses formatos são usados em bancos corporativos e gestão de tesouraria. Você raramente os encontrará diretamente, mas compreendê-los explica por que os extratos bancários funcionam da maneira que funcionam.

BAI2 (Bank Administration Institute)

Usado para gestão de caixa automatizada e reconciliação bancária em sistemas ERP (SAP, Oracle). Um formato ASCII de largura fixa com códigos de tipo de transação (ex: 165 = crédito ACH pré-autorizado, 455 = débito ACH, 495 = transferência bancária enviada). Lançado originalmente em 1987, agora mantido pela ASC X9.

SWIFT MT940 / MT942

Extratos bancários de fim de dia (MT940) e intradia (MT942) usados por bancos em todo o mundo para clientes corporativos e departamentos de tesouraria. O SWIFT processa aproximadamente 45 milhões de mensagens por dia. Formato baseado em tags com identificadores de campo delimitados por dois pontos.

ISO 20022 (camt.053)

O substituto moderno baseado em XML para o MT940. Parte do padrão universal de mensagens financeiras ISO 20022. Dados mais ricos que o MT940, sem limites de comprimento de campo, XML analisável por máquina com validação XSD. O SWIFT está migrando de mensagens MT para ISO 20022. O SEPA (Single Euro Payments Area) exige o formato camt para pagamentos europeus.

NACHA ACH

O formato de arquivo para transações Automated Clearing House nos EUA. ASCII de largura fixa, exatamente 94 caracteres por linha. O ACH processa aproximadamente 30 bilhões de transações por ano nos EUA. Quando seu extrato bancário mostra "ACH CREDIT" ou "ACH DEBIT", a transação subjacente foi transmitida no formato NACHA entre bancos.


Escolhendo o formato certo para seu fluxo de trabalho

Guia de decisão

Use QBO se: Você usa o QuickBooks (Desktop ou Online). Você obtém classificação de tipo de transação, detecção de duplicatas via FITID e os metadados de importação mais ricos.

Use OFX se: Você usa o Xero, Sage, Wave ou outro software compatível com OFX. O Xero mapeia campos automaticamente sem configuração manual de colunas.

Use QFX se: Você usa o Quicken. É o único formato que o Quicken aceita.

Use Excel se: Você precisa revisar, analisar ou manipular dados antes de importar. Crie tabelas dinâmicas, execute fórmulas ou prepare relatórios.

Use CSV se: Seu software não está listado acima ou você precisa de máxima compatibilidade entre sistemas. Esteja preparado para mapear colunas manualmente.

Use JSON se: Você está criando fluxos de trabalho automatizados, integrações de API ou sistemas de relatórios personalizados.

Dicas profissionais

  • Sempre use QBO/OFX em vez de CSV quando seu software suportar — a detecção de duplicatas por si só evita horas de limpeza
  • Mantenha o PDF original ao lado do seu arquivo convertido — é sua trilha de auditoria e documento de origem
  • Verifique após cada importação — confira os saldos inicial/final e algumas transações aleatórias
  • Combine o formato com o software — usar o formato nativo da sua plataforma contábil evita o mapeamento manual de colunas e habilita recursos automáticos

Experimente gratuitamente

Pronto para converter seu primeiro extrato? Envie um PDF agora - O PDFSub converte para Excel, CSV, QBO, OFX, QFX e JSON. Extratos digitais são processados inteiramente no seu navegador para máxima privacidade. Inicie um teste gratuito de 7 dias com acesso total a todos os formatos.

Voltar ao Blog

Perguntas? Entre em contato conosco

PDFSub

Todas as ferramentas de PDF e documentos que você precisa em um só lugar. Rápido, seguro e privado.

Em Conformidade com GDPREm Conformidade com CCPAPronto para SOC 2
Alimentado pelo PDFSub Engine

Produto

  • Todas as Ferramentas
  • Funcionalidades
  • Extratos Bancários
  • API
  • Preços
  • FAQ
  • Blog

Suporte

  • Sobre
  • Central de Ajuda
  • Contato
  • FAQ

Legal

  • Política de Privacidade
  • Termos de Serviço
  • Política de Cookies

© 2026 PDFSub. Todos os direitos reservados.

Feito na América com para pessoas em todo o mundo