Compreendendo os formatos de extratos bancários: O guia técnico
PDF não é um formato de dados, é um formato de exibição. É por isso que extrair dados de transações de extratos bancários é surpreendentemente difícil. Este guia explica o que há dentro de um PDF de extrato bancário, os formatos de saída disponíveis (Excel, CSV, QBO, OFX, QFX, JSON) e como escolher o correto.

Um PDF de extrato bancário parece simples: datas, descrições, valores e saldos em colunas organizadas. Mas, por trás dessa aparência, reside um formato de documento (PDF) que nunca foi projetado para armazenar dados estruturados — e um processo de conversão que exige a compreensão tanto do formato de entrada quanto dos diversos formatos de saída disponíveis.
Este guia aborda as 12 seções que aparecem em todos os extratos bancários (independentemente do banco), a realidade técnica dos PDFs de extratos, as variações de layout entre instituições, todos os formatos de saída que você encontrará (Excel, CSV, QBO, OFX, QFX, QIF, JSON), diferenças de formatação internacional e os padrões da indústria que regem a troca de dados financeiros.
Anatomia de um extrato bancário
Todo extrato bancário — Itaú, Bradesco, Santander, Banco do Brasil, Caixa, não importa — é construído a partir das mesmas 12 seções. Os rótulos mudam ("Débitos" vs "Saídas"), a disposição das colunas varia, mas a estrutura subjacente é consistente. Uma vez que você consegue identificar essas seções, todo extrato parece familiar.

Deseja usar este infográfico em seu blog? Copie este código de incorporação:
Para análises detalhadas específicas sobre como cada grande banco organiza essas 12 seções, veja:
- Extrato do Itaú explicado
- Extrato do Bradesco explicado
- Extrato do Santander explicado
- Extrato do Banco do Brasil explicado
- Extrato da Caixa explicado
Por que o PDF não é um formato de dados
PDF significa Portable Document Format (Formato de Documento Portátil), padronizado como ISO 32000 (a versão 2.0 tornou-se ISO 32000-2:2020). Ele foi projetado para um único propósito: fazer com que documentos pareçam idênticos em qualquer tela ou impressora. Isso é ótimo para fidelidade visual — e terrível para extração de dados.
O que há realmente dentro de um PDF de extrato bancário
Dentro de cada página PDF existe um fluxo de conteúdo — uma sequência de operadores de desenho escritos em uma linguagem semelhante ao PostScript. O texto é renderizado usando operadores específicos:
- BT / ET - Begin Text / End Text: limites de um objeto de texto
- Tf - Define fonte e tamanho
- Td / Tm - Move a posição do texto ou define a matriz de transformação completa do texto
- Tj - Exibe uma string de texto
- TJ - Exibe texto com posicionamento individual de glifos (ajustes de kerning)
A percepção crítica: não existe o conceito de "tabela", "linha" ou "coluna" na especificação PDF. O que parece uma tabela de transações bem formatada é, na verdade, dezenas de fragmentos de texto colocados em coordenadas x,y específicas na página. A ferramenta de extração deve:
- Analisar os operadores do fluxo de conteúdo
- Resolver codificações de fonte para mapear índices de glifos para caracteres Unicode
- Usar a matriz de texto (Tm/Td) para determinar a posição x,y de cada caractere
- Reconstruir palavras, linhas e colunas a partir dessas coordenadas
Uma coluna que parece perfeitamente alinhada pode estar em x=72.0 em uma linha e x=72.5 na próxima. O algoritmo de extração deve definir limites de coluna com tolerância para essas variações de subpixel.
PDFs marcados (Tagged) vs. não marcados
PDFs marcados incluem uma árvore de estrutura lógica oculta (semelhante a tags HTML) que marca o conteúdo como títulos, parágrafos, tabelas, linhas de tabela e células de tabela. Isso torna a extração significativamente mais fácil.
PDFs não marcados não possuem metadados estruturais — a ferramenta de extração obtém apenas dados brutos de posicionamento e precisa inferir tudo.
A maioria dos PDFs de extratos gerados por bancos não são marcados. Os bancos geram extratos usando sistemas de processamento em lote (Oracle BI Publisher, SAP Crystal Reports ou pipelines personalizados de impressão para PDF). Regulamentações de acessibilidade (ADA/WCAG) estão pressionando os bancos em direção a PDFs marcados, mas a adoção é lenta. Downloads padrão da maioria dos grandes bancos permanecem não marcados.
Variações de layout de extratos bancários
Não existe um padrão da indústria para a formatação de extratos em PDF. As mesmas cinco informações — data, descrição, débito, crédito, saldo — são organizadas de maneira diferente por cada banco.
Coluna de valor único (com sinal)
Data Descrição Valor Saldo
15/01/26 DEPÓSITO RECEBIDO +3.500,00 5.200,00
16/01/26 COMPRA NO DÉBITO -87,50 5.112,50Débitos são negativos, créditos são positivos (ou vice-versa). Comum em bancos menores, cooperativas de crédito e bancos digitais. Mais simples de analisar porque há apenas uma coluna de valor para extrair.
Colunas separadas de débito/crédito
Data Descrição Saídas Entradas Saldo
15/01/26 DEPÓSITO RECEBIDO 3.500,00 5.200,00
16/01/26 COMPRA NO DÉBITO 87,50 5.112,50Usado pelo Itaú, Bradesco e muitos bancos tradicionais. A ferramenta de extração deve identificar qual coluna contém o valor e determinar o sinal adequadamente.
Agrupado por tipo de transação
Contas empresariais e comerciais frequentemente agrupam transações:
DEPÓSITOS E OUTROS CRÉDITOS 15/01 Transferência Recebida REF#12345 10.000,00 18/01 Depósito de Cheque #4567 2.500,00 Total de Depósitos 12.500,00
CHEQUES PAGOS 16/01 Cheque #1234 850,00 17/01 Cheque #1235 1.200,00 Total de Cheques Pagos 2.050,00
TRANSAÇÕES ELETRÔNICAS 19/01 PAGTO ACH - Fornecedor Corp 3.200,00 20/01 Transferência para Poupança 1.000,00 Total Eletrônico 4.200,00Os cabeçalhos de seção determinam se as transações são débitos ou créditos. Linhas de resumo ("Total de Depósitos") devem ser identificadas e excluídas dos dados de transação.
Características específicas dos bancos
- Itaú - Colunas separadas de débito/crédito; agrupa por "DEPÓSITOS E ADIÇÕES", "PAGAMENTOS ELETRÔNICOS" e "TARIFAS"; descrições de várias linhas são comuns para detalhes de estabelecimentos.
- Bradesco - Colunas separadas de saídas/entradas; inclui uma seção de "Saldo Diário" no final; cabeçalho extenso com número da conta, período do extrato, código do banco.
- Santander - Colunas separadas; inclui seção de "RESUMO DE SALDO DIÁRIO"; chama seu download CSV de "Delimitado por vírgula".
- Banco do Brasil - Layout limpo de valor único para cartões de consumo; informações mínimas de cabeçalho.
- Citibank - Frequentemente inclui detalhes de transações internacionais com valores em moeda original e taxas de conversão em linhas separadas.
Variações na disposição das colunas
Além da questão débito/crédito, a ordem das colunas não é padronizada:
- Ordem das colunas: Data-Descrição-Valor-Saldo vs. Data-Valor-Descrição-Saldo
- Número do cheque: Presente em contas empresariais, ausente em pessoais
- Número de referência: Comum em extratos empresariais, raro em pessoais
- Saldo acumulado: Por transação (mais comum) vs. subtotais diários vs. totalmente ausente
PDFs digitais vs. digitalizados
O fator mais importante que afeta a precisão da conversão é se o seu PDF é digital ou digitalizado.
PDFs digitais (nativos)
Criados programaticamente pelo sistema do seu banco quando você baixa um extrato. O texto é armazenado como operadores de fluxo de conteúdo com codificações de fonte.
- Precisão: 99%+ para extração de texto — sem erros de reconhecimento
- Velocidade: Milissegundos por página
- Privacidade: Pode ser processado inteiramente no seu navegador — o arquivo nunca sai do seu dispositivo
- Tamanho do arquivo: Normalmente 50KB–500KB por página
- Como identificar: Você pode selecionar e destacar palavras individuais
PDFs digitalizados
Imagens de extratos em papel — criadas digitalizando ou fotografando um documento físico. O conteúdo é armazenado como imagens rasterizadas (JPEG, JPEG2000, CCITT ou compactação Flate).
- Precisão: 95–99% com OCR profissional; 65–70% com OCR genérico
- Velocidade: Segundos por página (requer processamento de imagem)
- Privacidade: Normalmente requer processamento no lado do servidor (o arquivo deve ser enviado para OCR)
- Tamanho do arquivo: 200KB–2MB+ por página
- Como identificar: Você não consegue selecionar nenhum texto; dar zoom em 400% mostra pixelização
Por que a precisão da digitalização importa mais para dados financeiros
Uma taxa de precisão de caracteres de 97% parece excelente até que você a aplique a dados financeiros. Em um extrato com 1.000 caracteres de valores, isso significa 30 caracteres lidos incorretamente. Um único dígito lido errado altera o valor de uma transação: "$1.234,56" torna-se "$1.234,86" ou "$7.234,56". O OCR avançado atinge quase 99% de precisão, mas os erros restantes recaem desproporcionalmente sobre caracteres que parecem semelhantes: 0/O, 1/l/I, 5/S, 8/B, 6/G e, criticamente, vírgula/ponto.
Sempre prefira downloads digitais. Baixe extratos do site do seu banco em vez de digitalizar papel. Isso elimina erros de OCR completamente.
Formatos de saída: Análise detalhada

Ao converter um extrato bancário, você escolhe um formato de saída. Cada formato tem diferentes pontos fortes, limitações e casos de uso ideais.
Excel (.xlsx)
Padrão: Office Open XML (OOXML), padronizado como ECMA-376 e ISO/IEC 29500.
O que é: Um arquivo .xlsx é, na verdade, um arquivo ZIP contendo arquivos XML — estrutura da pasta de trabalho, dados de células, estilos e strings compartilhadas. É por isso que ele pode armazenar tipos de dados (datas como datas, números como números), formatação, fórmulas e várias planilhas.
Por que é popular para extratos bancários:
- Datas permanecem datas (classificáveis, filtráveis)
- Números permanecem números (somáveis, formatáveis)
- Fórmulas para reconciliação (SOMA, PROCV)
- Tabelas dinâmicas para categorização de gastos
- Formatação condicional para destacar discrepâncias
- Compartilhamento com clientes que precisam de uma planilha legível
Limitações:
- Máximo de 1.048.576 linhas (raramente relevante para extratos bancários)
- Não importável diretamente na maioria dos softwares de contabilidade (use QBO/OFX em vez disso)
- Requer Excel, Google Sheets ou LibreOffice Calc para abrir
Melhor para: Revisão manual, análise personalizada, reconciliação, arquivamento, relatórios para clientes.
CSV (Valores separados por vírgula)
Padrão: RFC 4180 (2005) - "Common Format and MIME Type for Comma-Separated Values."
Regras principais:
- Registros delimitados por CRLF (retorno de carro + avanço de linha)
- Campos separados por vírgulas
- Campos contendo vírgulas, aspas ou quebras de linha devem ser colocados entre aspas duplas
- Aspas duplas dentro de campos são escapadas duplicando-as
Variações de delimitador na prática:
- Vírgula (
,) - Padrão, usado nos EUA/Reino Unido - Ponto e vírgula (
;) - Usado em países onde a vírgula é o separador decimal (Brasil, França, Alemanha, Itália, Espanha) - Tabulação (
\t) - Formato TSV, evita conflitos de delimitador
Problemas de codificação:
- UTF-8 é recomendado para interoperabilidade
- UTF-8 BOM (Byte Order Mark): Não exigido pelo padrão, mas o Excel no Windows o exige para exibir corretamente caracteres não ASCII (letras acentuadas, símbolos de moeda). Sem o BOM, o Excel pode interpretar UTF-8 como Windows-1252, corrompendo caracteres.
- O Excel usa ponto e vírgula em vez de vírgulas como separadores de campo em localidades europeias e brasileiras.
Limitações:
- Sem tipos de dados — tudo é texto (números com zeros à esquerda são corrompidos, números de conta longos tornam-se notação científica)
- Sem suporte a várias planilhas
- Sem formatação ou fórmulas
- Sem metadados (sem informações de conta, sem IDs de detecção de duplicatas)
Melhor para: Máxima compatibilidade — quase todos os programas de contabilidade, bancos de dados e planilhas podem importar CSV. Alternativa universal quando QBO/OFX não está disponível.
QBO (QuickBooks Web Connect)
O que é: O formato de importação para o QuickBooks (Desktop e Online). Arquivos QBO são baseados na especificação OFX com extensões específicas do QuickBooks.
Esclarecimento importante: ".QBO" NÃO significa "QuickBooks Online" — significa formato QuickBooks Web Connect e funciona tanto com o QuickBooks Desktop quanto com o QuickBooks Online.
Campos obrigatórios por transação:
TRNTYPE- Tipo de transação (DEBIT, CREDIT, CHECK, DEP, DIRECTDEP, DIRECTDEBIT, ATM, POS, XFER, PAYMENT, FEE, SRVCHG, INT, OTHER)DTPOSTED- Data no formato AAAAMMDDTRNAMT- Valor (negativo para débitos)FITID- ID da transação da instituição financeiraNAME- Favorecido/descrição
Por que o FITID importa: O QuickBooks rastreia cada FITID já importado para cada conta. Se uma transação com o mesmo FITID for importada novamente, o QuickBooks a ignora silenciosamente — evitando entradas duplicadas quando os usuários reimportam períodos de extrato sobrepostos. Essa detecção automática de duplicatas é a maior vantagem do QBO sobre o CSV.
Dados adicionais: O QBO também carrega ID da conta, ID do banco (código de roteamento), moeda, número do cheque, memorando e saldo final — o conjunto de dados mais rico de qualquer formato de importação para o QuickBooks.
Melhor para: Usuários do QuickBooks (Desktop e Online). Oferece a experiência de importação mais rica com detecção automática de duplicatas e classificação de tipo de transação.
OFX (Open Financial Exchange)
Histórico: Criado pela Microsoft, Intuit e CheckFree. Versão 1.0 lançada em fevereiro de 1997.
Evolução da versão:
- OFX 1.0–1.6 (1997–1999): Sintaxe baseada em SGML (sem necessidade de tags de fechamento)
- OFX 2.0+ (2000–presente): Baseado em XML (tags de fechamento adequadas, XML bem formado)
Muitos bancos ainda produzem OFX 1.x (SGML) para máxima compatibilidade.
Governança atual: Em 2019, o consórcio OFX fundiu-se ao consórcio Financial Data Exchange (FDX), que agora gerencia a especificação. O FDX possui mais de 200 organizações membros e 76 milhões de contas de consumidores.
Por que o OFX é o padrão universal: OFX é o mesmo formato usado quando você conecta sua conta bancária diretamente ao software de contabilidade via feeds bancários — o mesmo formato funciona para importações de arquivos.
Melhor para usuários do Xero: O Xero importa automaticamente arquivos OFX sem exigir mapeamento manual de colunas. Carregue o arquivo e as transações aparecem imediatamente com datas, valores e descrições corretos. Também funciona com Wave, Sage, FreshBooks e a maioria dos softwares de contabilidade.
QFX (Quicken Financial Exchange)
O que é: Variante proprietária do OFX da Intuit, usada exclusivamente com o Quicken. Um arquivo QFX é um arquivo OFX padrão com campos proprietários adicionais.
Campo proprietário chave: INTU.BID - Identificador do Banco Quicken. Este ID numérico mapeia para um banco no banco de dados interno do Quicken. Sem ele, o Quicken recusa-se a importar o arquivo.
Diferenças do OFX padrão:
- Requer INTU.BID no cabeçalho
- Pode incluir outros campos prefixados com INTU.*
- Instituições financeiras pagam uma taxa de licenciamento à Intuit para fornecer download QFX
- O Quicken não importará arquivos OFX padrão sem o campo INTU.BID
Melhor para: Usuários do software de finanças pessoais Quicken. Formato obrigatório — nenhuma alternativa funciona.
QIF (Quicken Interchange Format)
O que é: Um formato de texto simples legado desenvolvido originalmente pela Intuit para o Quicken. Pares de tag-valor, um por linha, com tags de caractere único: D para data, T para valor, P para favorecido, L para categoria, M para memorando, N para número do cheque, ^ para fim do registro.
Por que foi substituído: O QIF carece de um mecanismo de detecção de duplicatas (sem equivalente a FITID), não possui campos de identificação de conta, informações de roteamento bancário, dados de saldo e formatação de data inconsistente entre implementações.
Ainda relevante: Alguns softwares de contabilidade (Xero, Sage, GnuCash) ainda aceitam importações QIF. Útil para migrações de sistemas legados.
JSON (JavaScript Object Notation)
Status atual: JSON ainda não é um padrão para arquivos de extratos bancários, mas é cada vez mais usado em:
- APIs de Open Banking (Padrão de Open Banking do Reino Unido, PSD2 Berlin Group)
- API FDX (Financial Data Exchange - sucessor do OFX, mais de 200 organizações membros)
- Plaid, Yodlee, MX e outras APIs de agregadores de dados
- Fluxos de trabalho de desenvolvedores e automação
Adoção crescente: Regulamentações de Open Banking (PSD2 na Europa, Seção 1033 do CFPB nos EUA) estão acelerando a adoção da API JSON. A API FDX usa JSON/REST com OAuth 2.0, representando a direção futura da troca de dados financeiros.
Melhor para: Desenvolvedores que criam fluxos de trabalho automatizados, integrações fintech, painéis personalizados e integrações de API de Open Banking.
Comparação de formatos em resumo
| Formato | Tipos de dados | Detecção de duplicatas | Info da conta | Suporte a software contábil | Melhor para |
|---|---|---|---|---|---|
| Excel | Sim | Não | Não | Limitado | Revisão manual, análise |
| CSV | Não | Não | Não | Universal | Máxima compatibilidade |
| QBO | Sim | Sim (FITID) | Sim | QuickBooks | Usuários do QuickBooks |
| OFX | Sim | Sim (FITID) | Sim | Maioria dos softwares | Xero, Wave, Sage |
| QFX | Sim | Sim (FITID) | Sim | Apenas Quicken | Usuários do Quicken |
| QIF | Parcial | Não | Não | Alguns legados | Migrações legadas |
| JSON | Sim | Personalizado | Sim | Baseado em API | Desenvolvedores, automação |
Compatibilidade com softwares de contabilidade
Qual formato seu software de contabilidade aceita?
| Software | QBO | OFX | QFX | QIF | CSV | Melhor escolha |
|---|---|---|---|---|---|---|
| QuickBooks Online | Sim | Sim | Sim | Não | Sim | QBO |
| QuickBooks Desktop | Sim | Sim | Sim | Não | Sim | QBO |
| Quicken | Não | Não | Sim | Sim | Não | QFX |
| Xero | Sim | Sim | Sim | Sim | Sim | OFX |
| Sage | Não | Sim | Não | Sim | Sim | OFX |
| Wave | Não | Sim | Sim | Não | Sim | OFX |
| FreshBooks | Não | Não | Não | Não | Sim | CSV |
| Zoho Books | Não | Sim | Não | Sim | Sim | OFX |
| GnuCash | Não | Sim | Não | Sim | Sim | OFX |
Regra prática: Use QBO para QuickBooks, QFX para Quicken, OFX para todo o resto e CSV como alternativa universal.
Diferenças de formato internacional
Se você trabalha com extratos bancários internacionais, encontrará diferenças de formatação que confundem a maioria das ferramentas de conversão.
Formatos de data
| Região | Formato | Exemplo | Notas |
|---|---|---|---|
| Estados Unidos | MM/DD/AAAA | 03/15/2026 | Mês primeiro |
| Europa, América Latina | DD/MM/AAAA | 15/03/2026 | Dia primeiro |
| Alemanha | DD.MM.AAAA | 15.03.2026 | Separador de ponto |
| Japão | AAAA年MM月DD日 | 2026年03月01日 | Ano primeiro com kanji |
| China | AAAA年MM月DD日 | 2026年3月1日 | Semelhante ao Japão |
| ISO 8601 | AAAA-MM-DD | 2026-03-15 | Padrão internacional inequívoco |
O problema da ambiguidade: "03/04/2026" é 4 de março nos EUA, mas 3 de abril na Europa. Quando todas as datas em um extrato têm valores de dia de 12 ou menos, não há maneira algorítmica de determinar o formato correto sem saber o país de origem. Ferramentas de conversão devem verificar todas as datas no extrato, procurando valores maiores que 12 para determinar o formato.
Formatos de número
| Região | Mil e cinquenta centavos | Notas |
|---|---|---|
| EUA, Reino Unido, Austrália, Japão | 1.000,50 | Vírgula para milhares, ponto para decimal |
| Alemanha, França, Espanha, Brasil, Itália | 1.000,50 | Ponto para milhares, vírgula para decimal |
| Suíça | 1'000.50 | Apóstrofo para milhares |
| Índia | 1,00,000.50 | Sistema de agrupamento Lakh |
| Escandinávia | 1 000,50 | Espaço para milhares, vírgula para decimal |
"10.000,45" de um banco europeu ou brasileiro significa dez mil e quarenta e cinco centavos — não dez ponto zero zero zero quatro cinco. Errar isso produz erros de magnitude de 10.000x.
Posicionamento do símbolo de moeda
- EUA/Reino Unido: Símbolo antes do valor: $1.234,56 / £1.234,56
- França, Alemanha, Espanha, Brasil: Símbolo depois do valor: 1.234,56 € / R$ 1.234,56
- Irlanda, Países Baixos: Símbolo antes: €1.234,56
- Japão: Símbolo antes: ¥123.456
Codificações de caracteres
- UTF-8 - Padrão universal, suporta todos os scripts
- GBK/GB2312 - Chinês simplificado (usado por bancos chineses)
- Shift_JIS - Japonês (usado por bancos japoneses)
- Big5 - Chinês tradicional (Taiwan, Hong Kong)
- EUC-KR - Coreano
- ISO 8859-1 - Europa Ocidental
- Windows-1252 - Europa Ocidental (legado)
- Windows-1256 - Árabe
Abrir um extrato bancário chinês ou japonês em um sistema dos EUA sem a detecção de codificação correta produz caracteres ilegíveis. O PDFSub lida com mais de 130 idiomas com detecção automática de formatos de data, formatos de número e codificações de caracteres — incluindo árabe e hebraico da direita para a esquerda, caracteres CJK e todos os conjuntos de caracteres europeus.
Elementos comuns de extratos bancários
Data da transação vs. Data de lançamento vs. Data de valor
Extratos bancários podem incluir várias datas para uma única transação:
- Data da transação - Quando a compra ou transferência realmente ocorreu
- Data de lançamento - Quando o banco processou e registrou (normalmente 1–3 dias úteis depois para compras com cartão de crédito)
- Data de valor - Quando os fundos realmente ficaram disponíveis (afeta cálculos de juros, comum em bancos internacionais)
A maioria dos extratos de consumo mostra apenas a data de lançamento. Extratos empresariais frequentemente incluem tanto a data da transação quanto a de lançamento.
Representação de débito/crédito
Bancos representam débitos e créditos de forma diferente:
- Valores com sinal: -87,50 para débitos, +3.500,00 para créditos
- Colunas separadas: "Saídas" e "Entradas"
- Abreviações: "DB" para débito, "CR" para crédito
- Parênteses: (87,50) para débitos (convenção contábil)
Saldo acumulado
- Saldo por transação - Atualizado após cada transação (mais comum em extratos de consumo)
- Saldo diário apenas - Saldo mostrado no final de cada dia (comum em extratos empresariais)
- Sem saldo acumulado - Apenas saldos inicial e final (alguns extratos internacionais)
Saldos acumulados são valiosos para validação: você pode verificar se cada transação move corretamente o saldo de uma linha para a próxima.
Informações padrão de cabeçalho
A maioria dos extratos bancários inclui: nome do titular da conta, número da conta (frequentemente parcialmente mascarado), período do extrato, saldos inicial e final, total de depósitos e saídas, e código do banco/agência/SWIFT BIC.
Proteção por senha
Como os bancos criptografam PDFs
Os bancos normalmente usam criptografia AES-128 ou AES-256. Existem dois modos de proteção:
- Senha de usuário (senha de abertura): Necessária para abrir o arquivo
- Senha de proprietário (senha de permissões): O PDF abre, mas a edição/cópia pode ser restrita
Padrões comuns de senha
| Banco | Senha típica |
|---|---|
| Itaú | CPF ou senha eletrônica |
| Bradesco | CPF ou data de nascimento |
| Santander | CPF ou código de acesso |
| Caixa | CPF ou data de nascimento |
Outros padrões comuns incluem os últimos 4 dígitos do número da conta, ID do cliente ou número do membro. Os bancos normalmente comunicam o padrão de senha quando você ativa os extratos eletrônicos pela primeira vez.
Desafios de extratos de várias páginas
Extratos longos (contas empresariais com centenas de transações) criam vários desafios de extração:
Transações divididas
Uma descrição de transação pode começar na parte inferior de uma página e continuar no topo da próxima. O conversor deve detectar linhas de continuação e mesclá-las em uma única transação.
Cabeçalhos e rodapés repetidos
A maioria dos bancos repete cabeçalhos de coluna em todas as páginas, além de números de página, avisos legais e texto de marketing. Estes devem ser identificados e excluídos dos dados de transação.
Linhas de continuação
Muitas transações têm descrições de várias linhas:
15/01 PAGTO ELETRÔNICO FORNECEDOR CORP $3.200,00 $2.000,00 REF#123456789 FATURA 2026-001 CONTAS A PAGAR FORNECEDOR CORPAs linhas 2 e 3 são linhas de continuação pertencentes à transação na linha 1. Elas normalmente não possuem data e valor, aparecendo recuadas na mesma coordenada x que a coluna de descrição.
Saldo transportado
Alguns bancos incluem linhas de "Saldo Anterior" ou "Saldo Transportado" no topo das páginas de continuação. Estas são informativas, não transações, e devem ser excluídas dos dados extraídos.
Abreviações comuns de transações
Extratos bancários usam abreviações que variam entre as instituições:
| Abreviação | Significado |
|---|---|
| ACH | Automated Clearing House (transferências eletrônicas) |
| ATM | Caixa Eletrônico |
| POS | Ponto de Venda (cartão de débito) |
| EFT | Transferência Eletrônica de Fundos |
| INT | Pagamento de juros |
| CHK / CK | Cheque |
| WD / W/D | Saque |
| DEP | Depósito |
| DD | Depósito Direto |
| OD | Cheque especial |
| NSF | Fundos insuficientes |
| SRVCHG | Tarifa de serviço |
| XFER | Transferência |
Padrões da indústria que você deve conhecer
Esses formatos são usados em bancos corporativos e gestão de tesouraria. Você raramente os encontrará diretamente, mas compreendê-los explica por que os extratos bancários funcionam da maneira que funcionam.
BAI2 (Bank Administration Institute)
Usado para gestão de caixa automatizada e reconciliação bancária em sistemas ERP (SAP, Oracle). Um formato ASCII de largura fixa com códigos de tipo de transação (ex: 165 = crédito ACH pré-autorizado, 455 = débito ACH, 495 = transferência bancária enviada). Lançado originalmente em 1987, agora mantido pela ASC X9.
SWIFT MT940 / MT942
Extratos bancários de fim de dia (MT940) e intradia (MT942) usados por bancos em todo o mundo para clientes corporativos e departamentos de tesouraria. O SWIFT processa aproximadamente 45 milhões de mensagens por dia. Formato baseado em tags com identificadores de campo delimitados por dois pontos.
ISO 20022 (camt.053)
O substituto moderno baseado em XML para o MT940. Parte do padrão universal de mensagens financeiras ISO 20022. Dados mais ricos que o MT940, sem limites de comprimento de campo, XML analisável por máquina com validação XSD. O SWIFT está migrando de mensagens MT para ISO 20022. O SEPA (Single Euro Payments Area) exige o formato camt para pagamentos europeus.
NACHA ACH
O formato de arquivo para transações Automated Clearing House nos EUA. ASCII de largura fixa, exatamente 94 caracteres por linha. O ACH processa aproximadamente 30 bilhões de transações por ano nos EUA. Quando seu extrato bancário mostra "ACH CREDIT" ou "ACH DEBIT", a transação subjacente foi transmitida no formato NACHA entre bancos.
Escolhendo o formato certo para seu fluxo de trabalho
Guia de decisão
Use QBO se: Você usa o QuickBooks (Desktop ou Online). Você obtém classificação de tipo de transação, detecção de duplicatas via FITID e os metadados de importação mais ricos.
Use OFX se: Você usa o Xero, Sage, Wave ou outro software compatível com OFX. O Xero mapeia campos automaticamente sem configuração manual de colunas.
Use QFX se: Você usa o Quicken. É o único formato que o Quicken aceita.
Use Excel se: Você precisa revisar, analisar ou manipular dados antes de importar. Crie tabelas dinâmicas, execute fórmulas ou prepare relatórios.
Use CSV se: Seu software não está listado acima ou você precisa de máxima compatibilidade entre sistemas. Esteja preparado para mapear colunas manualmente.
Use JSON se: Você está criando fluxos de trabalho automatizados, integrações de API ou sistemas de relatórios personalizados.
Dicas profissionais
- Sempre use QBO/OFX em vez de CSV quando seu software suportar — a detecção de duplicatas por si só evita horas de limpeza
- Mantenha o PDF original ao lado do seu arquivo convertido — é sua trilha de auditoria e documento de origem
- Verifique após cada importação — confira os saldos inicial/final e algumas transações aleatórias
- Combine o formato com o software — usar o formato nativo da sua plataforma contábil evita o mapeamento manual de colunas e habilita recursos automáticos
Experimente gratuitamente
Pronto para converter seu primeiro extrato? Envie um PDF agora - O PDFSub converte para Excel, CSV, QBO, OFX, QFX e JSON. Extratos digitais são processados inteiramente no seu navegador para máxima privacidade. Inicie um teste gratuito de 7 dias com acesso total a todos os formatos.