Zrozumienie formatów wyciągów bankowych: przewodnik techniczny
PDF to nie format danych, to format wyświetlania. Dlatego ekstrakcja danych transakcyjnych z wyciągów bankowych jest zaskakująco trudna. Ten przewodnik wyjaśnia, co znajduje się w pliku PDF wyciągu bankowego, dostępne formaty wyjściowe (Excel, CSV, QBO, OFX, QFX, JSON) i jak wybrać odpowiedni.

Wyciąg bankowy w formacie PDF wygląda prosto: daty, opisy, kwoty, salda w schludnych kolumnach. Ale za tym wyglądem kryje się format dokumentu (PDF), który nigdy nie został zaprojektowany do przechowywania danych strukturalnych – a proces konwersji wymaga zrozumienia zarówno formatu wejściowego, jak i wielu dostępnych formatów wyjściowych.
Ten przewodnik omawia 12 sekcji występujących na każdym wyciągu bankowym (niezależnie od banku), techniczną rzeczywistość plików PDF wyciągów bankowych, różnice w układzie między bankami, każdy napotkany format wyjściowy (Excel, CSV, QBO, OFX, QFX, QIF, JSON), międzynarodowe różnice w formatowaniu oraz standardy branżowe regulujące wymianę danych finansowych.
Anatomia wyciągu bankowego
Każdy wyciąg bankowy – Chase, Bank of America, Wells Fargo, HSBC, Deutsche Bank, i tak dalej – składa się z tych samych 12 sekcji. Etykiety się zmieniają („Subtractions” vs „Withdrawals”), układy kolumn się różnią, ale podstawowa struktura jest spójna. Gdy raz zidentyfikujesz te sekcje, każdy wyciąg staje się znajomy.

Chcesz użyć tej infografiki na swoim blogu? Skopiuj ten kod osadzania:
Szczegółowe analizy dotyczące konkretnych banków, obejmujące dokładny układ tych 12 sekcji w każdym z głównych banków, znajdziesz w:
- Wyciąg bankowy Chase wyjaśniony
- Wyciąg bankowy Bank of America wyjaśniony
- Wyciąg bankowy Wells Fargo wyjaśniony
- Wyciąg bankowy Citi wyjaśniony
- Wyciąg bankowy Capital One wyjaśniony
Dlaczego PDF nie jest formatem danych
PDF to skrót od Portable Document Format, znormalizowany jako ISO 32000 (wersja 2.0 stała się ISO 32000-2:2020). Został zaprojektowany z jednego powodu: aby dokumenty wyglądały identycznie na każdym ekranie i drukarce. To świetne dla wierności wizualnej – i fatalne dla ekstrakcji danych.
Co faktycznie znajduje się w pliku PDF wyciągu bankowego
Wewnątrz każdej strony PDF znajduje się strumień zawartości – sekwencja operatorów rysowania zapisanych w języku podobnym do PostScript. Tekst jest renderowany za pomocą specyficznych operatorów:
- BT / ET – Begin Text / End Text: granice obiektu tekstowego
- Tf – Ustaw czcionkę i rozmiar
- Td / Tm – Przesuń pozycję tekstu lub ustaw pełną macierz transformacji tekstu
- Tj – Pokaż ciąg tekstowy
- TJ – Pokaż tekst z indywidualnym pozycjonowaniem glifów (korekty kerningu)
Kluczowy wniosek: w specyfikacji PDF nie ma koncepcji „tabeli”, „wiersza” ani „kolumny”. To, co wygląda jak schludnie sformatowana tabela transakcji, w rzeczywistości składa się z dziesiątek fragmentów tekstu umieszczonych w określonych współrzędnych x,y na stronie. Narzędzie do ekstrakcji musi:
- Parsować operatory strumienia zawartości
- Rozwiązywać kodowania czcionek, aby mapować indeksy glifów na znaki Unicode
- Używać macierzy tekstu (Tm/Td) do określenia pozycji x,y każdego znaku
- Rekonstruować słowa, linie i kolumny z tych współrzędnych
Kolumna, która wydaje się idealnie wyrównana, może znajdować się na x=72,0 w jednym wierszu i x=72,5 w następnym. Algorytm ekstrakcji musi definiować granice kolumn z tolerancją dla tych subpikselowych wariacji.
PDF-y z tagami vs. bez tagów
PDF-y z tagami zawierają ukryte drzewo struktury logicznej (podobne do tagów HTML), które oznacza zawartość jako nagłówki, akapity, tabele, wiersze tabeli i komórki tabeli. To znacznie ułatwia ekstrakcję.
PDF-y bez tagów nie mają metadanych strukturalnych – narzędzie do ekstrakcji otrzymuje tylko surowe dane pozycyjne i musi wszystko wywnioskować.
Większość plików PDF wyciągów bankowych generowanych przez banki jest bez tagów. Banki generują wyciągi za pomocą systemów przetwarzania wsadowego (Oracle BI Publisher, SAP Crystal Reports lub niestandardowych potoków drukowania do PDF). Przepisy dotyczące dostępności (ADA/WCAG) skłaniają banki do stosowania PDF-ów z tagami, ale adopcja jest powolna. Standardowe pobrania z większości głównych banków pozostają bez tagów.
Różnice w układzie wyciągów bankowych
Nie ma standardu branżowego dotyczącego sposobu formatowania wyciągów PDF przez banki. Te same pięć elementów informacji – data, opis, debet, kredyt, saldo – jest inaczej rozmieszczonych przez każdy bank.
Pojedyncza kolumna kwot (ze znakiem)
Data Opis Kwota Saldo
15.01.26 BEZP. PRZELEW PŁACA +3 500,00 5 200,00
16.01.26 ZAKUP KARTA GOSPODARSTWO -87,50 5 112,50Debety są ujemne, kredyty dodatnie (lub odwrotnie). Powszechne w mniejszych bankach, spółdzielczych kasach oszczędnościowych i bankach cyfrowych. Prostsze w parsowaniu, ponieważ istnieje jedna kolumna kwot do ekstrakcji.
Oddzielne kolumny debetów/kredytów
Data Opis Wypłaty Wpłaty Saldo
15.01.26 BEZP. PRZELEW PŁACA 3 500,00 5 200,00
16.01.26 ZAKUP KARTA GOSPODARSTWO 87,50 5 112,50Używane przez Chase, Bank of America i wiele tradycyjnych banków. Narzędzie do ekstrakcji musi zidentyfikować, która kolumna zawiera kwotę i odpowiednio określić znak.
Pogrupowane według typu transakcji
Konta firmowe i korporacyjne często grupują transakcje:
WPŁATY I INNE KREDYTY 15.01 Przelew przychodzący REF#12345 10 000,00 18.01 Czek wpłacony #4567 2 500,00 Suma wpłat 12 500,00
REALIZOWANE CZEKI 16.01 Czek #1234 850,00 17.01 Czek #1235 1 200,00 Suma czeków 2 050,00
TRANSAKCJE ELEKTRONICZNE 19.01 Płatność ACH - Firma Dostawcy 3 200,00 20.01 Przelew online na konto oszczędnościowe 1 000,00 Suma transakcji elektronicznych 4 200,00Nagłówki sekcji określają, czy transakcje są debetami, czy kredytami. Linie podsumowujące („Suma wpłat”) muszą zostać zidentyfikowane i wykluczone z danych transakcyjnych.
Cechy specyficzne dla banków
- Chase – Oddzielne kolumny debetów/kredytów; grupy „WPŁATY I DODATKI” oraz „PŁATNOŚCI ELEKTRONICZNE” i „OPŁATY”; często wieloliniowe opisy dla szczegółów sprzedawcy
- Bank of America – Oddzielne kolumny wypłat/wpłat; zawiera sekcję „Podsumowanie salda dziennego” na końcu; rozbudowany nagłówek z numerem konta, okresem wyciągu, numerem rozliczeniowym
- Wells Fargo – Oddzielne kolumny; zawiera sekcję „PODSUMOWANIE SALDA DZIENNEGO”; pobierany plik CSV nazywa „Comma Delimited”
- Capital One – Czysty układ z jedną kolumną kwot dla kart konsumenckich; minimalne informacje w nagłówku
- Citi – Często zawiera szczegóły transakcji międzynarodowych z kwotami w walucie oryginalnej i kursami przeliczeniowymi w osobnych wierszach
Wariacje w układzie kolumn
Poza kwestią debetów/kredytów, kolejność kolumn nie jest znormalizowana:
- Kolejność kolumn: Data-Opis-Kwota-Saldo vs. Data-Kwota-Opis-Saldo
- Numer czeku: Obecny na wyciągach firmowych, nieobecny na osobistych
- Numer referencyjny: Powszechny na wyciągach firmowych, rzadki na osobistych
- Saldo bieżące: Na transakcję (najczęstsze) vs. podsumowania dzienne vs. całkowicie nieobecne
Cyfrowe vs. Skanowane pliki PDF
Najważniejszy czynnik wpływający na dokładność konwersji to to, czy plik PDF jest cyfrowy, czy zeskanowany.
Cyfrowe (natywne) pliki PDF
Tworzone programowo przez system bankowy podczas pobierania wyciągu. Tekst jest przechowywany jako operatory strumienia zawartości z kodowaniem czcionek.
- Dokładność: 99%+ w ekstrakcji tekstu – brak błędów rozpoznawania
- Szybkość: Milisekundy na stronę
- Prywatność: Może być przetwarzany w całości w przeglądarce – plik nigdy nie opuszcza urządzenia
- Rozmiar pliku: Zazwyczaj 50 KB–500 KB na stronę
- Jak zidentyfikować: Możesz zaznaczać i podświetlać poszczególne słowa
Skanowane pliki PDF
Obrazy papierowych wyciągów – utworzone przez skanowanie lub fotografowanie fizycznego dokumentu. Zawartość jest przechowywana jako obrazy rastrowe (skompresowane JPEG, JPEG2000, CCITT lub Flate).
- Dokładność: 95–99% przy profesjonalnym OCR; 65–70% przy ogólnym OCR
- Szybkość: Sekundy na stronę (wymaga przetwarzania obrazu)
- Prywatność: Zazwyczaj wymaga przetwarzania po stronie serwera (plik musi zostać przesłany do OCR)
- Rozmiar pliku: 200 KB–2 MB+ na stronę
- Jak zidentyfikować: Nie można zaznaczyć żadnego tekstu; powiększenie do 400% pokazuje pikselizację
Dlaczego dokładność skanowania jest ważniejsza dla danych finansowych
Współczynnik dokładności znaków na poziomie 97% brzmi doskonale, dopóki nie zastosuje się go do danych finansowych. Na wyciągu z 1000 znaków kwot, daje to 30 błędnie odczytanych znaków. Pojedyncza błędnie odczytana cyfra zmienia kwotę transakcji: „1 234,56 zł” staje się „1 234,86 zł” lub „7 234,56 zł”. Zaawansowany OCR osiąga dokładność bliską 99%, ale pozostałe błędy nieproporcjonalnie często dotyczą podobnie wyglądających znaków: 0/O, 1/l/I, 5/S, 8/B, 6/G, a krytycznie, przecinek/kropka.
Zawsze preferuj pobieranie cyfrowe. Pobieraj wyciągi ze strony internetowej banku, zamiast skanować papierowe dokumenty. Eliminuje to błędy OCR całkowicie.
Formaty wyjściowe: szczegółowe omówienie

Podczas konwersji wyciągu bankowego wybierasz format wyjściowy. Każdy format ma różne mocne strony, ograniczenia i idealne zastosowania.
Excel (.xlsx)
Standard: Office Open XML (OOXML), znormalizowany jako ECMA-376 i ISO/IEC 29500.
Co to jest: Plik .xlsx to w rzeczywistości archiwum ZIP zawierające pliki XML – strukturę skoroszytu, dane komórek, style i wspólne ciągi znaków. Dlatego może przechowywać typy danych (daty jako daty, liczby jako liczby), formatowanie, formuły i wiele arkuszy.
Dlaczego jest popularny w przypadku wyciągów bankowych:
- Daty pozostają datami (możliwe sortowanie, filtrowanie)
- Liczby pozostają liczbami (możliwe sumowanie, formatowanie)
- Formuły do uzgadniania (SUMA, WYSZUKAJ.PIONOWO)
- Tabele przestawne do kategoryzacji wydatków
- Formatowanie warunkowe do podświetlania rozbieżności
- Udostępnianie klientom potrzebującym czytelnego arkusza kalkulacyjnego
Ograniczenia:
- Maksymalnie 1 048 576 wierszy (rzadko istotne dla wyciągów bankowych)
- Nie można go bezpośrednio zaimportować do większości oprogramowania księgowego (użyj zamiast tego QBO/OFX)
- Wymaga programu Excel, Google Sheets lub LibreOffice Calc do otwarcia
Najlepszy dla: Ręcznego przeglądu, analizy niestandardowej, uzgadniania, archiwizacji, raportowania dla klientów.
CSV (Comma-Separated Values)
Standard: RFC 4180 (2005) – „Common Format and MIME Type for Comma-Separated Values”.
Podstawowe zasady:
- Rekordy oddzielone CRLF (powrót karetki + nowa linia)
- Pola oddzielone przecinkami
- Pola zawierające przecinki, cudzysłowy lub znaki nowej linii muszą być ujęte w podwójne cudzysłowy
- Podwójne cudzysłowy wewnątrz pól są zastępowane przez podwojenie ich
Wariacje separatorów w praktyce:
- Przecinek (
,) – Standard, używany w USA/Wielkiej Brytanii - Średnik (
;) – Używany w krajach, gdzie przecinek jest separatorem dziesiętnym (Francja, Niemcy, Włochy, Hiszpania, Brazylia) - Tabulator (
\t) – Format TSV, unika konfliktów separatorów
Problemy z kodowaniem:
- UTF-8 jest zalecany dla interoperacyjności
- UTF-8 BOM (Byte Order Mark): Nie jest wymagany przez standard, ale Excel w systemie Windows go wymaga, aby poprawnie wyświetlać znaki spoza ASCII (litery z akcentami, symbole walut). Bez BOM Excel może interpretować UTF-8 jako Windows-1252, uszkadzając znaki.
- Excel używa średników zamiast przecinków jako separatorów pól w lokalizacjach europejskich
Ograniczenia:
- Brak typów danych – wszystko jest tekstem (liczby z zerami wiodącymi są uszkadzane, długie numery kont stają się notacją naukową)
- Brak obsługi wielu arkuszy
- Brak formatowania lub formuł
- Brak metadanych (brak informacji o koncie, brak identyfikatorów wykrywania duplikatów)
Najlepszy dla: Maksymalna kompatybilność – prawie każdy program księgowy, baza danych i arkusz kalkulacyjny potrafi zaimportować CSV. Uniwersalny zamiennik, gdy QBO/OFX nie jest dostępne.
QBO (QuickBooks Web Connect)
Co to jest: Format importu dla QuickBooks (zarówno Desktop, jak i Online). Pliki QBO są oparte na specyfikacji OFX z rozszerzeniami specyficznymi dla QuickBooks.
Ważne wyjaśnienie: ".QBO" NIE oznacza „QuickBooks Online” – oznacza format QuickBooks Web Connect i działa zarówno z QuickBooks Desktop, jak i QuickBooks Online.
Wymagane pola na transakcję:
TRNTYPE– Typ transakcji (DEBIT, CREDIT, CHECK, DEP, DIRECTDEP, DIRECTDEBIT, ATM, POS, XFER, PAYMENT, FEE, SRVCHG, INT, OTHER)DTPOSTED– Data w formacie RRRRMMDDTRNAMT– Kwota (ujemna dla debetów)FITID– Identyfikator transakcji instytucji finansowejNAME– Odbiorca/opis
Dlaczego FITID jest ważny: QuickBooks śledzi każdy FITID zaimportowany dla każdego konta. Jeśli transakcja z tym samym FITID zostanie zaimportowana ponownie, QuickBooks ją cicho pomija – zapobiegając duplikatom, gdy użytkownicy ponownie importują nakładające się okresy wyciągów. Ta automatyczna detekcja duplikatów jest największą zaletą QBO nad CSV.
Dodatkowe dane: QBO zawiera również identyfikator konta, identyfikator banku (numer rozliczeniowy), walutę, numer czeku, notatkę i saldo końcowe – najbogatszy zestaw danych spośród wszystkich formatów importu dla QuickBooks.
Najlepszy dla: Użytkowników QuickBooks (Desktop i Online). Zapewnia najbogatsze doświadczenie importu z automatycznym wykrywaniem duplikatów i klasyfikacją typów transakcji.
OFX (Open Financial Exchange)
Historia: Stworzony przez Microsoft, Intuit i CheckFree. Wersja 1.0 wydana w lutym 1997 r.
Ewolucja wersji:
- OFX 1.0–1.6 (1997–1999): Składnia oparta na SGML (nie wymaga tagów zamykających)
- OFX 2.0+ (2000–obecnie): Oparty na XML (prawidłowe tagi zamykające, poprawny XML)
Wiele banków nadal produkuje OFX 1.x (SGML) dla maksymalnej kompatybilności.
Obecne zarządzanie: W 2019 r. konsorcjum OFX połączyło się z konsorcjum Financial Data Exchange (FDX), które obecnie zarządza specyfikacją. FDX ma ponad 200 organizacji członkowskich i 76 milionów kont konsumenckich.
Dlaczego OFX jest uniwersalnym standardem: OFX to ten sam format, który jest używany podczas bezpośredniego łączenia konta bankowego z oprogramowaniem księgowym za pomocą kanałów bankowych – ten sam format działa również do importu plików.
Najlepszy dla użytkowników Xero: Xero automatycznie importuje pliki OFX bez konieczności ręcznego mapowania kolumn. Prześlij plik, a transakcje pojawią się natychmiast z poprawnymi datami, kwotami i opisami. Działa również z Wave, Sage, FreshBooks i większością oprogramowania księgowego.
QFX (Quicken Financial Exchange)
Co to jest: Własny wariant OFX firmy Intuit, używany wyłącznie z Quicken. Plik QFX to standardowy plik OFX z dodatkowymi polami własnościowymi.
Kluczowe pole własnościowe: INTU.BID – Identyfikator banku Quicken. Ten numeryczny identyfikator mapuje się na bank w wewnętrznej bazie danych Quicken. Bez niego Quicken odmawia importu pliku.
Różnice w stosunku do standardowego OFX:
- Wymaga INTU.BID w nagłówku
- Może zawierać inne pola z prefiksem INTU.*
- Instytucje finansowe płacą Intuit opłatę licencyjną za udostępnianie pobierania QFX
- Quicken nie zaimportuje standardowych plików OFX bez pola INTU.BID
Najlepszy dla: Użytkowników oprogramowania do zarządzania finansami osobistymi Quicken. Wymagany format – żaden inny nie zadziała.
QIF (Quicken Interchange Format)
Co to jest: Starszy format zwykłego tekstu pierwotnie opracowany przez Intuit dla Quicken. Pary tag-wartość, jeden na linię, z jednoznakowymi tagami: D dla daty, T dla kwoty, P dla odbiorcy, L dla kategorii, M dla notatki, N dla numeru czeku, ^ dla końca rekordu.
Dlaczego został zastąpiony: QIF nie posiada mechanizmu wykrywania duplikatów (brak odpowiednika FITID), nie ma pól identyfikujących konto, informacji o numerze rozliczeniowym banku, danych salda ani spójnego formatowania dat w różnych implementacjach.
Nadal istotny: Niektóre programy księgowe (Xero, Sage, GnuCash) nadal akceptują import QIF. Przydatny do migracji starszych systemów.
JSON (JavaScript Object Notation)
Obecny status: JSON nie jest jeszcze standardem dla plików wyciągów bankowych, ale jest coraz częściej używany w:
- API Open Banking (UK Open Banking Standard, PSD2 Berlin Group)
- FDX API (Financial Data Exchange – następca OFX, ponad 200 organizacji członkowskich)
- Plaid, Yodlee, MX i inne API agregatorów danych
- Przepływy pracy deweloperskie i automatyzacyjne
Rosnąca adopcja: Regulacje Open Banking (PSD2 w Europie, Sekcja 1033 CFPB w USA) przyspieszają adopcję API JSON. FDX API wykorzystuje JSON/REST z OAuth 2.0, reprezentując przyszły kierunek wymiany danych finansowych.
Najlepszy dla: Deweloperów tworzących zautomatyzowane przepływy pracy, integracje fintech, niestandardowe pulpity nawigacyjne i integracje API Open Banking.
Porównanie formatów w skrócie
| Format | Typy danych | Wykrywanie duplikatów | Informacje o koncie | Wsparcie oprogramowania księgowego | Najlepszy dla |
|---|---|---|---|---|---|
| Excel | Tak | Nie | Nie | Ograniczone | Ręczny przegląd, analiza |
| CSV | Nie | Nie | Nie | Uniwersalne | Maksymalna kompatybilność |
| QBO | Tak | Tak (FITID) | Tak | QuickBooks | Użytkownicy QuickBooks |
| OFX | Tak | Tak (FITID) | Tak | Większość oprogramowania | Xero, Wave, Sage |
| QFX | Tak | Tak (FITID) | Tak | Tylko Quicken | Użytkownicy Quicken |
| QIF | Częściowe | Nie | Nie | Niektóre starsze | Migracje starszych systemów |
| JSON | Tak | Niestandardowe | Tak | Oparte na API | Deweloperzy, automatyzacja |
Kompatybilność z oprogramowaniem księgowym
Który format akceptuje Twoje oprogramowanie księgowe?
| Oprogramowanie | QBO | OFX | QFX | QIF | CSV | Najlepszy wybór |
|---|---|---|---|---|---|---|
| QuickBooks Online | Tak | Tak | Tak | Nie | Tak | QBO |
| QuickBooks Desktop | Tak | Tak | Tak | Nie | Tak | QBO |
| Quicken | Nie | Nie | Tak | Tak | Nie | QFX |
| Xero | Tak | Tak | Tak | Tak | Tak | OFX |
| Sage | Nie | Tak | Nie | Tak | Tak | OFX |
| Wave | Nie | Tak | Tak | Nie | Tak | OFX |
| FreshBooks | Nie | Nie | Nie | Nie | Tak | CSV |
| Zoho Books | Nie | Tak | Nie | Tak | Tak | OFX |
| GnuCash | Nie | Tak | Nie | Tak | Tak | OFX |
Złota zasada: Używaj QBO dla QuickBooks, QFX dla Quicken, OFX dla wszystkiego innego, a CSV jako uniwersalnego zamiennika.
Międzynarodowe różnice w formatowaniu
Jeśli pracujesz z międzynarodowymi wyciągami bankowymi, napotkasz różnice w formatowaniu, które sprawiają problemy większości narzędzi do konwersji.
Formaty dat
| Region | Format | Przykład | Uwagi |
|---|---|---|---|
| Stany Zjednoczone | RRRR/MM/DD | 2026/03/15 | Miesiąc pierwszy |
| Europa, Ameryka Łacińska | DD/MM/RRRR | 15/03/2026 | Dzień pierwszy |
| Niemcy | DD.MM.RRRR | 15.03.2026 | Separator kropkowy |
| Japonia | RRRR年MM月DD日 | 2026年03月01日 | Rok pierwszy z kanji |
| Chiny | RRRR年MM月DD日 | 2026年3月1日 | Podobnie jak Japonia |
| ISO 8601 | RRRR-MM-DD | 2026-03-15 | Niejednoznaczny standard międzynarodowy |
Problem niejednoznaczności: „03/04/2026” to 4 marca w USA, ale 3 kwietnia w Europie. Gdy wszystkie daty w wyciągu mają wartości dni równe 12 lub mniejsze, nie ma algorytmicznego sposobu na określenie poprawnego formatu bez znajomości kraju pochodzenia. Narzędzia do konwersji muszą przeskanować wszystkie daty w wyciągu, szukając wartości większych niż 12, aby określić format.
Formaty liczb
| Region | Tysiąc i pięćdziesiąt centów | Uwagi |
|---|---|---|
| USA, Wielka Brytania, Australia, Japonia | 1 000,50 | Przecinek dla tysięcy, kropka dla dziesiętnych |
| Niemcy, Francja, Hiszpania, Brazylia, Włochy | 1.000,50 | Kropka dla tysięcy, przecinek dla dziesiętnych |
| Szwajcaria | 1'000.50 | Apostrof dla tysięcy |
| Indie | 1 00 000,50 | System grupowania lakh |
| Skandynawia | 1 000,50 | Spacja dla tysięcy, przecinek dla dziesiętnych |
„10.000,45” z europejskiego banku oznacza dziesięć tysięcy czterdzieści pięć centów – nie dziesięć kropka zero zero zero cztery pięć. Błędne zrozumienie tego prowadzi do błędów o wielkości 10 000x.
Umiejscowienie symbolu waluty
- USA/Wielka Brytania: Symbol przed kwotą: $1 234,56 / £1 234,56
- Francja, Niemcy, Hiszpania: Symbol po kwocie: 1 234,56 €
- Irlandia, Holandia: Symbol przed: €1 234,56
- Japonia: Symbol przed: ¥123 456
Kodowania znaków
- UTF-8 – Uniwersalny standard, obsługuje wszystkie skrypty
- GBK/GB2312 – Uproszczony chiński (używany przez chińskie banki)
- Shift_JIS – Japoński (używany przez japońskie banki)
- Big5 – Tradycyjny chiński (Tajwan, Hongkong)
- EUC-KR – Koreański
- ISO 8859-1 – Zachodnioeuropejski
- Windows-1252 – Zachodnioeuropejski (starszy)
- Windows-1256 – Arabski
Otwarcie chińskiego lub japońskiego wyciągu bankowego na amerykańskim systemie bez poprawnego wykrywania kodowania powoduje wyświetlenie nieczytelnych znaków. PDFSub obsługuje ponad 130 języków z automatycznym wykrywaniem formatów dat, formatów liczb i kodowań znaków – w tym arabski i hebrajski od prawej do lewej, znaki CJK i wszystkie europejskie zestawy znaków.
Typowe elementy wyciągu bankowego
Data transakcji vs. Data księgowania vs. Data wartości
Wyciągi bankowe mogą zawierać wiele dat dla pojedynczej transakcji:
- Data transakcji – kiedy faktycznie nastąpił zakup lub przelew
- Data księgowania – kiedy bank przetworzył i zarejestrował transakcję (zazwyczaj 1–3 dni robocze później dla zakupów kartą kredytową)
- Data wartości – kiedy środki faktycznie stały się dostępne (wpływa na naliczanie odsetek, powszechne w bankowości międzynarodowej)
Większość wyciągów konsumenckich pokazuje tylko datę księgowania. Wyciągi firmowe często zawierają zarówno datę transakcji, jak i datę księgowania.
Reprezentacja debetów/kredytów
Banki różnie reprezentują debety i kredyty:
- Kwoty ze znakiem: -87,50 zł dla debetów, +3 500,00 zł dla kredytów
- Oddzielne kolumny: „Wypłaty” i „Wpłaty”
- Skróty: „DR” dla debetu, „CR” dla kredytu (powszechne w Wielkiej Brytanii/Krajach Wspólnoty)
- Nawiasy: (87,50 zł) dla debetów (konwencja księgowa)
Saldo bieżące
- Saldo na transakcję – aktualizowane po każdej transakcji (najczęstsze w amerykańskich wyciągach konsumenckich)
- Tylko saldo dzienne – saldo pokazane na koniec każdego dnia (powszechne w wyciągach firmowych)
- Brak salda bieżącego – tylko salda początkowe i końcowe (niektóre wyciągi międzynarodowe)
Salda bieżące są cenne do weryfikacji: można sprawdzić, czy każda transakcja poprawnie przesuwa saldo z jednego wiersza na następny.
Standardowe informacje nagłówkowe
Większość wyciągów bankowych zawiera: imię i nazwisko posiadacza konta, numer konta (często częściowo zamaskowany), okres wyciągu, salda początkowe i końcowe, sumy wpłat i wypłat oraz numer rozliczeniowy banku/kod sortowania/SWIFT BIC.
Ochrona hasłem
Jak banki szyfrują pliki PDF
Banki zazwyczaj używają szyfrowania AES-128 lub AES-256. Istnieją dwa tryby ochrony:
- Hasło użytkownika (hasło otwierające): Wymagane do otwarcia pliku
- Hasło właściciela (hasło uprawnień): PDF otwiera się, ale edycja/kopiowanie może być ograniczone
Typowe wzorce haseł
| Bank | Typowe hasło |
|---|---|
| Chase | Pełny 9-cyfrowy SSN |
| Bank of America | SSN lub TIN |
| Wells Fargo | SSN lub ostatnie 4 cyfry SSN |
| Capital One | Data urodzenia (MMDDRRRR) |
Inne typowe wzorce to ostatnie 4 cyfry numeru konta, identyfikator klienta lub numer członkowski. Banki zazwyczaj informują o wzorcu hasła, gdy po raz pierwszy włączysz elektroniczne wyciągi.
Wyzwania związane z wielostronicowymi wyciągami
Długie wyciągi (konta firmowe z setkami transakcji) stwarzają kilka wyzwań ekstrakcyjnych:
Podzielone transakcje
Opis transakcji może zaczynać się na dole jednej strony i kontynuować na górze następnej. Konwerter musi wykryć linie kontynuacji i połączyć je w jedną transakcję.
Powtarzające się nagłówki i stopki
Większość banków powtarza nagłówki kolumn na każdej stronie, a także numery stron, zastrzeżenia prawne i teksty marketingowe. Muszą one zostać zidentyfikowane i wykluczone z danych transakcyjnych.
Linie kontynuacji
Wiele transakcji ma wieloliniowe opisy:
15.01 ELEKTRONICZNY DEBET ACH FIRMA DOSTAWCY 3 200,00 zł 2 000,00 zł REF#123456789 FAKTURA 2026-001 FIRMA DOSTAWCY DZIAŁ ZAPŁATWiersze 2 i 3 to linie kontynuacji należące do transakcji w wierszu 1. Zazwyczaj nie mają daty i kwoty, pojawiają się jako wcięcia na tej samej współrzędnej x co kolumna opisu.
Przeniesienie salda
Niektóre banki umieszczają linie „Saldo przeniesione” lub „Saldo przekazane” na górze stron kontynuacji. Mają one charakter informacyjny, nie transakcyjny, i muszą zostać wykluczone z wyekstrahowanych danych.
Typowe skróty transakcji
Wyciągi bankowe używają skrótów, które różnią się w zależności od instytucji:
| Skrót | Znaczenie |
|---|---|
| ACH | Automated Clearing House (przelewy elektroniczne) |
| ATM | Automated Teller Machine (bankomat) |
| POS | Point of Sale (karta debetowa) |
| EFT | Electronic Funds Transfer (elektroniczny transfer środków) |
| INT | Interest payment (odsetki) |
| CHK / CK | Check (czek) |
| WD / W/D | Withdrawal (wypłata) |
| DEP | Deposit (wpłata) |
| DD | Direct Deposit (bezpośredni depozyt) |
| OD | Overdraft (przekroczenie salda) |
| NSF | Non-Sufficient Funds (brak wystarczających środków) |
| SRVCHG | Service Charge (opłata za usługę) |
| XFER | Transfer (przelew) |
Standardy branżowe, o których warto wiedzieć
Te formaty są używane w bankowości korporacyjnej i zarządzaniu skarbcem. Rzadko napotkasz je bezpośrednio, ale ich zrozumienie wyjaśnia, dlaczego wyciągi bankowe działają tak, jak działają.
BAI2 (Bank Administration Institute)
Używany do automatycznego zarządzania środkami pieniężnymi i uzgadniania bankowego w systemach ERP (SAP, Oracle). Format ASCII o stałej szerokości z kodami typów transakcji (np. 165 = autoryzowany kredyt ACH, 455 = debet ACH, 495 = przelew bankowy wychodzący). Pierwotnie wydany w 1987 r., obecnie utrzymywany przez ASC X9.
SWIFT MT940 / MT942
Wyciągi bankowe z końca dnia (MT940) i wewnątrz dnia (MT942) używane przez banki na całym świecie dla klientów korporacyjnych i działów skarbu. SWIFT przetwarza około 45 milionów wiadomości dziennie. Format oparty na tagach z identyfikatorami pól rozdzielonymi dwukropkiem.
ISO 20022 (camt.053)
Nowoczesny zamiennik MT940 oparty na XML. Część uniwersalnego standardu wiadomości finansowych ISO 20022. Bogatsze dane niż MT940, brak limitów długości pól, XML możliwy do parsowania maszynowego z walidacją XSD. SWIFT migruje z wiadomości MT do ISO 20022. SEPA (Single Euro Payments Area) nakazuje format camt dla europejskich płatności.
NACHA ACH
Format pliku dla transakcji Automated Clearing House w USA. ASCII o stałej szerokości, dokładnie 94 znaki na linię. ACH przetwarza około 30 miliardów transakcji rocznie w USA. Kiedy wyciąg bankowy pokazuje „ACH CREDIT” lub „ACH DEBIT”, podstawowa transakcja została przesłana w formacie NACHA między bankami.
Wybór odpowiedniego formatu dla Twojego przepływu pracy
Przewodnik decyzyjny
Użyj QBO, jeśli: Używasz QuickBooks (Desktop lub Online). Otrzymujesz klasyfikację typów transakcji, wykrywanie duplikatów za pomocą FITID i najbogatsze metadane importu.
Użyj OFX, jeśli: Używasz Xero, Sage, Wave lub innego oprogramowania kompatybilnego z OFX. Xero automatycznie mapuje pola bez ręcznej konfiguracji kolumn.
Użyj QFX, jeśli: Używasz Quicken. Jest to jedyny format akceptowany przez Quicken.
Użyj Excela, jeśli: Potrzebujesz przejrzeć, przeanalizować lub zmodyfikować dane przed importem. Utwórz tabele przestawne, uruchom formuły lub przygotuj raporty.
Użyj CSV, jeśli: Twoje oprogramowanie nie znajduje się na powyższej liście lub potrzebujesz maksymalnej kompatybilności między systemami. Przygotuj się na ręczne mapowanie kolumn.
Użyj JSON, jeśli: Budujesz zautomatyzowane przepływy pracy, integracje API lub niestandardowe systemy raportowania.
Profesjonalne wskazówki
- Zawsze używaj QBO/OFX zamiast CSV, gdy Twoje oprogramowanie to obsługuje – samo wykrywanie duplikatów zapobiega godzinom sprzątania
- Zachowaj oryginalny plik PDF obok przekonwertowanego pliku – jest to Twój ślad audytu i dokument źródłowy
- Weryfikuj po każdym imporcie – sprawdź salda początkowe/końcowe i kilka losowych transakcji
- Dopasuj format do oprogramowania – użycie natywnego formatu dla Twojej platformy księgowej pozwala uniknąć ręcznego mapowania kolumn i umożliwia automatyczne funkcje
Wypróbuj za darmo
Gotowy do konwersji pierwszego wyciągu? Prześlij PDF teraz – PDFSub konwertuje do Excela, CSV, QBO, OFX, QFX i JSON. Wyciągi cyfrowe są przetwarzane w całości w Twojej przeglądarce dla maksymalnej prywatności. Rozpocznij 7-dniowy bezpłatny okres próbny z pełnym dostępem do wszystkich formatów.