बैंक स्टेटमेंट फॉर्मेट को समझना: तकनीकी गाइड
पीडीएफ एक डेटा फॉर्मेट नहीं है - यह एक डिस्प्ले फॉर्मेट है। इसीलिए बैंक स्टेटमेंट से ट्रांजेक्शन डेटा निकालना आश्चर्यजनक रूप से कठिन है। यह गाइड बताता है कि बैंक स्टेटमेंट पीडीएफ के अंदर क्या है, उपलब्ध आउटपुट फॉर्मेट (एक्सेल, सीएसवी, क्यूबीओ, ओएफएक्स, क्यूएफएक्स, जेएसओएन), और सही फॉर्मेट कैसे चुनें।

एक बैंक स्टेटमेंट पीडीएफ सरल दिखता है: तारीखें, विवरण, राशि, साफ कॉलम में शेष राशि। लेकिन उस दिखावट के पीछे एक दस्तावेज़ फॉर्मेट (पीडीएफ) है जिसे कभी भी संरचित डेटा स्टोर करने के लिए डिज़ाइन नहीं किया गया था - और एक रूपांतरण प्रक्रिया जिसके लिए इनपुट फॉर्मेट और उपलब्ध कई आउटपुट फॉर्मेट दोनों को समझने की आवश्यकता होती है।
यह गाइड हर बैंक स्टेटमेंट (बैंक चाहे कोई भी हो) पर दिखाई देने वाले 12 अनुभागों, बैंक स्टेटमेंट पीडीएफ की तकनीकी वास्तविकता, बैंकों में लेआउट भिन्नताओं, आपको मिलने वाले हर आउटपुट फॉर्मेट (एक्सेल, सीएसवी, क्यूबीओ, ओएफएक्स, क्यूएफएक्स, क्यूआईएफ, जेएसओएन), अंतर्राष्ट्रीय फॉर्मेटिंग अंतरों और वित्तीय डेटा विनिमय को नियंत्रित करने वाले उद्योग मानकों को कवर करता है।
बैंक स्टेटमेंट की संरचना
हर बैंक स्टेटमेंट - चेस, बैंक ऑफ अमेरिका, वेल्स फारगो, एचएसबीसी, ड्यूश बैंक, कोई भी नाम ले लें - उन्हीं 12 अनुभागों से बना होता है। लेबल बदलते हैं ("Subtractions" बनाम "Withdrawals"), कॉलम की व्यवस्था अलग-अलग होती है, लेकिन अंतर्निहित संरचना सुसंगत होती है। एक बार जब आप इन अनुभागों की पहचान कर सकते हैं, तो हर स्टेटमेंट परिचित लगता है।

इस इन्फोग्राफिक का उपयोग अपने ब्लॉग पर करना चाहते हैं? यह एम्बेड कोड कॉपी करें:
प्रत्येक प्रमुख बैंक इन 12 अनुभागों को कैसे व्यवस्थित करता है, इसे कवर करने वाले बैंक-विशिष्ट गहन विश्लेषण के लिए, देखें:
- चेस बैंक स्टेटमेंट की व्याख्या
- बैंक ऑफ अमेरिका बैंक स्टेटमेंट की व्याख्या
- वेल्स फारगो बैंक स्टेटमेंट की व्याख्या
- सिटी बैंक स्टेटमेंट की व्याख्या
- कैपिटल वन बैंक स्टेटमेंट की व्याख्या
पीडीएफ डेटा फॉर्मेट क्यों नहीं है
पीडीएफ का मतलब है पोर्टेबल डॉक्यूमेंट फॉर्मेट, जिसे आईएसओ 32000 (संस्करण 2.0 आईएसओ 32000-2:2020 बन गया) के रूप में मानकीकृत किया गया है। इसे एक उद्देश्य के लिए डिज़ाइन किया गया था: दस्तावेजों को हर स्क्रीन और प्रिंटर पर समान दिखाना। यह दृश्य निष्ठा के लिए बहुत अच्छा है - और डेटा निकालने के लिए बहुत बुरा।
बैंक स्टेटमेंट पीडीएफ के अंदर वास्तव में क्या है
हर पीडीएफ पेज के अंदर एक कंटेंट स्ट्रीम होती है - पोस्टस्क्रिप्ट-जैसी भाषा में लिखे गए ड्राइंग ऑपरेटरों का एक क्रम। टेक्स्ट को विशिष्ट ऑपरेटरों का उपयोग करके प्रस्तुत किया जाता है:
- BT / ET - टेक्स्ट शुरू करें / टेक्स्ट समाप्त करें: टेक्स्ट ऑब्जेक्ट की सीमाएँ
- Tf - फ़ॉन्ट और आकार सेट करें
- Td / Tm - टेक्स्ट की स्थिति बदलें या पूर्ण टेक्स्ट ट्रांसफॉर्मेशन मैट्रिक्स सेट करें
- Tj - एक टेक्स्ट स्ट्रिंग दिखाएं
- TJ - व्यक्तिगत ग्लिफ़ पोजिशनिंग (कर्लिंग समायोजन) के साथ टेक्स्ट दिखाएं
महत्वपूर्ण अंतर्दृष्टि: पीडीएफ विनिर्देश में "टेबल," "पंक्ति," या "कॉलम" की कोई अवधारणा नहीं है। जो एक साफ-सुथरा ट्रांजेक्शन टेबल जैसा दिखता है, वह वास्तव में पेज पर विशिष्ट x,y निर्देशांक पर रखे गए दर्जनों टेक्स्ट टुकड़ों का एक क्रम है। एक्सट्रैक्शन टूल को यह करना होगा:
- कंटेंट स्ट्रीम ऑपरेटरों को पार्स करें
- ग्लिफ़ इंडेक्स को यूनिकोड वर्णों से मैप करने के लिए फ़ॉन्ट एन्कोडिंग को हल करें
- हर कैरेक्टर की x,y स्थिति निर्धारित करने के लिए टेक्स्ट मैट्रिक्स (Tm/Td) का उपयोग करें
- उन निर्देशांकों से शब्दों, पंक्तियों और कॉलमों का पुनर्निर्माण करें
एक कॉलम जो पूरी तरह से संरेखित दिखाई देता है, वह एक पंक्ति पर x=72.0 और अगली पंक्ति पर x=72.5 हो सकता है। एक्सट्रैक्शन एल्गोरिथम को इन सब-पिक्सेल विविधताओं के लिए सहनशीलता के साथ कॉलम की सीमाएं परिभाषित करनी होंगी।
टैग किए गए बनाम बिना टैग वाले पीडीएफ
टैग किए गए पीडीएफ में एक छिपी हुई लॉजिकल स्ट्रक्चर ट्री (एचटीएमएल टैग के समान) शामिल होती है जो सामग्री को हेडिंग, पैराग्राफ, टेबल, टेबल रो और टेबल सेल के रूप में चिह्नित करती है। यह एक्सट्रैक्शन को काफी आसान बनाता है।
बिना टैग वाले पीडीएफ में कोई स्ट्रक्चरल मेटाडेटा नहीं होता है - एक्सट्रैक्शन टूल को केवल रॉ पोजिशनिंग डेटा मिलता है और उसे सब कुछ अनुमान लगाना होता है।
अधिकांश बैंक-जनित स्टेटमेंट पीडीएफ बिना टैग वाले होते हैं। बैंक बैच प्रोसेसिंग सिस्टम (ओरेकल बीआई पब्लिशर, एसएपी क्रिस्टल रिपोर्ट्स, या कस्टम प्रिंट-टू-पीडीएफ पाइपलाइन) का उपयोग करके स्टेटमेंट उत्पन्न करते हैं। एक्सेसिबिलिटी नियम (एडीए/डब्ल्यूसीएजी) बैंकों को टैग किए गए पीडीएफ की ओर धकेल रहे हैं, लेकिन गोद लेना धीमा है। अधिकांश प्रमुख बैंकों से मानक डाउनलोड बिना टैग वाले रहते हैं।
बैंक स्टेटमेंट लेआउट भिन्नताएं
बैंकों द्वारा अपने पीडीएफ स्टेटमेंट को फॉर्मेट करने के लिए कोई उद्योग मानक नहीं है। पांच समान जानकारी - तारीख, विवरण, डेबिट, क्रेडिट, शेष राशि - हर बैंक द्वारा अलग-अलग व्यवस्थित की जाती है।
एकल राशि कॉलम (चिह्नित)
तारीख विवरण राशि शेष राशि
01/15/26 डायरेक्ट डेप पेरोल +3,500.00 5,200.00
01/16/26 पीओएस खरीद ग्रोसरी -87.50 5,112.50डेबिट ऋणात्मक होते हैं, क्रेडिट धनात्मक होते हैं (या इसके विपरीत)। छोटे बैंकों, क्रेडिट यूनियनों और डिजिटल बैंकों के साथ आम। पार्स करने में सरल क्योंकि निकालने के लिए एक राशि कॉलम है।
अलग डेबिट/क्रेडिट कॉलम
तारीख विवरण निकासी जमा शेष राशि
01/15/26 डायरेक्ट डेप पेरोल 3,500.00 5,200.00
01/16/26 पीओएस खरीद ग्रोसरी 87.50 5,112.50चेस, बैंक ऑफ अमेरिका और कई पारंपरिक बैंकों द्वारा उपयोग किया जाता है। एक्सट्रैक्शन टूल को यह पहचानना होगा कि किस कॉलम में राशि है और तदनुसार चिह्न निर्धारित करना होगा।
ट्रांजेक्शन प्रकार के अनुसार समूहीकृत
व्यावसायिक और वाणिज्यिक खाते अक्सर लेनदेन को समूहित करते हैं:
जमा और अन्य क्रेडिट 01/15 वायर ट्रांसफर इन REF#12345 10,000.00 01/18 चेक जमा #4567 2,500.00 कुल जमा 12,500.00
चेक भुगतान 01/16 चेक #1234 850.00 01/17 चेक #1235 1,200.00 कुल चेक भुगतान 2,050.00
इलेक्ट्रॉनिक ट्रांजेक्शन 01/19 ACH PYMT - वेंडर कॉर्प 3,200.00 01/20 ऑनलाइन ट्रांसफर टू सेविंग्स 1,000.00 कुल इलेक्ट्रॉनिक 4,200.00अनुभाग हेडर यह निर्धारित करते हैं कि लेनदेन डेबिट हैं या क्रेडिट। सारांश पंक्तियों ("कुल जमा") की पहचान की जानी चाहिए और लेनदेन डेटा से बाहर रखा जाना चाहिए।
बैंक-विशिष्ट विशेषताएं
- चेस - अलग डेबिट/क्रेडिट कॉलम; "DEPOSITS AND ADDITIONS" और "ELECTRONIC PAYMENTS" और "FEES" द्वारा समूहीकृत; व्यापारी विवरण के लिए बहु-पंक्ति विवरण आम हैं
- बैंक ऑफ अमेरिका - अलग निकासी/जमा कॉलम; अंत में "डेली बैलेंस" अनुभाग शामिल है; खाते की संख्या, स्टेटमेंट अवधि, रूटिंग नंबर के साथ विस्तृत हेडर
- वेल्स फारगो - अलग कॉलम; "डेली बैलेंस समरी" अनुभाग शामिल है; उनके सीएसवी डाउनलोड को "कॉमा डिलिमिटेड" कहा जाता है
- कैपिटल वन - उपभोक्ता कार्ड के लिए स्वच्छ एकल-राशि लेआउट; न्यूनतम हेडर जानकारी
- सिटी - अक्सर अंतरराष्ट्रीय लेनदेन विवरण शामिल करता है जिसमें मूल मुद्रा राशि और रूपांतरण दरें अलग-अलग पंक्तियों पर होती हैं
कॉलम व्यवस्था भिन्नताएं
डेबिट/क्रेडिट प्रश्न से परे, कॉलम ऑर्डर मानकीकृत नहीं है:
- कॉलम क्रम: तारीख-विवरण-राशि-शेष राशि बनाम तारीख-राशि-विवरण-शेष राशि
- चेक संख्या: व्यावसायिक खातों में मौजूद, व्यक्तिगत में अनुपस्थित
- संदर्भ संख्या: व्यावसायिक विवरणों में आम, व्यक्तिगत में दुर्लभ
- चल रहा शेष: प्रति-लेनदेन (सबसे आम) बनाम दैनिक उप-योग बनाम अनुपस्थित पूरी तरह से
डिजिटल बनाम स्कैन किए गए पीडीएफ
रूपांतरण सटीकता को प्रभावित करने वाला सबसे महत्वपूर्ण कारक यह है कि आपका पीडीएफ डिजिटल है या स्कैन किया हुआ।
डिजिटल (नेटिव) पीडीएफ
जब आप स्टेटमेंट डाउनलोड करते हैं तो आपके बैंक की प्रणाली द्वारा प्रोग्रामेटिक रूप से बनाया गया। टेक्स्ट को फ़ॉन्ट एन्कोडिंग के साथ कंटेंट स्ट्रीम ऑपरेटरों के रूप में संग्रहीत किया जाता है।
-
सटीकता: टेक्स्ट एक्सट्रैक्शन के लिए 99%+ - कोई पहचान त्रुटि नहीं
-
गति: प्रति पृष्ठ मिलीसेकंड
-
गोपनीयता: पूरी तरह से आपके ब्राउज़र में संसाधित किया जा सकता है - फ़ाइल कभी भी आपके डिवाइस से बाहर नहीं जाती है
-
फ़ाइल आकार: आमतौर पर प्रति पृष्ठ 50KB–500KB
-
पहचान कैसे करें: आप व्यक्तिगत शब्दों का चयन और हाइलाइट कर सकते हैं
स्कैन किए गए पीडीएफ
कागजी स्टेटमेंट की छवियां - एक भौतिक दस्तावेज़ को स्कैन करके या तस्वीर लेकर बनाई गई। सामग्री को रास्टराइज़्ड छवियों (JPEG, JPEG2000, CCITT, या Flate संपीड़ित) के रूप में संग्रहीत किया जाता है।
-
सटीकता: पेशेवर ओसीआर के साथ 95–99%; सामान्य ओसीआर के साथ 65–70%
-
गति: प्रति पृष्ठ सेकंड (छवि प्रसंस्करण की आवश्यकता है)
-
गोपनीयता: आमतौर पर सर्वर-साइड प्रसंस्करण की आवश्यकता होती है (ओसीआर के लिए फ़ाइल अपलोड की जानी चाहिए)
-
फ़ाइल आकार: 200KB–2MB+ प्रति पृष्ठ
-
पहचान कैसे करें: आप कोई भी टेक्स्ट नहीं चुन सकते हैं; 400% तक ज़ूम करने पर पिक्सेलेशन दिखाई देता है
वित्तीय डेटा के लिए स्कैन की गई सटीकता क्यों अधिक मायने रखती है
97% कैरेक्टर सटीकता दर बहुत अच्छी लगती है, जब तक कि आप इसे वित्तीय डेटा पर लागू नहीं करते। 1,000 कैरेक्टर की राशि वाले स्टेटमेंट पर, यह 30 गलत पढ़े गए कैरेक्टर हैं। एक भी गलत पढ़ा गया अंक एक लेनदेन राशि को बदल देता है: "$1,234.56" "$1,234.86" या "$7,234.56" बन जाता है। उन्नत ओसीआर लगभग 99% सटीकता प्राप्त करता है, लेकिन शेष त्रुटियां उन वर्णों पर असमान रूप से गिरती हैं जो समान दिखते हैं: 0/O, 1/l/I, 5/S, 8/B, 6/G, और महत्वपूर्ण रूप से, कॉमा/पीरियड।
हमेशा डिजिटल डाउनलोड को प्राथमिकता दें। कागज को स्कैन करने के बजाय अपने बैंक की वेबसाइट से स्टेटमेंट डाउनलोड करें। यह ओसीआर त्रुटियों को पूरी तरह से समाप्त करता है।
आउटपुट फॉर्मेट: गहन विश्लेषण

जब आप बैंक स्टेटमेंट को परिवर्तित करते हैं, तो आप एक आउटपुट फॉर्मेट चुनते हैं। प्रत्येक फॉर्मेट की अपनी अलग ताकत, सीमाएं और आदर्श उपयोग के मामले होते हैं।
एक्सेल (.xlsx)
मानक: ऑफिस ओपन एक्सएमएल (OOXML), ECMA-376 और ISO/IEC 29500 के रूप में मानकीकृत।
यह क्या है: एक .xlsx फ़ाइल वास्तव में एक ज़िप आर्काइव है जिसमें XML फ़ाइलें होती हैं - वर्कबुक संरचना, सेल डेटा, शैलियाँ और साझा स्ट्रिंग्स। इसीलिए यह डेटा प्रकार (तारीखें तारीखों के रूप में, संख्याएं संख्याओं के रूप में), फ़ॉर्मेटिंग, फ़ॉर्मूला और एकाधिक शीट स्टोर कर सकता है।
बैंक स्टेटमेंट के लिए यह क्यों लोकप्रिय है:
- तारीखें तारीखें बनी रहती हैं (सॉर्ट करने योग्य, फ़िल्टर करने योग्य)
- संख्याएं संख्याएं बनी रहती हैं (जोड़ने योग्य, फ़ॉर्मेट करने योग्य)
- समाधान के लिए फ़ॉर्मूला (SUM, VLOOKUP)
- खर्चों के वर्गीकरण के लिए पिवट टेबल
- विसंगतियों को उजागर करने के लिए सशर्त स्वरूपण
- उन ग्राहकों के साथ साझा करें जिन्हें एक पठनीय स्प्रेडशीट की आवश्यकता है
सीमाएं:
- अधिकतम 1,048,576 पंक्तियाँ (बैंक स्टेटमेंट के लिए शायद ही कभी प्रासंगिक)
- अधिकांश अकाउंटिंग सॉफ़्टवेयर में सीधे आयात योग्य नहीं (इसके बजाय QBO/OFX का उपयोग करें)
- खोलने के लिए एक्सेल, गूगल शीट्स, या लिब्रे ऑफिस कैल्क की आवश्यकता है
इसके लिए सर्वश्रेष्ठ: मैन्युअल समीक्षा, कस्टम विश्लेषण, समाधान, संग्रह, ग्राहक रिपोर्टिंग।
CSV (कॉमा-सेपरेटेड वैल्यूज)
मानक: RFC 4180 (2005) - "कॉमा-सेपरेटेड वैल्यूज के लिए सामान्य फॉर्मेट और एमआईएमई टाइप।"
मुख्य नियम:
- CRLF (कैरिज रिटर्न + लाइन फीड) द्वारा सीमांकित रिकॉर्ड
- अल्पविराम द्वारा अलग किए गए फ़ील्ड
- अल्पविराम, उद्धरण चिह्नों या लाइन ब्रेक वाले फ़ील्ड को डबल कोट्स में संलग्न किया जाना चाहिए
- फ़ील्ड के भीतर डबल कोट्स को दोगुना करके एस्केप किया जाता है
जंगल में सीमांकक भिन्नताएं:
- अल्पविराम (
,) - मानक, अमेरिका/यूके में प्रयुक्त - अर्धविराम (
;) - उन देशों में प्रयुक्त जहां अल्पविराम दशमलव विभाजक है (फ्रांस, जर्मनी, इटली, स्पेन, ब्राजील) - टैब (
\t) - TSV फॉर्मेट, सीमांकक टकराव से बचता है
एन्कोडिंग मुद्दे:
- अंतरसंचालनीयता के लिए UTF-8 की सिफारिश की जाती है
- UTF-8 BOM (बाइट ऑर्डर मार्क): मानक द्वारा आवश्यक नहीं है, लेकिन विंडोज पर एक्सेल को गैर-ASCII वर्णों (उच्चारण वाले अक्षर, मुद्रा प्रतीक) को सही ढंग से प्रदर्शित करने के लिए इसकी आवश्यकता होती है। बीओएम के बिना, एक्सेल UTF-8 को विंडोज-1252 के रूप में व्याख्या कर सकता है, जिससे वर्ण दूषित हो जाते हैं।
- एक्सेल यूरोपीय लोकेल में फ़ील्ड सेपरेटर के रूप में अल्पविराम के बजाय अर्धविराम का उपयोग करता है
सीमाएं:
- कोई डेटा प्रकार नहीं - सब कुछ टेक्स्ट है (शून्य से शुरू होने वाली संख्याएं दूषित हो जाती हैं, लंबी खाता संख्याएं वैज्ञानिक संकेतन बन जाती हैं)
- मल्टी-शीट समर्थन नहीं
- कोई फ़ॉर्मेटिंग या फ़ॉर्मूला नहीं
- कोई मेटाडेटा नहीं (कोई खाता जानकारी नहीं, कोई डुप्लिकेट पहचान आईडी नहीं)
इसके लिए सर्वश्रेष्ठ: अधिकतम संगतता - लगभग हर अकाउंटिंग प्रोग्राम, डेटाबेस और स्प्रेडशीट सीएसवी आयात कर सकती है। क्यूबीओ/ओएफएक्स उपलब्ध न होने पर सार्वभौमिक फ़ॉलबैक।
QBO (क्विकबुक्स वेब कनेक्ट)
यह क्या है: क्विकबुक्स (डेस्कटॉप और ऑनलाइन दोनों) के लिए आयात फॉर्मेट। क्यूबीओ फाइलें ओएफएक्स विनिर्देश पर क्विकबुक्स-विशिष्ट एक्सटेंशन के साथ आधारित हैं।
महत्वपूर्ण स्पष्टीकरण: ".QBO" का मतलब "क्विकबुक्स ऑनलाइन" नहीं है - यह क्विकबुक्स वेब कनेक्ट फॉर्मेट के लिए खड़ा है और क्विकबुक्स डेस्कटॉप और क्विकबुक्स ऑनलाइन दोनों के साथ काम करता है।
प्रति ट्रांजेक्शन आवश्यक फ़ील्ड:
TRNTYPE- ट्रांजेक्शन प्रकार (DEBIT, CREDIT, CHECK, DEP, DIRECTDEP, DIRECTDEBIT, ATM, POS, XFER, PAYMENT, FEE, SRVCHG, INT, OTHER)DTPOSTED- YYYYMMDD फॉर्मेट में तारीखTRNAMT- राशि (डेबिट के लिए ऋणात्मक)FITID- वित्तीय संस्थान ट्रांजेक्शन आईडीNAME- भुगतानकर्ता/विवरण
FITID क्यों मायने रखता है: क्विकबुक्स प्रत्येक खाते के लिए आयातित हर FITID को ट्रैक करता है। यदि समान FITID वाले ट्रांजेक्शन को फिर से आयात किया जाता है, तो क्विकबुक्स चुपचाप उसे छोड़ देता है - उपयोगकर्ताओं द्वारा ओवरलैपिंग स्टेटमेंट अवधियों को फिर से आयात करते समय डुप्लिकेट प्रविष्टियों को रोकता है। यह स्वचालित डुप्लिकेट पहचान क्यूबीओ का सीएसवी पर सबसे बड़ा लाभ है।
अतिरिक्त डेटा: क्यूबीओ खाता आईडी, बैंक आईडी (रूटिंग नंबर), मुद्रा, चेक संख्या, मेमो और अंतिम शेष राशि भी ले जाता है - क्विकबुक्स के लिए किसी भी आयात फॉर्मेट का सबसे समृद्ध डेटा सेट।
इसके लिए सर्वश्रेष्ठ: क्विकबुक्स उपयोगकर्ता (डेस्कटॉप और ऑनलाइन)। स्वचालित डुप्लिकेट पहचान और ट्रांजेक्शन प्रकार वर्गीकरण के साथ सबसे समृद्ध आयात अनुभव प्रदान करता है।
OFX (ओपन फाइनेंशियल एक्सचेंज)
इतिहास: माइक्रोसॉफ्ट, इंटुइट और चेकफ्री द्वारा बनाया गया। फरवरी 1997 में संस्करण 1.0 जारी किया गया।
संस्करण विकास:
- OFX 1.0–1.6 (1997–1999): SGML-आधारित सिंटैक्स (कोई क्लोजिंग टैग आवश्यक नहीं)
- OFX 2.0+ (2000–वर्तमान): XML-आधारित (उचित क्लोजिंग टैग, सुगठित XML)
कई बैंक अभी भी अधिकतम संगतता के लिए OFX 1.x (SGML) का उत्पादन करते हैं।
वर्तमान शासन: 2019 में, OFX कंसोर्टियम फाइनेंशियल डेटा एक्सचेंज (FDX) कंसोर्टियम में विलय हो गया, जो अब विनिर्देश का प्रबंधन करता है। FDX के 200 से अधिक सदस्य संगठन और 76 मिलियन उपभोक्ता खाते हैं।
OFX सार्वभौमिक मानक क्यों है: OFX वही फॉर्मेट है जिसका उपयोग तब किया जाता है जब आप बैंक फ़ीड के माध्यम से अपने बैंक खाते को सीधे अकाउंटिंग सॉफ़्टवेयर से कनेक्ट करते हैं - वही फॉर्मेट फ़ाइल आयात के लिए काम करता है।
Xero उपयोगकर्ताओं के लिए सर्वश्रेष्ठ: Xero स्वचालित रूप से OFX फ़ाइलों को मैन्युअल कॉलम मैपिंग की आवश्यकता के बिना आयात करता है। फ़ाइल अपलोड करें और ट्रांजेक्शन तुरंत सही तारीखों, राशियों और विवरणों के साथ दिखाई देते हैं। वेव, सेज, फ्रेशबुक्स और अधिकांश अकाउंटिंग सॉफ़्टवेयर के साथ भी काम करता है।
QFX (क्विकेन फाइनेंशियल एक्सचेंज)
यह क्या है: इंटुइट का OFX का मालिकाना संस्करण, विशेष रूप से क्विकेन के साथ उपयोग किया जाता है। एक QFX फ़ाइल अतिरिक्त मालिकाना फ़ील्ड के साथ एक मानक OFX फ़ाइल है।
मुख्य मालिकाना फ़ील्ड: INTU.BID - क्विकेन बैंक पहचानकर्ता। यह संख्यात्मक आईडी क्विकेन के आंतरिक डेटाबेस में एक बैंक से मैप करती है। इसके बिना, क्विकेन फ़ाइल आयात करने से इनकार कर देता है।
मानक OFX से अंतर:
- हेडर में INTU.BID की आवश्यकता है
- अन्य INTU.* प्रीफ़िक्स्ड फ़ील्ड शामिल हो सकते हैं
- वित्तीय संस्थान क्विकन को बैंक स्टेटमेंट डाउनलोड प्रदान करने के लिए लाइसेंस शुल्क का भुगतान करते हैं
- क्विकेन INTU.BID फ़ील्ड के बिना मानक OFX फ़ाइलों को आयात नहीं करेगा
इसके लिए सर्वश्रेष्ठ: क्विकेन व्यक्तिगत वित्त सॉफ्टवेयर उपयोगकर्ता। आवश्यक फॉर्मेट - कोई विकल्प काम नहीं करता।
QIF (क्विकेन इंटरचेंज फॉर्मेट)
यह क्या है: क्विकेन के लिए इंटुइट द्वारा विकसित एक लेगेसी प्लेन-टेक्स्ट फॉर्मेट। टैग-वैल्यू जोड़े, प्रति पंक्ति एक, एकल कैरेक्टर टैग के साथ: D तारीख के लिए, T राशि के लिए, P भुगतानकर्ता के लिए, L श्रेणी के लिए, M मेमो के लिए, N चेक संख्या के लिए, ^ रिकॉर्ड के अंत के लिए।
इसे क्यों बदला गया: QIF में डुप्लिकेट पहचान तंत्र (कोई FITID समतुल्य नहीं) का अभाव है, कोई खाता पहचान फ़ील्ड नहीं है, कोई बैंक रूटिंग जानकारी नहीं है, कोई शेष राशि डेटा नहीं है, और कार्यान्वयन में असंगत तारीख फ़ॉर्मेटिंग है।
अभी भी प्रासंगिक: कुछ अकाउंटिंग सॉफ़्टवेयर (Xero, Sage, GnuCash) अभी भी QIF आयात स्वीकार करते हैं। लेगेसी सिस्टम माइग्रेशन के लिए उपयोगी।
JSON (जावास्क्रिप्ट ऑब्जेक्ट नोटेशन)
वर्तमान स्थिति: JSON अभी तक बैंक स्टेटमेंट फ़ाइलों के लिए एक मानक नहीं है, लेकिन तेजी से इसमें उपयोग किया जा रहा है:
- ओपन बैंकिंग एपीआई (यूके ओपन बैंकिंग स्टैंडर्ड, PSD2 बर्लिन ग्रुप)
- FDX API (फाइनेंशियल डेटा एक्सचेंज - OFX का उत्तराधिकारी, 200+ सदस्य संगठन)
- Plaid, Yodlee, MX और अन्य डेटा एग्रीगेटर एपीआई
- डेवलपर और ऑटोमेशन वर्कफ़्लो
बढ़ती गोद लेना: ओपन बैंकिंग नियम (यूरोप में PSD2, अमेरिका में CFPB धारा 1033) JSON API गोद लेने में तेजी ला रहे हैं। FDX API JSON/REST का उपयोग OAuth 2.0 के साथ करता है, जो वित्तीय डेटा विनिमय की भविष्य की दिशा का प्रतिनिधित्व करता है।
इसके लिए सर्वश्रेष्ठ: स्वचालित वर्कफ़्लो, फिनटेक एकीकरण, कस्टम डैशबोर्ड और ओपन बैंकिंग एपीआई एकीकरण बनाने वाले डेवलपर्स।
फॉर्मेट की तुलना एक नज़र में
| फॉर्मेट | डेटा प्रकार | डुप्लिकेट पहचान | खाता जानकारी | अकाउंटिंग सॉफ्टवेयर सपोर्ट | इसके लिए सर्वश्रेष्ठ |
|---|---|---|---|---|---|
| एक्सेल | हाँ | नहीं | नहीं | सीमित | मैन्युअल समीक्षा, विश्लेषण |
| CSV | नहीं | नहीं | नहीं | सार्वभौमिक | अधिकतम संगतता |
| QBO | हाँ | हाँ (FITID) | हाँ | क्विकबुक्स | क्विकबुक्स उपयोगकर्ता |
| OFX | हाँ | हाँ (FITID) | हाँ | अधिकांश सॉफ्टवेयर | Xero, Wave, Sage |
| QFX | हाँ | हाँ (FITID) | हाँ | केवल क्विकेन | क्विकेन उपयोगकर्ता |
| QIF | आंशिक | नहीं | नहीं | कुछ लेगेसी | लेगेसी माइग्रेशन |
| JSON | हाँ | कस्टम | हाँ | एपीआई-आधारित | डेवलपर्स, ऑटोमेशन |
अकाउंटिंग सॉफ्टवेयर कम्पेटिबिलिटी
आपका अकाउंटिंग सॉफ्टवेयर कौन सा फॉर्मेट स्वीकार करता है?
| सॉफ्टवेयर | QBO | OFX | QFX | QIF | CSV | सर्वश्रेष्ठ विकल्प |
|---|---|---|---|---|---|---|
| क्विकबुक्स ऑनलाइन | हाँ | हाँ | हाँ | नहीं | हाँ | QBO |
| क्विकबुक्स डेस्कटॉप | हाँ | हाँ | हाँ | नहीं | हाँ | QBO |
| क्विकेन | नहीं | नहीं | हाँ | हाँ | नहीं | QFX |
| Xero | हाँ | हाँ | हाँ | हाँ | हाँ | OFX |
| सेज | नहीं | हाँ | नहीं | हाँ | हाँ | OFX |
| वेव | नहीं | हाँ | हाँ | नहीं | हाँ | OFX |
| फ्रेशबुक्स | नहीं | नहीं | नहीं | नहीं | हाँ | CSV |
| जोहो बुक्स | नहीं | हाँ | नहीं | हाँ | हाँ | OFX |
| GnuCash | नहीं | हाँ | नहीं | हाँ | हाँ | OFX |
अंगूठे का नियम: क्विकबुक्स के लिए QBO, क्विकेन के लिए QFX, बाकी सब के लिए OFX, और एक सार्वभौमिक फ़ॉलबैक के रूप में CSV का उपयोग करें।
अंतर्राष्ट्रीय फॉर्मेट अंतर
यदि आप अंतर्राष्ट्रीय बैंक स्टेटमेंट के साथ काम करते हैं, तो आपको ऐसे फॉर्मेट अंतर मिलेंगे जो अधिकांश रूपांतरण टूल को परेशान करते हैं।
दिनांक फॉर्मेट
| क्षेत्र | फॉर्मेट | उदाहरण | नोट्स |
|---|---|---|---|
| संयुक्त राज्य अमेरिका | MM/DD/YYYY | 03/15/2026 | महीना पहले |
| यूरोप, लैटिन अमेरिका | DD/MM/YYYY | 15/03/2026 | दिन पहले |
| जर्मनी | DD.MM.YYYY | 15.03.2026 | अवधि विभाजक |
| जापान | YYYY年MM月DD日 | 2026年03月01日 | कांजी के साथ वर्ष पहले |
| चीन | YYYY年MM月DD日 | 2026年3月1日 | जापान के समान |
| ISO 8601 | YYYY-MM-DD | 2026-03-15 | अस्पष्ट अंतर्राष्ट्रीय मानक |
अस्पष्टता समस्या: "03/04/2026" अमेरिका में 4 मार्च है लेकिन यूरोप में 3 अप्रैल है। जब स्टेटमेंट में सभी तारीखों में दिन का मान 12 या उससे कम होता है, तो मूल देश को जाने बिना सही फॉर्मेट निर्धारित करने का कोई एल्गोरिथम तरीका नहीं होता है। रूपांतरण टूल को स्टेटमेंट में सभी तारीखों को स्कैन करना चाहिए, फॉर्मेट निर्धारित करने के लिए 12 से अधिक मानों की तलाश करनी चाहिए।
संख्या फॉर्मेट
| क्षेत्र | एक हजार और पचास सेंट | नोट्स |
|---|---|---|
| अमेरिका, यूके, ऑस्ट्रेलिया, जापान | 1,000.50 | हजारों के लिए अल्पविराम, दशमलव के लिए अवधि |
| जर्मनी, फ्रांस, स्पेन, ब्राजील, इटली | 1.000,50 | हजारों के लिए अवधि, दशमलव के लिए अल्पविराम |
| स्विट्जरलैंड | 1'000.50 | हजारों के लिए एपोस्ट्रॉफी |
| भारत | 1,00,000.50 | लाख समूहीकरण प्रणाली |
| स्कैंडिनेविया | 1 000,50 | हजारों के लिए स्पेस, दशमलव के लिए अल्पविराम |
"10.000,45" एक यूरोपीय बैंक से दस हजार और पैंतालीस सेंट का मतलब है - दस पॉइंट शून्य शून्य शून्य चार पांच नहीं। इसे गलत करने से 10,000x परिमाण की त्रुटियां होती हैं।
मुद्रा प्रतीक प्लेसमेंट
- अमेरिका/यूके: राशि से पहले प्रतीक: $1,234.56 / £1,234.56
- फ्रांस, जर्मनी, स्पेन: राशि के बाद प्रतीक: 1.234,56 €
- आयरलैंड, नीदरलैंड: पहले प्रतीक: €1,234.56
- जापान: पहले प्रतीक: ¥123,456
कैरेक्टर एन्कोडिंग
- UTF-8 - सार्वभौमिक मानक, सभी लिपियों का समर्थन करता है
- GBK/GB2312 - सरलीकृत चीनी (चीनी बैंकों द्वारा प्रयुक्त)
- Shift_JIS - जापानी (जापानी बैंकों द्वारा प्रयुक्त)
- Big5 - पारंपरिक चीनी (ताइवान, हांगकांग)
- EUC-KR - कोरियाई
- ISO 8859-1 - पश्चिमी यूरोपीय
- Windows-1252 - पश्चिमी यूरोपीय (लेगेसी)
- Windows-1256 - अरबी
सही एन्कोडिंग डिटेक्शन के बिना एक अमेरिकी सिस्टम पर एक चीनी या जापानी बैंक स्टेटमेंट खोलने से विकृत वर्ण उत्पन्न होते हैं। PDFSub 130+ भाषाओं को दिनांक फॉर्मेट, संख्या फॉर्मेट और कैरेक्टर एन्कोडिंग के स्वचालित डिटेक्शन के साथ संभालता है - जिसमें दाएं-से-बाएं अरबी और हिब्रू, CJK वर्ण और सभी यूरोपीय कैरेक्टर सेट शामिल हैं।
सामान्य बैंक स्टेटमेंट तत्व
ट्रांजेक्शन तिथि बनाम पोस्टिंग तिथि बनाम वैल्यू तिथि
बैंक स्टेटमेंट में एक ही ट्रांजेक्शन के लिए कई तारीखें शामिल हो सकती हैं:
- ट्रांजेक्शन तिथि - खरीद या हस्तांतरण वास्तव में कब हुआ
- पोस्टिंग तिथि - बैंक ने इसे कब संसाधित और रिकॉर्ड किया (आमतौर पर क्रेडिट कार्ड खरीद के लिए 1-3 व्यावसायिक दिन बाद)
- वैल्यू तिथि - फंड वास्तव में कब उपलब्ध हुए (ब्याज गणना को प्रभावित करता है, अंतरराष्ट्रीय बैंकिंग में आम)
अधिकांश उपभोक्ता स्टेटमेंट केवल पोस्टिंग तिथि दिखाते हैं। व्यावसायिक विवरणों में अक्सर ट्रांजेक्शन और पोस्टिंग दोनों तिथियां शामिल होती हैं।
डेबिट/क्रेडिट प्रतिनिधित्व
बैंक डेबिट और क्रेडिट को अलग-अलग तरीकों से दर्शाते हैं:
- चिह्नित राशि: डेबिट के लिए -87.50, क्रेडिट के लिए +3,500.00
- अलग कॉलम: "निकासी" और "जमा"
- संक्षिप्त रूप: डेबिट के लिए "DR", क्रेडिट के लिए "CR" (यूके/राष्ट्रमंडल में आम)
- कोष्ठक: डेबिट के लिए (87.50) (लेखांकन परंपरा)
रनिंग बैलेंस
- प्रति-लेनदेन शेष: हर ट्रांजेक्शन के बाद अपडेट किया जाता है (अमेरिकी उपभोक्ता विवरणों में सबसे आम)
- केवल दैनिक शेष: प्रत्येक दिन के अंत में दिखाया गया शेष (व्यावसायिक विवरणों में आम)
- कोई रनिंग बैलेंस नहीं: केवल शुरुआती और अंतिम शेष (कुछ अंतरराष्ट्रीय विवरण)
रनिंग बैलेंस सत्यापन के लिए मूल्यवान हैं: आप सत्यापित कर सकते हैं कि प्रत्येक ट्रांजेक्शन ने शेष राशि को एक पंक्ति से दूसरी पंक्ति में सही ढंग से ले जाया है।
मानक हेडर जानकारी
अधिकांश बैंक स्टेटमेंट में शामिल हैं: खाताधारक का नाम, खाता संख्या (अक्सर आंशिक रूप से मास्क किया गया), स्टेटमेंट अवधि, शुरुआती और अंतिम शेष, कुल जमा और निकासी, और बैंक रूटिंग/सॉर्ट कोड/SWIFT BIC।
पासवर्ड सुरक्षा
बैंक पीडीएफ को कैसे एन्क्रिप्ट करते हैं
बैंक आमतौर पर AES-128 या AES-256 एन्क्रिप्शन का उपयोग करते हैं। दो सुरक्षा मोड मौजूद हैं:
- उपयोगकर्ता पासवर्ड (ओपन पासवर्ड): फ़ाइल खोलने के लिए आवश्यक
- मालिक पासवर्ड (अनुमतियाँ पासवर्ड): पीडीएफ खुलता है लेकिन संपादन/कॉपी प्रतिबंधित हो सकती है
सामान्य पासवर्ड पैटर्न
| बैंक | विशिष्ट पासवर्ड |
|---|---|
| चेस | पूर्ण 9-अंकीय SSN |
| बैंक ऑफ अमेरिका | SSN या TIN |
| वेल्स फारगो | SSN या SSN के अंतिम 4 अंक |
| कैपिटल वन | जन्म तिथि (MMDDYYYY) |
अन्य सामान्य पैटर्न में खाता संख्या के अंतिम 4 अंक, ग्राहक आईडी, या सदस्य संख्या शामिल हैं। बैंक आमतौर पर इलेक्ट्रॉनिक स्टेटमेंट सक्षम करने पर पासवर्ड पैटर्न बताते हैं।
मल्टी-पेज स्टेटमेंट चुनौतियां
लंबे स्टेटमेंट (सैकड़ों लेनदेन वाले व्यावसायिक खाते) कई एक्सट्रैक्शन चुनौतियां पैदा करते हैं:
विभाजित ट्रांजेक्शन
एक ट्रांजेक्शन विवरण एक पृष्ठ के नीचे शुरू हो सकता है और अगले पृष्ठ के शीर्ष पर जारी रह सकता है। कन्वर्टर को निरंतरता लाइनों का पता लगाना चाहिए और उन्हें एक ही ट्रांजेक्शन में मर्ज करना चाहिए।
दोहराए गए हेडर और फुटर
अधिकांश बैंक हर पृष्ठ पर कॉलम हेडर दोहराते हैं, साथ ही पृष्ठ संख्या, कानूनी अस्वीकरण और विपणन पाठ भी। इन्हें पहचाना जाना चाहिए और निकाले गए डेटा से बाहर रखा जाना चाहिए।
निरंतरता लाइनें
कई ट्रांजेक्शन में बहु-पंक्ति विवरण होते हैं:
01/15 ACH इलेक्ट्रॉनिक डेबिट वेंडर कॉर्प $3,200.00 $2,000.00 REF#123456789 INVOICE 2026-001 VENDOR CORP ACCOUNTS PAYABLEपंक्ति 2 और 3 पंक्ति 1 के ट्रांजेक्शन से संबंधित निरंतरता लाइनें हैं। उनमें आमतौर पर कोई तारीख और राशि नहीं होती है, और वे विवरण कॉलम के समान x-निर्देशांक पर इंडेंटेड दिखाई देते हैं।
शेष राशि आगे ले जाना
कुछ बैंक निरंतरता पृष्ठों के शीर्ष पर "बैलेंस फॉरवर्ड" या "बैलेंस ब्रॉट फॉरवर्ड" लाइनें शामिल करते हैं। ये सूचनात्मक हैं, ट्रांजेक्शन नहीं, और निकाले गए डेटा से बाहर रखा जाना चाहिए।
सामान्य ट्रांजेक्शन संक्षिप्ताक्षर
बैंक स्टेटमेंट में ऐसे संक्षिप्ताक्षर का उपयोग किया जाता है जो संस्थानों में भिन्न होते हैं:
| संक्षिप्ताक्षर | अर्थ |
|---|---|
| ACH | ऑटोमेटेड क्लियरिंग हाउस (इलेक्ट्रॉनिक हस्तांतरण) |
| ATM | ऑटोमेटेड टेलर मशीन |
| POS | पॉइंट ऑफ सेल (डेबिट कार्ड) |
| EFT | इलेक्ट्रॉनिक फंड ट्रांसफर |
| INT | ब्याज भुगतान |
| CHK / CK | चेक |
| WD / W/D | निकासी |
| DEP | जमा |
| DD | डायरेक्ट डिपॉजिट |
| OD | ओवरड्राफ्ट |
| NSF | अपर्याप्त धन |
| SRVCHG | सेवा शुल्क |
| XFER | ट्रांसफर |
जानने योग्य उद्योग मानक
इन फॉर्मेट का उपयोग कॉर्पोरेट बैंकिंग और ट्रेजरी प्रबंधन में किया जाता है। आप शायद ही कभी इनका सीधे सामना करेंगे, लेकिन उन्हें समझने से पता चलता है कि बैंक स्टेटमेंट कैसे काम करते हैं।
BAI2 (बैंक एडमिनिस्ट्रेशन इंस्टीट्यूट)
ईआरपी सिस्टम (एसएपी, ओरेकल) में स्वचालित नकद प्रबंधन और बैंक समाधान के लिए उपयोग किया जाता है। ट्रांजेक्शन प्रकार कोड के साथ एक फिक्स्ड-विड्थ ASCII फॉर्मेट (जैसे, 165 = पूर्व-अधिकृत ACH क्रेडिट, 455 = ACH डेबिट, 495 = वायर ट्रांसफर आउट)। मूल रूप से 1987 में जारी किया गया, अब ASC X9 द्वारा बनाए रखा गया है।
SWIFT MT940 / MT940
कॉर्पोरेट ग्राहकों और ट्रेजरी विभागों के लिए दुनिया भर के बैंकों द्वारा उपयोग किए जाने वाले दिन के अंत (MT940) और इंट्राडे (MT942) बैंक स्टेटमेंट। SWIFT प्रतिदिन लगभग 45 मिलियन संदेशों को संसाधित करता है। कॉलन-डिलिमिटेड फ़ील्ड पहचानकर्ताओं के साथ टैग-आधारित फॉर्मेट।
ISO 20022 (camt.053)
MT940 का आधुनिक XML-आधारित प्रतिस्थापन। ISO 20022 सार्वभौमिक वित्तीय मैसेजिंग मानक का हिस्सा। MT940 की तुलना में समृद्ध डेटा, कोई फ़ील्ड लंबाई सीमा नहीं, मशीन-पार्स करने योग्य XML जिसमें XSD सत्यापन है। SWIFT MT संदेशों से ISO 20022 में माइग्रेट कर रहा है। SEPA (सिंगल यूरो पेमेंट्स एरिया) यूरोपीय भुगतानों के लिए camt फॉर्मेट को अनिवार्य करता है।
NACHA ACH
अमेरिका में ऑटोमेटेड क्लियरिंग हाउस लेनदेन के लिए फ़ाइल फॉर्मेट। फिक्स्ड-विड्थ ASCII, प्रति पंक्ति बिल्कुल 94 कैरेक्टर। ACH अमेरिका में प्रति वर्ष लगभग 30 बिलियन लेनदेन को संसाधित करता है। जब आपके बैंक स्टेटमेंट में "ACH CREDIT" या "ACH DEBIT" दिखाई देता है, तो अंतर्निहित ट्रांजेक्शन बैंकों के बीच NACHA फॉर्मेट में प्रेषित किया गया था।
अपने वर्कफ़्लो के लिए सही फॉर्मेट चुनना
निर्णय गाइड
यदि आप क्विकबुक्स का उपयोग करते हैं (डेस्कटॉप या ऑनलाइन) तो QBO का उपयोग करें। आपको ट्रांजेक्शन प्रकार वर्गीकरण, FITID के माध्यम से डुप्लिकेट पहचान, और सबसे समृद्ध आयात मेटाडेटा मिलता है।
यदि आप Xero, Sage, Wave, या अन्य OFX-संगत सॉफ़्टवेयर का उपयोग करते हैं तो OFX का उपयोग करें। Xero मैन्युअल कॉलम कॉन्फ़िगरेशन के बिना फ़ील्ड को ऑटो-मैप करता है।
यदि आप Quicken का उपयोग करते हैं तो QFX का उपयोग करें। यह एकमात्र फॉर्मेट है जिसे Quicken स्वीकार करता है।
यदि आपको आयात करने से पहले डेटा की समीक्षा, विश्लेषण या हेरफेर करने की आवश्यकता है तो Excel का उपयोग करें। पिवट टेबल बनाएं, फ़ॉर्मूला चलाएं, या रिपोर्ट तैयार करें।
यदि आपका सॉफ़्टवेयर ऊपर सूचीबद्ध नहीं है, या आपको अधिकतम संगतता की आवश्यकता है तो CSV का उपयोग करें। कॉलम को मैन्युअल रूप से मैप करने के लिए तैयार रहें।
यदि आप स्वचालित वर्कफ़्लो, एपीआई एकीकरण, या कस्टम रिपोर्टिंग सिस्टम बना रहे हैं तो JSON का उपयोग करें।
प्रो टिप्स
- जब आपका सॉफ़्टवेयर इसका समर्थन करता है तो हमेशा CSV पर QBO/OFX का उपयोग करें - केवल डुप्लिकेट पहचान ही घंटों की सफाई को रोकती है।
- कन्वर्ट की गई फ़ाइल के साथ मूल पीडीएफ रखें - यह आपका ऑडिट ट्रेल और स्रोत दस्तावेज़ है।
- हर आयात के बाद सत्यापित करें - शुरुआती/अंतिम शेष राशि और कुछ यादृच्छिक लेनदेन की स्पॉट-चेक करें।
- सॉफ़्टवेयर के अनुसार फॉर्मेट का मिलान करें - अपने अकाउंटिंग प्लेटफ़ॉर्म के लिए मूल फॉर्मेट का उपयोग करने से मैन्युअल कॉलम मैपिंग से बचा जाता है और स्वचालित सुविधाएँ सक्षम होती हैं।
नि:शुल्क आज़माएँ
अपना पहला स्टेटमेंट बदलने के लिए तैयार हैं? अभी एक पीडीएफ अपलोड करें - PDFSub एक्सेल, सीएसवी, क्यूबीओ, ओएफएक्स, क्यूएफएक्स और जेएसओएन में परिवर्तित करता है। डिजिटल स्टेटमेंट अधिकतम गोपनीयता के लिए पूरी तरह से आपके ब्राउज़र में संसाधित किए जाते हैं। सभी फॉर्मेट तक पूरी पहुंच के साथ 7-दिवसीय निःशुल्क परीक्षण शुरू करें।