PDFSub
قیمت‌گذاریAPIMergeCompressEditE-Signصورت‌حساب‌های بانکیبلاگ
بازگشت به بلاگ
راهنمافنیExcelCSVQBOOFX

آشنایی با فرمت‌های صورت‌حساب بانکی: راهنمای فنی

۲۶ اردیبهشت ۱۴۰۵
T
Todd Lahman
Founder, PDFSub

PDF یک فرمت داده نیست، بلکه یک فرمت نمایش است. به همین دلیل استخراج داده‌های تراکنش از صورت‌حساب‌های بانکی به طرز شگفت‌آوری دشوار است. این راهنما توضیح می‌دهد که درون یک PDF صورت‌حساب بانکی چیست، فرمت‌های خروجی موجود (Excel، CSV، QBO، OFX، QFX، JSON) کدامند و چگونه فرمت مناسب را انتخاب کنید.


Understanding Bank Statement Formats: The Technical Guide

یک PDF صورت‌حساب بانکی ساده به نظر می‌رسد: تاریخ‌ها، توضیحات، مبالغ، موجودی‌ها در ستون‌های مرتب. اما پشت این ظاهر، فرمت سندی (PDF) نهفته است که هرگز برای ذخیره داده‌های ساختاریافته طراحی نشده است - و فرآیند تبدیل که نیازمند درک هم فرمت ورودی و هم فرمت‌های خروجی متعدد موجود است.

این راهنما ۱۲ بخش را که در هر صورت‌حساب بانکی (صرف نظر از بانک) ظاهر می‌شوند، واقعیت فنی PDFهای صورت‌حساب بانکی، تنوع چیدمان در بانک‌های مختلف، هر فرمت خروجی که با آن مواجه خواهید شد (Excel، CSV، QBO، OFX، QFX، QIF، JSON)، تفاوت‌های قالب‌بندی بین‌المللی و استانداردهای صنعتی که تبادل داده‌های مالی را تنظیم می‌کنند، پوشش می‌دهد.


اجزای صورت‌حساب بانکی

هر صورت‌حساب بانکی - چیس، بانک آو آمریکا، ولز فارگو، HSBC، دویچه بانک، هر نامی که بگویید - از ۱۲ بخش یکسان ساخته شده است. برچسب‌ها تغییر می‌کنند ("کسورات" در مقابل "برداشت‌ها")، چیدمان ستون‌ها متفاوت است، اما ساختار زیربنایی سازگار است. هنگامی که بتوانید این بخش‌ها را شناسایی کنید، هر صورت‌حساب آشنا به نظر می‌رسد.

Anatomy of a bank statement: 12 labeled sections every statement contains

آیا می‌خواهید از این اینفوگرافیک در وبلاگ خود استفاده کنید؟ کد جاسازی را کپی کنید:

برای بررسی‌های عمیق مخصوص بانک که دقیقاً نحوه چیدمان این ۱۲ بخش را در هر بانک اصلی پوشش می‌دهد، ببینید:

  • صورت‌حساب بانک چیس توضیح داده شده
  • صورت‌حساب بانک آو آمریکا توضیح داده شده
  • صورت‌حساب ولز فارگو توضیح داده شده
  • صورت‌حساب سیتی بانک توضیح داده شده
  • صورت‌حساب کپیتال وان توضیح داده شده

چرا PDF فرمت داده نیست

PDF مخفف Portable Document Format است که به عنوان ISO 32000 (نسخه ۲.۰ به ISO 32000-2:2020 تبدیل شد) استاندارد شده است. این فرمت برای یک هدف طراحی شده بود: نمایش یکسان اسناد در هر صفحه نمایش و چاپگر. این برای وفاداری بصری عالی است - و برای استخراج داده‌ها وحشتناک است.

آنچه واقعاً درون یک PDF صورت‌حساب بانکی است

درون هر صفحه PDF یک جریان محتوا وجود دارد - دنباله‌ای از عملگرهای ترسیم که به زبانی شبیه PostScript نوشته شده‌اند. متن با استفاده از عملگرهای خاصی رندر می‌شود:

  • BT / ET - شروع متن / پایان متن: مرزهای یک شیء متنی
  • Tf - تنظیم فونت و اندازه
  • Td / Tm - جابجایی موقعیت متن یا تنظیم ماتریس کامل تبدیل متن
  • Tj - نمایش یک رشته متنی
  • TJ - نمایش متن با موقعیت‌دهی کاراکترهای منفرد (تنظیمات فاصله بین حروف)

نکته کلیدی: مفهومی به نام "جدول"، "ردیف" یا "ستون" در مشخصات PDF وجود ندارد. آنچه شبیه یک جدول تراکنش با قالب‌بندی مرتب به نظر می‌رسد، در واقع ده‌ها قطعه متنی است که در مختصات x,y خاصی روی صفحه قرار گرفته‌اند. ابزار استخراج باید:

۱. تجزیه عملگرهای جریان محتوا ۲. رمزگشایی فونت‌ها برای نگاشت شاخص‌های کاراکتر به کاراکترهای یونیکد ۳. استفاده از ماتریس متن (Tm/Td) برای تعیین موقعیت x,y هر کاراکتر ۴. بازسازی کلمات، خطوط و ستون‌ها از آن مختصات

ستونی که کاملاً مرتب به نظر می‌رسد ممکن است در یک خط در x=72.0 و در خط بعدی در x=72.5 باشد. الگوریتم استخراج باید مرزهای ستون را با تحمل این تغییرات زیرپیکسلی تعریف کند.

PDFهای برچسب‌دار در مقابل بدون برچسب

PDFهای برچسب‌دار شامل یک درخت ساختار منطقی پنهان (مشابه تگ‌های HTML) هستند که محتوا را به عنوان سرفصل‌ها، پاراگراف‌ها، جداول، ردیف‌های جدول و سلول‌های جدول علامت‌گذاری می‌کنند. این امر استخراج را به طور قابل توجهی آسان‌تر می‌کند.

PDFهای بدون برچسب هیچ فراداده ساختاری ندارند - ابزار استخراج فقط داده‌های موقعیت خام را دریافت می‌کند و باید همه چیز را استنباط کند.

بیشتر PDFهای صورت‌حساب تولید شده توسط بانک‌ها بدون برچسب هستند. بانک‌ها صورت‌حساب‌ها را با استفاده از سیستم‌های پردازش دسته‌ای (Oracle BI Publisher، SAP Crystal Reports، یا خطوط لوله سفارشی چاپ به PDF) تولید می‌کنند. مقررات دسترسی‌پذیری (ADA/WCAG) بانک‌ها را به سمت PDFهای برچسب‌دار سوق می‌دهد، اما پذیرش آن کند است. دانلودهای استاندارد از اکثر بانک‌های بزرگ بدون برچسب باقی می‌مانند.


تنوع چیدمان صورت‌حساب بانکی

هیچ استاندارد صنعتی برای نحوه قالب‌بندی صورت‌حساب‌های PDF توسط بانک‌ها وجود ندارد. پنج مورد اطلاعاتی یکسان - تاریخ، توضیحات، بدهی، اعتبار، موجودی - توسط هر بانک به طور متفاوتی چیده می‌شوند.

ستون مبلغ واحد (علامت‌دار)

تاریخ توضیحات مبلغ موجودی
۰۱/۱۵/۲۶ حقوق و دستمزد واریز مستقیم +۳,۵۰۰.۰۰ ۵,۲۰۰.۰۰
۰۱/۱۶/۲۶ خرید POS خواربار فروشی -۸۷.۵۰ ۵,۱۱۲.۵۰

بدهی‌ها منفی و اعتبارات مثبت هستند (یا برعکس). رایج در بانک‌های کوچکتر، اتحادیه‌های اعتباری و بانک‌های دیجیتال. تجزیه و تحلیل آن ساده‌تر است زیرا فقط یک ستون مبلغ برای استخراج وجود دارد.

ستون‌های جداگانه بدهی/اعتبار

تاریخ توضیحات برداشت‌ها  سپرده‌ها موجودی
۰۱/۱۵/۲۶ حقوق و دستمزد واریز مستقیم ۳,۵۰۰.۰۰ ۵,۲۰۰.۰۰
۰۱/۱۶/۲۶ خرید POS خواربار فروشی ۸۷.۵۰ ۵,۱۱۲.۵۰

استفاده شده توسط چیس، بانک آو آمریکا و بسیاری از بانک‌های سنتی. ابزار استخراج باید تشخیص دهد کدام ستون حاوی مبلغ است و علامت را بر اساس آن تعیین کند.

گروه‌بندی بر اساس نوع تراکنش

حساب‌های تجاری و شرکتی اغلب تراکنش‌ها را گروه‌بندی می‌کنند:

سپرده‌ها و سایر اعتبارات ۰۱/۱۵  واریز حواله  REF#12345 ۱۰,۰۰۰.۰۰ ۰۱/۱۸  سپرده چک  #4567 ۲,۵۰۰.۰۰ کل سپرده‌ها ۱۲,۵۰۰.۰۰
 
چک‌های پرداخت شده ۰۱/۱۶  چک #1234 ۸۵۰.۰۰ ۰۱/۱۷  چک #1235 ۱,۲۰۰.۰۰ کل چک‌های پرداخت شده ۲,۰۵۰.۰۰
 
تراکنش‌های الکترونیکی ۰۱/۱۹  پرداخت ACH - شرکت فروشنده ۳,۲۰۰.۰۰ ۰۱/۲۰  انتقال آنلاین به پس‌انداز ۱,۰۰۰.۰۰ کل الکترونیکی ۴,۲۰۰.۰۰

سربرگ‌های بخش تعیین می‌کنند که تراکنش‌ها بدهی هستند یا اعتبار. خطوط خلاصه ("کل سپرده‌ها") باید شناسایی و از داده‌های تراکنش حذف شوند.

ویژگی‌های مخصوص بانک

  • چیس - ستون‌های جداگانه بدهی/اعتبار؛ گروه‌بندی بر اساس "سپرده‌ها و اضافات" و "پرداخت‌های الکترونیکی" و "کارمزدها"؛ توضیحات چند خطی برای جزئیات فروشنده رایج است
  • بانک آو آمریکا - ستون‌های جداگانه برداشت/سپرده؛ شامل بخش "موجودی روزانه" در انتها؛ هدر گسترده با شماره حساب، دوره صورت‌حساب، شماره مسیریابی
  • ولز فارگو - ستون‌های جداگانه؛ شامل بخش "خلاصه موجودی روزانه"؛ دانلود CSV خود را "Comma Delimited" می‌نامد
  • کپیتال وان - چیدمان مبلغ واحد تمیز برای کارت‌های مصرف‌کننده؛ حداقل اطلاعات هدر
  • سیتی - اغلب جزئیات تراکنش‌های بین‌المللی را با مبالغ ارز اصلی و نرخ‌های تبدیل در خطوط جداگانه شامل می‌شود

تنوع چیدمان ستون

فراتر از مسئله بدهی/اعتبار، ترتیب ستون‌ها استاندارد نیست:

  • ترتیب ستون: تاریخ-توضیحات-مبلغ-موجودی در مقابل تاریخ-مبلغ-توضیحات-موجودی
  • شماره چک: در حساب‌های تجاری وجود دارد، در حساب‌های شخصی وجود ندارد
  • شماره مرجع: در صورت‌حساب‌های تجاری رایج است، در صورت‌حساب‌های شخصی نادر است
  • موجودی در حال اجرا: در هر تراکنش (رایج‌ترین در صورت‌حساب‌های مصرف‌کننده آمریکا) در مقابل خلاصه‌های موجودی روزانه در مقابل عدم وجود کامل

PDFهای دیجیتال در مقابل اسکن شده

مهم‌ترین عامل تأثیرگذار بر دقت تبدیل این است که آیا PDF شما دیجیتال است یا اسکن شده.

PDFهای دیجیتال (بومی)

به صورت برنامه‌ریزی شده توسط سیستم بانک شما هنگام دانلود صورت‌حساب ایجاد می‌شوند. متن به عنوان عملگرهای جریان محتوا با رمزگشایی فونت ذخیره می‌شود.

  • دقت: ۹۹٪+ برای استخراج متن - بدون خطای تشخیص
  • سرعت: میلی‌ثانیه در هر صفحه
  • حریم خصوصی: می‌تواند کاملاً در مرورگر شما پردازش شود - فایل هرگز از دستگاه شما خارج نمی‌شود
  • اندازه فایل: معمولاً ۵۰ کیلوبایت تا ۵۰۰ کیلوبایت در هر صفحه
  • نحوه شناسایی: می‌توانید کلمات منفرد را انتخاب و برجسته کنید

PDFهای اسکن شده

تصاویر صورت‌حساب‌های کاغذی - ایجاد شده با اسکن یا عکاسی از یک سند فیزیکی. محتوا به عنوان تصاویر شطرنجی (JPEG، JPEG2000، CCITT یا فشرده Flate) ذخیره می‌شود.

  • دقت: ۹۵–۹۹٪ با OCR حرفه‌ای؛ ۶۵–۷۰٪ با OCR عمومی
  • سرعت: ثانیه در هر صفحه (نیاز به پردازش تصویر دارد)
  • حریم خصوصی: معمولاً نیاز به پردازش سمت سرور دارد (فایل باید برای OCR آپلود شود)
  • اندازه فایل: ۲۰۰ کیلوبایت تا ۲ مگابایت+ در هر صفحه
  • نحوه شناسایی: نمی‌توانید هیچ متنی را انتخاب کنید؛ با زوم تا ۴۰۰٪ پیکسل‌شدگی را نشان می‌دهد

چرا دقت اسکن شده برای داده‌های مالی مهم‌تر است

نرخ دقت کاراکتر ۹۷٪ عالی به نظر می‌رسد تا زمانی که آن را بر روی داده‌های مالی اعمال کنید. در یک صورت‌حساب با ۱۰۰۰ کاراکتر مبلغ، این به معنی ۳۰ کاراکتر اشتباه خوانده شده است. یک رقم اشتباه خوانده شده، مبلغ تراکنش را تغییر می‌دهد: "۱۲۳۴.۵۶ دلار" به "۱۲۳۴.۸۶ دلار" یا "۷۲۳۴.۵۶ دلار" تبدیل می‌شود. OCR پیشرفته به دقت نزدیک به ۹۹٪ دست می‌یابد، اما خطاهای باقی‌مانده به طور نامتناسبی بر روی کاراکترهایی می‌افتند که شبیه به هم هستند: ۰/O، ۱/l/I، ۵/S، ۸/B، ۶/G، و به طور حیاتی، ویرگول/نقطه. همیشه دانلودهای دیجیتال را ترجیح دهید. صورت‌حساب‌ها را از وب‌سایت بانک خود دانلود کنید به جای اسکن کردن کاغذ. این کار خطاهای OCR را به طور کامل حذف می‌کند.


فرمت‌های خروجی: بررسی عمیق

Bank Statement Output Formats Compared - Excel, CSV, QBO, OFX, QFX, JSON

هنگام تبدیل صورت‌حساب بانکی، یک فرمت خروجی را انتخاب می‌کنید. هر فرمت دارای نقاط قوت، محدودیت‌ها و موارد استفاده ایده‌آل متفاوتی است.

Excel (.xlsx)

استاندارد: Office Open XML (OOXML)، استاندارد شده به عنوان ECMA-376 و ISO/IEC 29500.

چیست: یک فایل .xlsx در واقع یک آرشیو ZIP است که حاوی فایل‌های XML - ساختار صفحه گسترده، داده‌های سلول، سبک‌ها و رشته‌های مشترک است. به همین دلیل می‌تواند انواع داده (تاریخ‌ها به عنوان تاریخ، اعداد به عنوان اعداد)، قالب‌بندی، فرمول‌ها و چندین صفحه را ذخیره کند.

چرا برای صورت‌حساب‌های بانکی محبوب است:

  • تاریخ‌ها به عنوان تاریخ باقی می‌مانند (قابل مرتب‌سازی، قابل فیلتر)
  • اعداد به عنوان اعداد باقی می‌مانند (قابل جمع، قابل قالب‌بندی)
  • فرمول‌ها برای تطبیق (SUM، VLOOKUP)
  • جداول محوری برای دسته‌بندی هزینه‌ها
  • قالب‌بندی شرطی برای برجسته کردن مغایرت‌ها
  • اشتراک‌گذاری با مشتریانی که به یک صفحه گسترده قابل خواندن نیاز دارند

محدودیت‌ها:

  • حداکثر ۱,۰۴۸,۵۷۶ ردیف (به ندرت برای صورت‌حساب‌های بانکی مرتبط است)
  • مستقیماً قابل وارد کردن به اکثر نرم‌افزارهای حسابداری نیست (به جای آن از QBO/OFX استفاده کنید)
  • برای باز کردن نیاز به Excel، Google Sheets یا LibreOffice Calc دارد

بهترین برای: بررسی دستی، تجزیه و تحلیل سفارشی، تطبیق، بایگانی، گزارش‌دهی به مشتری.

CSV (مقادیر جدا شده با کاما)

استاندارد: RFC 4180 (۲۰۰۵) - "فرمت مشترک و نوع MIME برای مقادیر جدا شده با کاما."

قوانین اصلی:

  • رکوردها با CRLF (بازگشت سطر + خط تغذیه) جدا می‌شوند
  • فیلدها با کاما جدا می‌شوند
  • فیلدهایی که حاوی کاما، نقل قول یا شکست خط هستند باید در گیومه دوتایی قرار گیرند
  • گیومه‌های دوتایی درون فیلدها با دو برابر کردن آن‌ها گریز می‌شوند

تنوع جداکننده در عمل:

  • کاما (,) - استاندارد، استفاده شده در آمریکا/بریتانیا
  • نقطه ویرگول (;) - استفاده شده در کشورهایی که کاما جداکننده اعشار است (فرانسه، آلمان، ایتالیا، اسپانیا، برزیل)
  • تب (\t) - فرمت TSV، از تداخل جداکننده جلوگیری می‌کند

مشکلات رمزگشایی:

  • UTF-8 برای قابلیت همکاری توصیه می‌شود
  • UTF-8 BOM (نشانگر ترتیب بایت): توسط استاندارد الزامی نیست، اما Excel در ویندوز برای نمایش صحیح کاراکترهای غیر ASCII (حروف با لهجه، نمادهای ارز) به آن نیاز دارد. بدون BOM، Excel ممکن است UTF-8 را به عنوان Windows-1252 تفسیر کند و کاراکترها را خراب کند.
  • Excel از نقطه ویرگول به جای کاما به عنوان جداکننده فیلد در مناطق اروپایی استفاده می‌کند

محدودیت‌ها:

  • بدون انواع داده - همه چیز متن است (اعداد با صفرهای پیشرو خراب می‌شوند، اعداد حساب طولانی به نماد علمی تبدیل می‌شوند)
  • بدون پشتیبانی از چند صفحه
  • بدون قالب‌بندی یا فرمول
  • بدون فراداده (بدون اطلاعات حساب، بدون شناسه‌های تشخیص تکراری)

بهترین برای: حداکثر سازگاری - تقریباً هر برنامه حسابداری، پایگاه داده و صفحه گسترده‌ای می‌تواند CSV را وارد کند. جایگزین جهانی زمانی که QBO/OFX در دسترس نیست.

QBO (QuickBooks Web Connect)

چیست: فرمت واردات برای QuickBooks (هم دسکتاپ و هم آنلاین). فایل‌های QBO بر اساس مشخصات OFX با افزونه‌های مخصوص QuickBooks هستند.

توضیح مهم: ".QBO" به معنای "QuickBooks Online" نیست - بلکه مخفف فرمت QuickBooks Web Connect است و با هر دو QuickBooks Desktop و QuickBooks Online کار می‌کند.

فیلدهای الزامی در هر تراکنش:

  • TRNTYPE - نوع تراکنش (DEBIT، CREDIT، CHECK، DEP، DIRECTDEP، DIRECTDEBIT، ATM، POS، XFER، PAYMENT، FEE، SRVCHG، INT، OTHER)
  • DTPOSTED - تاریخ در فرمت YYYYMMDD
  • TRNAMT - مبلغ (منفی برای بدهی‌ها)
  • FITID - شناسه تراکنش موسسه مالی
  • NAME - گیرنده/توضیحات

چرا FITID مهم است: QuickBooks هر FITID را که تا به حال برای هر حساب وارد شده است، پیگیری می‌کند. اگر تراکنشی با همان FITID دوباره وارد شود، QuickBooks آن را به طور خودکار نادیده می‌گیرد - از ورود تکراری زمانی که کاربران دوره‌های صورت‌حساب همپوشان را دوباره وارد می‌کنند، جلوگیری می‌کند. این تشخیص خودکار تکراری بزرگترین مزیت QBO نسبت به CSV است.

داده‌های اضافی: QBO همچنین شناسه حساب، شناسه بانک (شماره مسیریابی)، ارز، شماره چک، یادداشت و موجودی پایانی را حمل می‌کند - غنی‌ترین مجموعه داده در هر فرمت ورودی برای QuickBooks.

بهترین برای: کاربران QuickBooks (دسکتاپ و آنلاین). غنی‌ترین تجربه واردات را با تشخیص خودکار تکراری و طبقه‌بندی نوع تراکنش ارائه می‌دهد.

OFX (Open Financial Exchange)

تاریخچه: ایجاد شده توسط مایکروسافت، Intuit و CheckFree. نسخه ۱.۰ در فوریه ۱۹۹۷ منتشر شد.

تکامل نسخه:

  • OFX 1.0–1.6 (۱۹۹۷–۱۹۹۹): نحو مبتنی بر SGML (بدون نیاز به تگ‌های پایانی)
  • OFX 2.0+ (۲۰۰۰–تاکنون): مبتنی بر XML (تگ‌های پایانی صحیح، XML خوش‌ساختار)

بسیاری از بانک‌ها هنوز OFX 1.x (SGML) را برای حداکثر سازگاری تولید می‌کنند.

حاکمیت فعلی: در سال ۲۰۱۹، کنسرسیوم OFX در کنسرسیوم Financial Data Exchange (FDX) ادغام شد، که اکنون مشخصات را مدیریت می‌کند. FDX بیش از ۲۰۰ سازمان عضو و ۷۶ میلیون حساب مصرف‌کننده دارد.

چرا OFX استاندارد جهانی است: OFX همان فرمتی است که هنگام اتصال مستقیم حساب بانکی خود به نرم‌افزار حسابداری از طریق فیدهای بانکی استفاده می‌شود - همان فرمت برای واردات فایل کار می‌کند.

بهترین برای کاربران Xero: Xero فایل‌های OFX را بدون نیاز به نگاشت دستی ستون‌ها به طور خودکار وارد می‌کند. فایل را آپلود کنید و تراکنش‌ها بلافاصله با تاریخ‌ها، مبالغ و توضیحات صحیح ظاهر می‌شوند. همچنین با Wave، Sage، FreshBooks و اکثر نرم‌افزارهای حسابداری کار می‌کند.

QFX (Quicken Financial Exchange)

چیست: نوع اختصاصی Intuit از OFX، که منحصراً با Quicken استفاده می‌شود. فایل QFX یک فایل OFX استاندارد با فیلدهای اختصاصی اضافی است.

فیلد اختصاصی کلیدی: INTU.BID - شناسه بانک Quicken. این شناسه عددی به بانکی در پایگاه داده داخلی Quicken نگاشت می‌شود. بدون آن، Quicken از وارد کردن فایل امتناع می‌ورزد.

تفاوت‌ها با OFX استاندارد:

  • نیاز به INTU.BID در هدر دارد
  • ممکن است شامل فیلدهای دیگر با پیشوند INTU.* باشد
  • موسسات مالی برای ارائه دانلود QFX هزینه مجوز به Intuit پرداخت می‌کنند
  • Quicken فایل‌های OFX استاندارد را بدون فیلد INTU.BID وارد نمی‌کند

بهترین برای: کاربران نرم‌افزار مالی شخصی Quicken. فرمت الزامی - هیچ جایگزینی کار نمی‌کند.

QIF (Quicken Interchange Format)

چیست: یک فرمت قدیمی متن ساده که در اصل توسط Intuit برای Quicken توسعه یافته است. جفت‌های تگ-مقدار، یکی در هر خط، با تگ‌های تک کاراکتری: D برای تاریخ، T برای مبلغ، P برای گیرنده، L برای دسته، M برای یادداشت، N برای شماره چک، ^ برای پایان رکورد.

چرا جایگزین شد: QIF فاقد مکانیزم تشخیص تکراری است (معادل FITID ندارد)، فیلدهای شناسایی حساب ندارد، اطلاعات مسیریابی بانک ندارد، داده‌های موجودی ندارد و قالب‌بندی تاریخ در پیاده‌سازی‌های مختلف ناسازگار است.

هنوز مرتبط: برخی نرم‌افزارهای حسابداری (Xero، Sage، GnuCash) هنوز واردات QIF را می‌پذیرند. برای مهاجرت سیستم‌های قدیمی مفید است.

JSON (JavaScript Object Notation)

وضعیت فعلی: JSON هنوز یک استاندارد برای فایل‌های صورت‌حساب بانکی نیست، اما به طور فزاینده‌ای در موارد زیر استفاده می‌شود:

  • APIهای Open Banking (استاندارد Open Banking بریتانیا، گروه برلین PSD2)
  • FDX API (Financial Data Exchange - جانشین OFX، بیش از ۲۰۰ سازمان عضو)
  • Plaid، Yodlee، MX و سایر APIهای تجمیع‌کننده داده
  • گردش کارهای توسعه‌دهنده و اتوماسیون

پذیرش رو به رشد: مقررات Open Banking (PSD2 در اروپا، بخش ۱۰۳۳ CFPB در ایالات متحده) پذیرش APIهای JSON را تسریع می‌کنند. FDX API از JSON/REST با OAuth 2.0 استفاده می‌کند که جهت آینده تبادل داده‌های مالی را نشان می‌دهد.

بهترین برای: توسعه‌دهندگانی که گردش کارهای خودکار، ادغام‌های فین‌تک، داشبوردهای سفارشی و ادغام‌های API Open Banking را می‌سازند.


مقایسه فرمت‌ها در یک نگاه

فرمت انواع داده تشخیص تکراری اطلاعات حساب پشتیبانی نرم‌افزار حسابداری بهترین برای
Excel بله خیر خیر محدود بررسی دستی، تجزیه و تحلیل
CSV خیر خیر خیر جهانی حداکثر سازگاری
QBO بله بله (FITID) بله QuickBooks کاربران QuickBooks
OFX بله بله (FITID) بله اکثر نرم‌افزارها Xero، Sage، FreshBooks
QFX بله بله (FITID) بله فقط Quicken کاربران Quicken
QIF جزئی خیر خیر برخی قدیمی مهاجرت‌های قدیمی
JSON بله سفارشی بله مبتنی بر API توسعه‌دهندگان، اتوماسیون

سازگاری نرم‌افزار حسابداری

نرم‌افزار حسابداری شما کدام فرمت را می‌پذیرد؟

نرم‌افزار QBO OFX QFX QIF CSV بهترین انتخاب
QuickBooks Online بله بله بله خیر بله QBO
QuickBooks Desktop بله بله بله خیر بله QBO
Quicken خیر خیر بله بله خیر QFX
Xero بله بله بله بله بله OFX
Sage خیر بله خیر بله بله OFX
Wave خیر بله بله خیر بله OFX
FreshBooks خیر خیر خیر خیر بله CSV
Zoho Books خیر بله خیر بله بله OFX
GnuCash خیر بله خیر بله بله OFX

قانون کلی: از QBO برای QuickBooks، QFX برای Quicken، OFX برای بقیه موارد و CSV به عنوان یک جایگزین جهانی استفاده کنید.


تفاوت‌های قالب‌بندی بین‌المللی

اگر با صورت‌حساب‌های بانکی بین‌المللی کار می‌کنید، با تفاوت‌های قالب‌بندی مواجه خواهید شد که بیشتر ابزارهای تبدیل را دچار مشکل می‌کند.

فرمت‌های تاریخ

منطقه فرمت مثال یادداشت‌ها
ایالات متحده YYYY/MM/DD 2026/03/15 ماه اول
اروپا، آمریکای لاتین DD/MM/YYYY 15/03/2026 روز اول
آلمان DD.MM.YYYY 15.03.2026 جداکننده نقطه
ژاپن YYYY年MM月DD日 2026年03月01日 سال اول با کانجی
چین YYYY年MM月DD日 2026年3月1日 مشابه ژاپن
ISO 8601 YYYY-MM-DD 2026-03-15 استاندارد بین‌المللی بدون ابهام

مشکل ابهام: "۰۳/۰۴/۲۰۲۶" در آمریکا ۴ مارس و در اروپا ۳ آوریل است. هنگامی که تمام تاریخ‌ها در یک صورت‌حساب دارای مقادیر روز ۱۲ یا کمتر هستند، هیچ راه الگوریتمی برای تعیین فرمت صحیح بدون دانستن کشور مبدأ وجود ندارد. ابزارهای تبدیل باید تمام تاریخ‌های صورت‌حساب را اسکن کنند و به دنبال مقادیری بزرگتر از ۱۲ بگردند تا فرمت را تعیین کنند.

فرمت‌های اعداد

منطقه هزار و پنجاه سنت یادداشت‌ها
آمریکا، بریتانیا، استرالیا، ژاپن ۱,۰۰۰.۵۰ کاما برای هزارگان، نقطه برای اعشار
آلمان، فرانسه، اسپانیا، برزیل، ایتالیا ۱.۰۰۰,۵۰ نقطه برای هزارگان، کاما برای اعشار
سوئیس ۱'۰۰۰.۵۰ آپوستروف برای هزارگان
هند ۱,۰۰,۰۰۰.۵۰ سیستم گروه‌بندی لک
اسکاندیناوی ۱ ۰۰۰,۵۰ فاصله برای هزارگان، کاما برای اعشار

"۱۰.۰۰۰,۴۵" از یک بانک اروپایی به معنای ده هزار و چهل و پنج سنت است - نه ده نقطه صفر صفر صفر چهار پنج. اشتباه در این مورد باعث خطاهای با ضریب ۱۰,۰۰۰ می‌شود.

قرارگیری نماد ارز

  • آمریکا/بریتانیا: نماد قبل از مبلغ: $۱,۲۳۴.۵۶ / £۱,۲۳۴.۵۶
  • فرانسه، آلمان، اسپانیا: نماد بعد از مبلغ: ۱.۲۳۴,۵۶ €
  • ایرلند، هلند: نماد قبل: €۱,۲۳۴.۵۶
  • ژاپن: نماد قبل: ¥۱۲۳,۴۵۶

رمزگشایی کاراکتر

  • UTF-8 - استاندارد جهانی، پشتیبانی از تمام اسکریپت‌ها
  • GBK/GB2312 - چینی ساده شده (استفاده شده توسط بانک‌های چینی)
  • Shift_JIS - ژاپنی (استفاده شده توسط بانک‌های ژاپنی)
  • Big5 - چینی سنتی (تایوان، هنگ کنگ)
  • EUC-KR - کره‌ای
  • ISO 8859-1 - اروپای غربی
  • Windows-1252 - اروپای غربی (قدیمی)
  • Windows-1256 - عربی

باز کردن یک صورت‌حساب بانکی چینی یا ژاپنی در یک سیستم آمریکایی بدون تشخیص صحیح رمزگشایی، کاراکترهای درهم و برهمی تولید می‌کند. PDFSub بیش از ۱۳۰ زبان را با تشخیص خودکار فرمت‌های تاریخ، فرمت‌های اعداد و رمزگشایی کاراکترها - از جمله راست به چپ عربی و عبری، کاراکترهای CJK و تمام مجموعه‌های کاراکتر اروپایی - مدیریت می‌کند.


عناصر رایج صورت‌حساب بانکی

تاریخ تراکنش در مقابل تاریخ ثبت در مقابل تاریخ ارزش

صورت‌حساب‌های بانکی ممکن است شامل چندین تاریخ برای یک تراکنش واحد باشند:

  • تاریخ تراکنش - زمان واقعی وقوع خرید یا انتقال
  • تاریخ ثبت - زمان پردازش و ثبت آن توسط بانک (معمولاً ۱ تا ۳ روز کاری بعد برای خرید با کارت اعتباری)
  • تاریخ ارزش - زمان واقعی در دسترس قرار گرفتن وجوه (بر محاسبه سود تأثیر می‌گذارد، رایج در بانکداری بین‌المللی)

بیشتر صورت‌حساب‌های مصرف‌کننده فقط تاریخ ثبت را نشان می‌دهند. صورت‌حساب‌های تجاری اغلب شامل هر دو تاریخ تراکنش و ثبت هستند.

نمایش بدهی/اعتبار

بانک‌ها بدهی‌ها و اعتبارها را به طور متفاوتی نشان می‌دهند:

  • مبالغ علامت‌دار: -۸۷.۵۰ برای بدهی‌ها، +۳,۵۰۰.۰۰ برای اعتبارها
  • ستون‌های جداگانه: "برداشت‌ها" و "سپرده‌ها"
  • مخفف‌ها: "DR" برای بدهی، "CR" برای اعتبار (رایج در بریتانیا/مشترک‌المنافع)
  • پرانتز: (۸۷.۵۰) برای بدهی‌ها (عرف حسابداری)

موجودی در حال اجرا

  • موجودی در هر تراکنش - به‌روز شده پس از هر تراکنش (رایج‌ترین در صورت‌حساب‌های مصرف‌کننده آمریکا)
  • فقط موجودی روزانه - موجودی نمایش داده شده در پایان هر روز (رایج در صورت‌حساب‌های تجاری)
  • بدون موجودی در حال اجرا - فقط موجودی‌های آغازین و پایانی (برخی صورت‌حساب‌های بین‌المللی)

موجودی‌های در حال اجرا برای اعتبارسنجی ارزشمند هستند: می‌توانید تأیید کنید که هر تراکنش به درستی موجودی را از یک خط به خط بعدی منتقل می‌کند.

اطلاعات استاندارد هدر

بیشتر صورت‌حساب‌های بانکی شامل موارد زیر هستند: نام صاحب حساب، شماره حساب (اغلب تا حدی پنهان شده)، دوره صورت‌حساب، موجودی‌های آغازین و پایانی، کل سپرده‌ها و برداشت‌ها، و کد مسیریابی/مرتب‌سازی/کد بانکی SWIFT.


حفاظت با رمز عبور

نحوه رمزگذاری PDF توسط بانک‌ها

بانک‌ها معمولاً از رمزگذاری AES-128 یا AES-256 استفاده می‌کنند. دو حالت حفاظت وجود دارد:

  • رمز عبور کاربر (رمز عبور باز کردن): برای باز کردن فایل لازم است
  • رمز عبور مالک (رمز عبور مجوزها): PDF باز می‌شود اما ویرایش/کپی ممکن است محدود شود

الگوهای رایج رمز عبور

بانک رمز عبور معمول
چیس SSN کامل ۹ رقمی
بانک آو آمریکا SSN یا TIN
ولز فارگو SSN یا ۴ رقم آخر SSN
کپیتال وان تاریخ تولد (MMDDYYYY)

الگوهای رایج دیگر شامل ۴ رقم آخر شماره حساب، شناسه مشتری یا شماره عضو است. بانک‌ها معمولاً هنگام فعال کردن صورت‌حساب‌های الکترونیکی، الگوی رمز عبور را اطلاع‌رسانی می‌کنند.


چالش‌های صورت‌حساب‌های چند صفحه‌ای

صورت‌حساب‌های طولانی (حساب‌های تجاری با صدها تراکنش) چندین چالش استخراج ایجاد می‌کنند:

تراکنش‌های تقسیم شده

توضیحات یک تراکنش ممکن است در پایین یک صفحه شروع شده و در بالای صفحه بعدی ادامه یابد. مبدل باید خطوط ادامه را تشخیص داده و آن‌ها را در یک تراکنش واحد ادغام کند.

هدرها و فوترهای تکراری

بیشتر بانک‌ها هدرهای ستون را در هر صفحه تکرار می‌کنند، به علاوه شماره صفحه، سلب مسئولیت‌های قانونی و متن تبلیغاتی. این‌ها باید شناسایی شده و از داده‌های تراکنش حذف شوند.

خطوط ادامه

بسیاری از تراکنش‌ها دارای توضیحات چند خطی هستند:

۰۱/۱۵  کاهش الکترونیکی ACH شرکت فروشنده $۳,۲۰۰.۰۰  $۲,۰۰۰.۰۰ REF#123456789 INVOICE 2026-001 شرکت فروشنده حساب‌های پرداختنی

خطوط ۲ و ۳ خطوط ادامه هستند که به تراکنش در خط ۱ تعلق دارند. آن‌ها معمولاً فاقد تاریخ و مبلغ هستند و در همان مختصات x ستون توضیحات، با تورفتگی ظاهر می‌شوند.

انتقال موجودی

برخی بانک‌ها خطوط "موجودی منتقل شده" یا "موجودی آورده شده" را در بالای صفحات ادامه قرار می‌دهند. این‌ها اطلاعاتی هستند، نه تراکنش، و باید از داده‌های استخراج شده حذف شوند.


مخفف‌های رایج تراکنش

صورت‌حساب‌های بانکی از مخفف‌هایی استفاده می‌کنند که در موسسات مختلف متفاوت است:

مخفف معنی
ACH Automated Clearing House (انتقالات الکترونیکی)
ATM Automated Teller Machine (دستگاه خودپرداز)
POS Point of Sale (کارت بدهی)
EFT Electronic Funds Transfer (انتقال الکترونیکی وجوه)
INT Interest payment (پرداخت سود)
CHK / CK Check (چک)
WD / W/D Withdrawal (برداشت)
DEP Deposit (سپرده)
DD Direct Deposit (واریز مستقیم)
OD Overdraft (اضافه برداشت)
NSF Non-Sufficient Funds (وجوه ناکافی)
SRVCHG Service Charge (کارمزد خدمات)
XFER Transfer (انتقال)

استانداردهای صنعتی که باید بدانید

این فرمت‌ها در بانکداری شرکتی و مدیریت خزانه استفاده می‌شوند. شما به ندرت مستقیماً با آن‌ها مواجه خواهید شد، اما درک آن‌ها توضیح می‌دهد که چرا صورت‌حساب‌های بانکی به شکلی که هستند کار می‌کنند.

BAI2 (Bank Administration Institute)

برای مدیریت خودکار وجوه نقد و تطبیق بانکی در سیستم‌های ERP (SAP، Oracle) استفاده می‌شود. یک فرمت ASCII با عرض ثابت با کدهای نوع تراکنش (مانند ۱۶۵ = اعتبار ACH از پیش مجاز، ۴۵۵ = بدهی ACH، ۴۹۵ = انتقال سیمی خروجی). در اصل در سال ۱۹۸۷ منتشر شد، اکنون توسط ASC X9 نگهداری می‌شود.

SWIFT MT940 / MT940

صورت‌حساب‌های بانکی پایان روز (MT940) و درون روز (MT942) که توسط بانک‌های سراسر جهان برای مشتریان شرکتی و بخش‌های خزانه استفاده می‌شود. SWIFT روزانه تقریباً ۴۵ میلیون پیام را پردازش می‌کند. فرمت مبتنی بر تگ با شناسه فیلدهای جدا شده با دو نقطه.

ISO 20022 (camt.053)

جایگزین مدرن مبتنی بر XML برای MT940. بخشی از استاندارد پیام‌رسانی مالی جهانی ISO 20022. داده‌های غنی‌تر از MT940، بدون محدودیت طول فیلد، XML قابل تجزیه ماشینی با اعتبارسنجی XSD. SWIFT در حال مهاجرت از پیام‌های MT به ISO 20022 است. SEPA (منطقه پرداخت واحد یورو) فرمت camt را برای پرداخت‌های اروپایی اجباری می‌کند.

NACHA ACH

فرمت فایل برای تراکنش‌های Automated Clearing House در ایالات متحده. ASCII با عرض ثابت، دقیقاً ۹۴ کاراکتر در هر خط. ACH سالانه تقریباً ۳۰ میلیارد تراکنش را در ایالات متحده پردازش می‌کند. هنگامی که صورت‌حساب بانکی شما "ACH CREDIT" یا "ACH DEBIT" را نشان می‌دهد، تراکنش زیربنایی در فرمت NACHA بین بانک‌ها منتقل شده است.


انتخاب فرمت مناسب برای گردش کار شما

راهنمای تصمیم‌گیری

اگر از QuickBooks استفاده می‌کنید (دسکتاپ یا آنلاین)، از QBO استفاده کنید. شما طبقه‌بندی نوع تراکنش، تشخیص تکراری از طریق FITID و غنی‌ترین فراداده واردات را دریافت می‌کنید.

اگر از Xero، Sage، Wave یا سایر نرم‌افزارهای سازگار با OFX استفاده می‌کنید، از OFX استفاده کنید. Xero فیلدها را بدون پیکربندی دستی ستون‌ها به طور خودکار نگاشت می‌کند.

اگر از Quicken استفاده می‌کنید، از QFX استفاده کنید. این تنها فرمتی است که Quicken می‌پذیرد.

اگر نیاز به بررسی، تجزیه و تحلیل یا دستکاری داده‌ها قبل از وارد کردن دارید، از Excel استفاده کنید. جداول محوری ایجاد کنید، فرمول‌ها را اجرا کنید یا گزارش‌ها را آماده کنید.

اگر نرم‌افزار شما در لیست بالا نیست، یا به حداکثر سازگاری در بین سیستم‌ها نیاز دارید، از CSV استفاده کنید. آماده باشید تا ستون‌ها را به صورت دستی نگاشت کنید.

اگر در حال ساخت گردش کارهای خودکار، ادغام‌های API یا سیستم‌های گزارش‌دهی سفارشی هستید، از JSON استفاده کنید.

نکات حرفه‌ای

  • همیشه از QBO/OFX به جای CSV استفاده کنید زمانی که نرم‌افزار شما از آن پشتیبانی می‌کند - فقط تشخیص تکراری از ساعت‌ها پاکسازی جلوگیری می‌کند
  • PDF اصلی را در کنار فایل تبدیل شده خود نگه دارید - این مسیر حسابرسی و سند منبع شماست
  • پس از هر واردات تأیید کنید - موجودی‌های آغازین/پایانی و چند تراکنش تصادفی را به طور تصادفی بررسی کنید
  • فرمت را با نرم‌افزار مطابقت دهید - استفاده از فرمت بومی برای پلتفرم حسابداری شما از نگاشت دستی ستون‌ها جلوگیری می‌کند و ویژگی‌های خودکار را فعال می‌کند

رایگان امتحان کنید

آماده تبدیل اولین صورت‌حساب خود هستید؟ اکنون PDF را آپلود کنید - PDFSub به Excel، CSV، QBO، OFX، QFX و JSON تبدیل می‌کند. صورت‌حساب‌های دیجیتال برای حداکثر حریم خصوصی به طور کامل در مرورگر شما پردازش می‌شوند. یک دوره آزمایشی رایگان ۷ روزه با دسترسی کامل به تمام فرمت‌ها را شروع کنید.

بازگشت به بلاگ

سوال دارید؟ با ما تماس بگیرید

PDFSub

تمام ابزارهای PDF و اسناد مورد نیاز شما در یک مکان. سریع، امن و خصوصی.

مطابق با GDPRمطابق با CCPAآماده برای SOC 2
با قدرت PDFSub Engine

محصول

  • همه ابزارها
  • ویژگی‌ها
  • صورت‌حساب‌های بانکی
  • API
  • قیمت‌گذاری
  • سوالات متداول
  • بلاگ

پشتیبانی

  • درباره ما
  • مرکز راهنمایی
  • تماس با ما
  • سوالات متداول

حقوقی

  • سیاست حفظ حریم خصوصی
  • شرایط استفاده
  • سیاست کوکی

© 2026 تمامی حقوق برای PDFSub محفوظ است.

ساخته شده در آمریکا با برای مردم سراسر جهان