آشنایی با فرمتهای صورتحساب بانکی: راهنمای فنی
PDF یک فرمت داده نیست، بلکه یک فرمت نمایش است. به همین دلیل استخراج دادههای تراکنش از صورتحسابهای بانکی به طرز شگفتآوری دشوار است. این راهنما توضیح میدهد که درون یک PDF صورتحساب بانکی چیست، فرمتهای خروجی موجود (Excel، CSV، QBO، OFX، QFX، JSON) کدامند و چگونه فرمت مناسب را انتخاب کنید.

یک PDF صورتحساب بانکی ساده به نظر میرسد: تاریخها، توضیحات، مبالغ، موجودیها در ستونهای مرتب. اما پشت این ظاهر، فرمت سندی (PDF) نهفته است که هرگز برای ذخیره دادههای ساختاریافته طراحی نشده است - و فرآیند تبدیل که نیازمند درک هم فرمت ورودی و هم فرمتهای خروجی متعدد موجود است.
این راهنما ۱۲ بخش را که در هر صورتحساب بانکی (صرف نظر از بانک) ظاهر میشوند، واقعیت فنی PDFهای صورتحساب بانکی، تنوع چیدمان در بانکهای مختلف، هر فرمت خروجی که با آن مواجه خواهید شد (Excel، CSV، QBO، OFX، QFX، QIF، JSON)، تفاوتهای قالببندی بینالمللی و استانداردهای صنعتی که تبادل دادههای مالی را تنظیم میکنند، پوشش میدهد.
اجزای صورتحساب بانکی
هر صورتحساب بانکی - چیس، بانک آو آمریکا، ولز فارگو، HSBC، دویچه بانک، هر نامی که بگویید - از ۱۲ بخش یکسان ساخته شده است. برچسبها تغییر میکنند ("کسورات" در مقابل "برداشتها")، چیدمان ستونها متفاوت است، اما ساختار زیربنایی سازگار است. هنگامی که بتوانید این بخشها را شناسایی کنید، هر صورتحساب آشنا به نظر میرسد.

آیا میخواهید از این اینفوگرافیک در وبلاگ خود استفاده کنید؟ کد جاسازی را کپی کنید:
برای بررسیهای عمیق مخصوص بانک که دقیقاً نحوه چیدمان این ۱۲ بخش را در هر بانک اصلی پوشش میدهد، ببینید:
- صورتحساب بانک چیس توضیح داده شده
- صورتحساب بانک آو آمریکا توضیح داده شده
- صورتحساب ولز فارگو توضیح داده شده
- صورتحساب سیتی بانک توضیح داده شده
- صورتحساب کپیتال وان توضیح داده شده
چرا PDF فرمت داده نیست
PDF مخفف Portable Document Format است که به عنوان ISO 32000 (نسخه ۲.۰ به ISO 32000-2:2020 تبدیل شد) استاندارد شده است. این فرمت برای یک هدف طراحی شده بود: نمایش یکسان اسناد در هر صفحه نمایش و چاپگر. این برای وفاداری بصری عالی است - و برای استخراج دادهها وحشتناک است.
آنچه واقعاً درون یک PDF صورتحساب بانکی است
درون هر صفحه PDF یک جریان محتوا وجود دارد - دنبالهای از عملگرهای ترسیم که به زبانی شبیه PostScript نوشته شدهاند. متن با استفاده از عملگرهای خاصی رندر میشود:
- BT / ET - شروع متن / پایان متن: مرزهای یک شیء متنی
- Tf - تنظیم فونت و اندازه
- Td / Tm - جابجایی موقعیت متن یا تنظیم ماتریس کامل تبدیل متن
- Tj - نمایش یک رشته متنی
- TJ - نمایش متن با موقعیتدهی کاراکترهای منفرد (تنظیمات فاصله بین حروف)
نکته کلیدی: مفهومی به نام "جدول"، "ردیف" یا "ستون" در مشخصات PDF وجود ندارد. آنچه شبیه یک جدول تراکنش با قالببندی مرتب به نظر میرسد، در واقع دهها قطعه متنی است که در مختصات x,y خاصی روی صفحه قرار گرفتهاند. ابزار استخراج باید:
۱. تجزیه عملگرهای جریان محتوا ۲. رمزگشایی فونتها برای نگاشت شاخصهای کاراکتر به کاراکترهای یونیکد ۳. استفاده از ماتریس متن (Tm/Td) برای تعیین موقعیت x,y هر کاراکتر ۴. بازسازی کلمات، خطوط و ستونها از آن مختصات
ستونی که کاملاً مرتب به نظر میرسد ممکن است در یک خط در x=72.0 و در خط بعدی در x=72.5 باشد. الگوریتم استخراج باید مرزهای ستون را با تحمل این تغییرات زیرپیکسلی تعریف کند.
PDFهای برچسبدار در مقابل بدون برچسب
PDFهای برچسبدار شامل یک درخت ساختار منطقی پنهان (مشابه تگهای HTML) هستند که محتوا را به عنوان سرفصلها، پاراگرافها، جداول، ردیفهای جدول و سلولهای جدول علامتگذاری میکنند. این امر استخراج را به طور قابل توجهی آسانتر میکند.
PDFهای بدون برچسب هیچ فراداده ساختاری ندارند - ابزار استخراج فقط دادههای موقعیت خام را دریافت میکند و باید همه چیز را استنباط کند.
بیشتر PDFهای صورتحساب تولید شده توسط بانکها بدون برچسب هستند. بانکها صورتحسابها را با استفاده از سیستمهای پردازش دستهای (Oracle BI Publisher، SAP Crystal Reports، یا خطوط لوله سفارشی چاپ به PDF) تولید میکنند. مقررات دسترسیپذیری (ADA/WCAG) بانکها را به سمت PDFهای برچسبدار سوق میدهد، اما پذیرش آن کند است. دانلودهای استاندارد از اکثر بانکهای بزرگ بدون برچسب باقی میمانند.
تنوع چیدمان صورتحساب بانکی
هیچ استاندارد صنعتی برای نحوه قالببندی صورتحسابهای PDF توسط بانکها وجود ندارد. پنج مورد اطلاعاتی یکسان - تاریخ، توضیحات، بدهی، اعتبار، موجودی - توسط هر بانک به طور متفاوتی چیده میشوند.
ستون مبلغ واحد (علامتدار)
تاریخ توضیحات مبلغ موجودی
۰۱/۱۵/۲۶ حقوق و دستمزد واریز مستقیم +۳,۵۰۰.۰۰ ۵,۲۰۰.۰۰
۰۱/۱۶/۲۶ خرید POS خواربار فروشی -۸۷.۵۰ ۵,۱۱۲.۵۰بدهیها منفی و اعتبارات مثبت هستند (یا برعکس). رایج در بانکهای کوچکتر، اتحادیههای اعتباری و بانکهای دیجیتال. تجزیه و تحلیل آن سادهتر است زیرا فقط یک ستون مبلغ برای استخراج وجود دارد.
ستونهای جداگانه بدهی/اعتبار
تاریخ توضیحات برداشتها سپردهها موجودی
۰۱/۱۵/۲۶ حقوق و دستمزد واریز مستقیم ۳,۵۰۰.۰۰ ۵,۲۰۰.۰۰
۰۱/۱۶/۲۶ خرید POS خواربار فروشی ۸۷.۵۰ ۵,۱۱۲.۵۰استفاده شده توسط چیس، بانک آو آمریکا و بسیاری از بانکهای سنتی. ابزار استخراج باید تشخیص دهد کدام ستون حاوی مبلغ است و علامت را بر اساس آن تعیین کند.
گروهبندی بر اساس نوع تراکنش
حسابهای تجاری و شرکتی اغلب تراکنشها را گروهبندی میکنند:
سپردهها و سایر اعتبارات ۰۱/۱۵ واریز حواله REF#12345 ۱۰,۰۰۰.۰۰ ۰۱/۱۸ سپرده چک #4567 ۲,۵۰۰.۰۰ کل سپردهها ۱۲,۵۰۰.۰۰
چکهای پرداخت شده ۰۱/۱۶ چک #1234 ۸۵۰.۰۰ ۰۱/۱۷ چک #1235 ۱,۲۰۰.۰۰ کل چکهای پرداخت شده ۲,۰۵۰.۰۰
تراکنشهای الکترونیکی ۰۱/۱۹ پرداخت ACH - شرکت فروشنده ۳,۲۰۰.۰۰ ۰۱/۲۰ انتقال آنلاین به پسانداز ۱,۰۰۰.۰۰ کل الکترونیکی ۴,۲۰۰.۰۰سربرگهای بخش تعیین میکنند که تراکنشها بدهی هستند یا اعتبار. خطوط خلاصه ("کل سپردهها") باید شناسایی و از دادههای تراکنش حذف شوند.
ویژگیهای مخصوص بانک
- چیس - ستونهای جداگانه بدهی/اعتبار؛ گروهبندی بر اساس "سپردهها و اضافات" و "پرداختهای الکترونیکی" و "کارمزدها"؛ توضیحات چند خطی برای جزئیات فروشنده رایج است
- بانک آو آمریکا - ستونهای جداگانه برداشت/سپرده؛ شامل بخش "موجودی روزانه" در انتها؛ هدر گسترده با شماره حساب، دوره صورتحساب، شماره مسیریابی
- ولز فارگو - ستونهای جداگانه؛ شامل بخش "خلاصه موجودی روزانه"؛ دانلود CSV خود را "Comma Delimited" مینامد
- کپیتال وان - چیدمان مبلغ واحد تمیز برای کارتهای مصرفکننده؛ حداقل اطلاعات هدر
- سیتی - اغلب جزئیات تراکنشهای بینالمللی را با مبالغ ارز اصلی و نرخهای تبدیل در خطوط جداگانه شامل میشود
تنوع چیدمان ستون
فراتر از مسئله بدهی/اعتبار، ترتیب ستونها استاندارد نیست:
- ترتیب ستون: تاریخ-توضیحات-مبلغ-موجودی در مقابل تاریخ-مبلغ-توضیحات-موجودی
- شماره چک: در حسابهای تجاری وجود دارد، در حسابهای شخصی وجود ندارد
- شماره مرجع: در صورتحسابهای تجاری رایج است، در صورتحسابهای شخصی نادر است
- موجودی در حال اجرا: در هر تراکنش (رایجترین در صورتحسابهای مصرفکننده آمریکا) در مقابل خلاصههای موجودی روزانه در مقابل عدم وجود کامل
PDFهای دیجیتال در مقابل اسکن شده
مهمترین عامل تأثیرگذار بر دقت تبدیل این است که آیا PDF شما دیجیتال است یا اسکن شده.
PDFهای دیجیتال (بومی)
به صورت برنامهریزی شده توسط سیستم بانک شما هنگام دانلود صورتحساب ایجاد میشوند. متن به عنوان عملگرهای جریان محتوا با رمزگشایی فونت ذخیره میشود.
- دقت: ۹۹٪+ برای استخراج متن - بدون خطای تشخیص
- سرعت: میلیثانیه در هر صفحه
- حریم خصوصی: میتواند کاملاً در مرورگر شما پردازش شود - فایل هرگز از دستگاه شما خارج نمیشود
- اندازه فایل: معمولاً ۵۰ کیلوبایت تا ۵۰۰ کیلوبایت در هر صفحه
- نحوه شناسایی: میتوانید کلمات منفرد را انتخاب و برجسته کنید
PDFهای اسکن شده
تصاویر صورتحسابهای کاغذی - ایجاد شده با اسکن یا عکاسی از یک سند فیزیکی. محتوا به عنوان تصاویر شطرنجی (JPEG، JPEG2000، CCITT یا فشرده Flate) ذخیره میشود.
- دقت: ۹۵–۹۹٪ با OCR حرفهای؛ ۶۵–۷۰٪ با OCR عمومی
- سرعت: ثانیه در هر صفحه (نیاز به پردازش تصویر دارد)
- حریم خصوصی: معمولاً نیاز به پردازش سمت سرور دارد (فایل باید برای OCR آپلود شود)
- اندازه فایل: ۲۰۰ کیلوبایت تا ۲ مگابایت+ در هر صفحه
- نحوه شناسایی: نمیتوانید هیچ متنی را انتخاب کنید؛ با زوم تا ۴۰۰٪ پیکسلشدگی را نشان میدهد
چرا دقت اسکن شده برای دادههای مالی مهمتر است
نرخ دقت کاراکتر ۹۷٪ عالی به نظر میرسد تا زمانی که آن را بر روی دادههای مالی اعمال کنید. در یک صورتحساب با ۱۰۰۰ کاراکتر مبلغ، این به معنی ۳۰ کاراکتر اشتباه خوانده شده است. یک رقم اشتباه خوانده شده، مبلغ تراکنش را تغییر میدهد: "۱۲۳۴.۵۶ دلار" به "۱۲۳۴.۸۶ دلار" یا "۷۲۳۴.۵۶ دلار" تبدیل میشود. OCR پیشرفته به دقت نزدیک به ۹۹٪ دست مییابد، اما خطاهای باقیمانده به طور نامتناسبی بر روی کاراکترهایی میافتند که شبیه به هم هستند: ۰/O، ۱/l/I، ۵/S، ۸/B، ۶/G، و به طور حیاتی، ویرگول/نقطه. همیشه دانلودهای دیجیتال را ترجیح دهید. صورتحسابها را از وبسایت بانک خود دانلود کنید به جای اسکن کردن کاغذ. این کار خطاهای OCR را به طور کامل حذف میکند.
فرمتهای خروجی: بررسی عمیق

هنگام تبدیل صورتحساب بانکی، یک فرمت خروجی را انتخاب میکنید. هر فرمت دارای نقاط قوت، محدودیتها و موارد استفاده ایدهآل متفاوتی است.
Excel (.xlsx)
استاندارد: Office Open XML (OOXML)، استاندارد شده به عنوان ECMA-376 و ISO/IEC 29500.
چیست: یک فایل .xlsx در واقع یک آرشیو ZIP است که حاوی فایلهای XML - ساختار صفحه گسترده، دادههای سلول، سبکها و رشتههای مشترک است. به همین دلیل میتواند انواع داده (تاریخها به عنوان تاریخ، اعداد به عنوان اعداد)، قالببندی، فرمولها و چندین صفحه را ذخیره کند.
چرا برای صورتحسابهای بانکی محبوب است:
- تاریخها به عنوان تاریخ باقی میمانند (قابل مرتبسازی، قابل فیلتر)
- اعداد به عنوان اعداد باقی میمانند (قابل جمع، قابل قالببندی)
- فرمولها برای تطبیق (SUM، VLOOKUP)
- جداول محوری برای دستهبندی هزینهها
- قالببندی شرطی برای برجسته کردن مغایرتها
- اشتراکگذاری با مشتریانی که به یک صفحه گسترده قابل خواندن نیاز دارند
محدودیتها:
- حداکثر ۱,۰۴۸,۵۷۶ ردیف (به ندرت برای صورتحسابهای بانکی مرتبط است)
- مستقیماً قابل وارد کردن به اکثر نرمافزارهای حسابداری نیست (به جای آن از QBO/OFX استفاده کنید)
- برای باز کردن نیاز به Excel، Google Sheets یا LibreOffice Calc دارد
بهترین برای: بررسی دستی، تجزیه و تحلیل سفارشی، تطبیق، بایگانی، گزارشدهی به مشتری.
CSV (مقادیر جدا شده با کاما)
استاندارد: RFC 4180 (۲۰۰۵) - "فرمت مشترک و نوع MIME برای مقادیر جدا شده با کاما."
قوانین اصلی:
- رکوردها با CRLF (بازگشت سطر + خط تغذیه) جدا میشوند
- فیلدها با کاما جدا میشوند
- فیلدهایی که حاوی کاما، نقل قول یا شکست خط هستند باید در گیومه دوتایی قرار گیرند
- گیومههای دوتایی درون فیلدها با دو برابر کردن آنها گریز میشوند
تنوع جداکننده در عمل:
- کاما (
,) - استاندارد، استفاده شده در آمریکا/بریتانیا - نقطه ویرگول (
;) - استفاده شده در کشورهایی که کاما جداکننده اعشار است (فرانسه، آلمان، ایتالیا، اسپانیا، برزیل) - تب (
\t) - فرمت TSV، از تداخل جداکننده جلوگیری میکند
مشکلات رمزگشایی:
- UTF-8 برای قابلیت همکاری توصیه میشود
- UTF-8 BOM (نشانگر ترتیب بایت): توسط استاندارد الزامی نیست، اما Excel در ویندوز برای نمایش صحیح کاراکترهای غیر ASCII (حروف با لهجه، نمادهای ارز) به آن نیاز دارد. بدون BOM، Excel ممکن است UTF-8 را به عنوان Windows-1252 تفسیر کند و کاراکترها را خراب کند.
- Excel از نقطه ویرگول به جای کاما به عنوان جداکننده فیلد در مناطق اروپایی استفاده میکند
محدودیتها:
- بدون انواع داده - همه چیز متن است (اعداد با صفرهای پیشرو خراب میشوند، اعداد حساب طولانی به نماد علمی تبدیل میشوند)
- بدون پشتیبانی از چند صفحه
- بدون قالببندی یا فرمول
- بدون فراداده (بدون اطلاعات حساب، بدون شناسههای تشخیص تکراری)
بهترین برای: حداکثر سازگاری - تقریباً هر برنامه حسابداری، پایگاه داده و صفحه گستردهای میتواند CSV را وارد کند. جایگزین جهانی زمانی که QBO/OFX در دسترس نیست.
QBO (QuickBooks Web Connect)
چیست: فرمت واردات برای QuickBooks (هم دسکتاپ و هم آنلاین). فایلهای QBO بر اساس مشخصات OFX با افزونههای مخصوص QuickBooks هستند.
توضیح مهم: ".QBO" به معنای "QuickBooks Online" نیست - بلکه مخفف فرمت QuickBooks Web Connect است و با هر دو QuickBooks Desktop و QuickBooks Online کار میکند.
فیلدهای الزامی در هر تراکنش:
TRNTYPE- نوع تراکنش (DEBIT، CREDIT، CHECK، DEP، DIRECTDEP، DIRECTDEBIT، ATM، POS، XFER، PAYMENT، FEE، SRVCHG، INT، OTHER)DTPOSTED- تاریخ در فرمت YYYYMMDDTRNAMT- مبلغ (منفی برای بدهیها)FITID- شناسه تراکنش موسسه مالیNAME- گیرنده/توضیحات
چرا FITID مهم است: QuickBooks هر FITID را که تا به حال برای هر حساب وارد شده است، پیگیری میکند. اگر تراکنشی با همان FITID دوباره وارد شود، QuickBooks آن را به طور خودکار نادیده میگیرد - از ورود تکراری زمانی که کاربران دورههای صورتحساب همپوشان را دوباره وارد میکنند، جلوگیری میکند. این تشخیص خودکار تکراری بزرگترین مزیت QBO نسبت به CSV است.
دادههای اضافی: QBO همچنین شناسه حساب، شناسه بانک (شماره مسیریابی)، ارز، شماره چک، یادداشت و موجودی پایانی را حمل میکند - غنیترین مجموعه داده در هر فرمت ورودی برای QuickBooks.
بهترین برای: کاربران QuickBooks (دسکتاپ و آنلاین). غنیترین تجربه واردات را با تشخیص خودکار تکراری و طبقهبندی نوع تراکنش ارائه میدهد.
OFX (Open Financial Exchange)
تاریخچه: ایجاد شده توسط مایکروسافت، Intuit و CheckFree. نسخه ۱.۰ در فوریه ۱۹۹۷ منتشر شد.
تکامل نسخه:
- OFX 1.0–1.6 (۱۹۹۷–۱۹۹۹): نحو مبتنی بر SGML (بدون نیاز به تگهای پایانی)
- OFX 2.0+ (۲۰۰۰–تاکنون): مبتنی بر XML (تگهای پایانی صحیح، XML خوشساختار)
بسیاری از بانکها هنوز OFX 1.x (SGML) را برای حداکثر سازگاری تولید میکنند.
حاکمیت فعلی: در سال ۲۰۱۹، کنسرسیوم OFX در کنسرسیوم Financial Data Exchange (FDX) ادغام شد، که اکنون مشخصات را مدیریت میکند. FDX بیش از ۲۰۰ سازمان عضو و ۷۶ میلیون حساب مصرفکننده دارد.
چرا OFX استاندارد جهانی است: OFX همان فرمتی است که هنگام اتصال مستقیم حساب بانکی خود به نرمافزار حسابداری از طریق فیدهای بانکی استفاده میشود - همان فرمت برای واردات فایل کار میکند.
بهترین برای کاربران Xero: Xero فایلهای OFX را بدون نیاز به نگاشت دستی ستونها به طور خودکار وارد میکند. فایل را آپلود کنید و تراکنشها بلافاصله با تاریخها، مبالغ و توضیحات صحیح ظاهر میشوند. همچنین با Wave، Sage، FreshBooks و اکثر نرمافزارهای حسابداری کار میکند.
QFX (Quicken Financial Exchange)
چیست: نوع اختصاصی Intuit از OFX، که منحصراً با Quicken استفاده میشود. فایل QFX یک فایل OFX استاندارد با فیلدهای اختصاصی اضافی است.
فیلد اختصاصی کلیدی: INTU.BID - شناسه بانک Quicken. این شناسه عددی به بانکی در پایگاه داده داخلی Quicken نگاشت میشود. بدون آن، Quicken از وارد کردن فایل امتناع میورزد.
تفاوتها با OFX استاندارد:
- نیاز به INTU.BID در هدر دارد
- ممکن است شامل فیلدهای دیگر با پیشوند INTU.* باشد
- موسسات مالی برای ارائه دانلود QFX هزینه مجوز به Intuit پرداخت میکنند
- Quicken فایلهای OFX استاندارد را بدون فیلد INTU.BID وارد نمیکند
بهترین برای: کاربران نرمافزار مالی شخصی Quicken. فرمت الزامی - هیچ جایگزینی کار نمیکند.
QIF (Quicken Interchange Format)
چیست: یک فرمت قدیمی متن ساده که در اصل توسط Intuit برای Quicken توسعه یافته است. جفتهای تگ-مقدار، یکی در هر خط، با تگهای تک کاراکتری: D برای تاریخ، T برای مبلغ، P برای گیرنده، L برای دسته، M برای یادداشت، N برای شماره چک، ^ برای پایان رکورد.
چرا جایگزین شد: QIF فاقد مکانیزم تشخیص تکراری است (معادل FITID ندارد)، فیلدهای شناسایی حساب ندارد، اطلاعات مسیریابی بانک ندارد، دادههای موجودی ندارد و قالببندی تاریخ در پیادهسازیهای مختلف ناسازگار است.
هنوز مرتبط: برخی نرمافزارهای حسابداری (Xero، Sage، GnuCash) هنوز واردات QIF را میپذیرند. برای مهاجرت سیستمهای قدیمی مفید است.
JSON (JavaScript Object Notation)
وضعیت فعلی: JSON هنوز یک استاندارد برای فایلهای صورتحساب بانکی نیست، اما به طور فزایندهای در موارد زیر استفاده میشود:
- APIهای Open Banking (استاندارد Open Banking بریتانیا، گروه برلین PSD2)
- FDX API (Financial Data Exchange - جانشین OFX، بیش از ۲۰۰ سازمان عضو)
- Plaid، Yodlee، MX و سایر APIهای تجمیعکننده داده
- گردش کارهای توسعهدهنده و اتوماسیون
پذیرش رو به رشد: مقررات Open Banking (PSD2 در اروپا، بخش ۱۰۳۳ CFPB در ایالات متحده) پذیرش APIهای JSON را تسریع میکنند. FDX API از JSON/REST با OAuth 2.0 استفاده میکند که جهت آینده تبادل دادههای مالی را نشان میدهد.
بهترین برای: توسعهدهندگانی که گردش کارهای خودکار، ادغامهای فینتک، داشبوردهای سفارشی و ادغامهای API Open Banking را میسازند.
مقایسه فرمتها در یک نگاه
| فرمت | انواع داده | تشخیص تکراری | اطلاعات حساب | پشتیبانی نرمافزار حسابداری | بهترین برای |
|---|---|---|---|---|---|
| Excel | بله | خیر | خیر | محدود | بررسی دستی، تجزیه و تحلیل |
| CSV | خیر | خیر | خیر | جهانی | حداکثر سازگاری |
| QBO | بله | بله (FITID) | بله | QuickBooks | کاربران QuickBooks |
| OFX | بله | بله (FITID) | بله | اکثر نرمافزارها | Xero، Sage، FreshBooks |
| QFX | بله | بله (FITID) | بله | فقط Quicken | کاربران Quicken |
| QIF | جزئی | خیر | خیر | برخی قدیمی | مهاجرتهای قدیمی |
| JSON | بله | سفارشی | بله | مبتنی بر API | توسعهدهندگان، اتوماسیون |
سازگاری نرمافزار حسابداری
نرمافزار حسابداری شما کدام فرمت را میپذیرد؟
| نرمافزار | QBO | OFX | QFX | QIF | CSV | بهترین انتخاب |
|---|---|---|---|---|---|---|
| QuickBooks Online | بله | بله | بله | خیر | بله | QBO |
| QuickBooks Desktop | بله | بله | بله | خیر | بله | QBO |
| Quicken | خیر | خیر | بله | بله | خیر | QFX |
| Xero | بله | بله | بله | بله | بله | OFX |
| Sage | خیر | بله | خیر | بله | بله | OFX |
| Wave | خیر | بله | بله | خیر | بله | OFX |
| FreshBooks | خیر | خیر | خیر | خیر | بله | CSV |
| Zoho Books | خیر | بله | خیر | بله | بله | OFX |
| GnuCash | خیر | بله | خیر | بله | بله | OFX |
قانون کلی: از QBO برای QuickBooks، QFX برای Quicken، OFX برای بقیه موارد و CSV به عنوان یک جایگزین جهانی استفاده کنید.
تفاوتهای قالببندی بینالمللی
اگر با صورتحسابهای بانکی بینالمللی کار میکنید، با تفاوتهای قالببندی مواجه خواهید شد که بیشتر ابزارهای تبدیل را دچار مشکل میکند.
فرمتهای تاریخ
| منطقه | فرمت | مثال | یادداشتها |
|---|---|---|---|
| ایالات متحده | YYYY/MM/DD | 2026/03/15 | ماه اول |
| اروپا، آمریکای لاتین | DD/MM/YYYY | 15/03/2026 | روز اول |
| آلمان | DD.MM.YYYY | 15.03.2026 | جداکننده نقطه |
| ژاپن | YYYY年MM月DD日 | 2026年03月01日 | سال اول با کانجی |
| چین | YYYY年MM月DD日 | 2026年3月1日 | مشابه ژاپن |
| ISO 8601 | YYYY-MM-DD | 2026-03-15 | استاندارد بینالمللی بدون ابهام |
مشکل ابهام: "۰۳/۰۴/۲۰۲۶" در آمریکا ۴ مارس و در اروپا ۳ آوریل است. هنگامی که تمام تاریخها در یک صورتحساب دارای مقادیر روز ۱۲ یا کمتر هستند، هیچ راه الگوریتمی برای تعیین فرمت صحیح بدون دانستن کشور مبدأ وجود ندارد. ابزارهای تبدیل باید تمام تاریخهای صورتحساب را اسکن کنند و به دنبال مقادیری بزرگتر از ۱۲ بگردند تا فرمت را تعیین کنند.
فرمتهای اعداد
| منطقه | هزار و پنجاه سنت | یادداشتها |
|---|---|---|
| آمریکا، بریتانیا، استرالیا، ژاپن | ۱,۰۰۰.۵۰ | کاما برای هزارگان، نقطه برای اعشار |
| آلمان، فرانسه، اسپانیا، برزیل، ایتالیا | ۱.۰۰۰,۵۰ | نقطه برای هزارگان، کاما برای اعشار |
| سوئیس | ۱'۰۰۰.۵۰ | آپوستروف برای هزارگان |
| هند | ۱,۰۰,۰۰۰.۵۰ | سیستم گروهبندی لک |
| اسکاندیناوی | ۱ ۰۰۰,۵۰ | فاصله برای هزارگان، کاما برای اعشار |
"۱۰.۰۰۰,۴۵" از یک بانک اروپایی به معنای ده هزار و چهل و پنج سنت است - نه ده نقطه صفر صفر صفر چهار پنج. اشتباه در این مورد باعث خطاهای با ضریب ۱۰,۰۰۰ میشود.
قرارگیری نماد ارز
- آمریکا/بریتانیا: نماد قبل از مبلغ: $۱,۲۳۴.۵۶ / £۱,۲۳۴.۵۶
- فرانسه، آلمان، اسپانیا: نماد بعد از مبلغ: ۱.۲۳۴,۵۶ €
- ایرلند، هلند: نماد قبل: €۱,۲۳۴.۵۶
- ژاپن: نماد قبل: ¥۱۲۳,۴۵۶
رمزگشایی کاراکتر
- UTF-8 - استاندارد جهانی، پشتیبانی از تمام اسکریپتها
- GBK/GB2312 - چینی ساده شده (استفاده شده توسط بانکهای چینی)
- Shift_JIS - ژاپنی (استفاده شده توسط بانکهای ژاپنی)
- Big5 - چینی سنتی (تایوان، هنگ کنگ)
- EUC-KR - کرهای
- ISO 8859-1 - اروپای غربی
- Windows-1252 - اروپای غربی (قدیمی)
- Windows-1256 - عربی
باز کردن یک صورتحساب بانکی چینی یا ژاپنی در یک سیستم آمریکایی بدون تشخیص صحیح رمزگشایی، کاراکترهای درهم و برهمی تولید میکند. PDFSub بیش از ۱۳۰ زبان را با تشخیص خودکار فرمتهای تاریخ، فرمتهای اعداد و رمزگشایی کاراکترها - از جمله راست به چپ عربی و عبری، کاراکترهای CJK و تمام مجموعههای کاراکتر اروپایی - مدیریت میکند.
عناصر رایج صورتحساب بانکی
تاریخ تراکنش در مقابل تاریخ ثبت در مقابل تاریخ ارزش
صورتحسابهای بانکی ممکن است شامل چندین تاریخ برای یک تراکنش واحد باشند:
- تاریخ تراکنش - زمان واقعی وقوع خرید یا انتقال
- تاریخ ثبت - زمان پردازش و ثبت آن توسط بانک (معمولاً ۱ تا ۳ روز کاری بعد برای خرید با کارت اعتباری)
- تاریخ ارزش - زمان واقعی در دسترس قرار گرفتن وجوه (بر محاسبه سود تأثیر میگذارد، رایج در بانکداری بینالمللی)
بیشتر صورتحسابهای مصرفکننده فقط تاریخ ثبت را نشان میدهند. صورتحسابهای تجاری اغلب شامل هر دو تاریخ تراکنش و ثبت هستند.
نمایش بدهی/اعتبار
بانکها بدهیها و اعتبارها را به طور متفاوتی نشان میدهند:
- مبالغ علامتدار: -۸۷.۵۰ برای بدهیها، +۳,۵۰۰.۰۰ برای اعتبارها
- ستونهای جداگانه: "برداشتها" و "سپردهها"
- مخففها: "DR" برای بدهی، "CR" برای اعتبار (رایج در بریتانیا/مشترکالمنافع)
- پرانتز: (۸۷.۵۰) برای بدهیها (عرف حسابداری)
موجودی در حال اجرا
- موجودی در هر تراکنش - بهروز شده پس از هر تراکنش (رایجترین در صورتحسابهای مصرفکننده آمریکا)
- فقط موجودی روزانه - موجودی نمایش داده شده در پایان هر روز (رایج در صورتحسابهای تجاری)
- بدون موجودی در حال اجرا - فقط موجودیهای آغازین و پایانی (برخی صورتحسابهای بینالمللی)
موجودیهای در حال اجرا برای اعتبارسنجی ارزشمند هستند: میتوانید تأیید کنید که هر تراکنش به درستی موجودی را از یک خط به خط بعدی منتقل میکند.
اطلاعات استاندارد هدر
بیشتر صورتحسابهای بانکی شامل موارد زیر هستند: نام صاحب حساب، شماره حساب (اغلب تا حدی پنهان شده)، دوره صورتحساب، موجودیهای آغازین و پایانی، کل سپردهها و برداشتها، و کد مسیریابی/مرتبسازی/کد بانکی SWIFT.
حفاظت با رمز عبور
نحوه رمزگذاری PDF توسط بانکها
بانکها معمولاً از رمزگذاری AES-128 یا AES-256 استفاده میکنند. دو حالت حفاظت وجود دارد:
- رمز عبور کاربر (رمز عبور باز کردن): برای باز کردن فایل لازم است
- رمز عبور مالک (رمز عبور مجوزها): PDF باز میشود اما ویرایش/کپی ممکن است محدود شود
الگوهای رایج رمز عبور
| بانک | رمز عبور معمول |
|---|---|
| چیس | SSN کامل ۹ رقمی |
| بانک آو آمریکا | SSN یا TIN |
| ولز فارگو | SSN یا ۴ رقم آخر SSN |
| کپیتال وان | تاریخ تولد (MMDDYYYY) |
الگوهای رایج دیگر شامل ۴ رقم آخر شماره حساب، شناسه مشتری یا شماره عضو است. بانکها معمولاً هنگام فعال کردن صورتحسابهای الکترونیکی، الگوی رمز عبور را اطلاعرسانی میکنند.
چالشهای صورتحسابهای چند صفحهای
صورتحسابهای طولانی (حسابهای تجاری با صدها تراکنش) چندین چالش استخراج ایجاد میکنند:
تراکنشهای تقسیم شده
توضیحات یک تراکنش ممکن است در پایین یک صفحه شروع شده و در بالای صفحه بعدی ادامه یابد. مبدل باید خطوط ادامه را تشخیص داده و آنها را در یک تراکنش واحد ادغام کند.
هدرها و فوترهای تکراری
بیشتر بانکها هدرهای ستون را در هر صفحه تکرار میکنند، به علاوه شماره صفحه، سلب مسئولیتهای قانونی و متن تبلیغاتی. اینها باید شناسایی شده و از دادههای تراکنش حذف شوند.
خطوط ادامه
بسیاری از تراکنشها دارای توضیحات چند خطی هستند:
۰۱/۱۵ کاهش الکترونیکی ACH شرکت فروشنده $۳,۲۰۰.۰۰ $۲,۰۰۰.۰۰ REF#123456789 INVOICE 2026-001 شرکت فروشنده حسابهای پرداختنیخطوط ۲ و ۳ خطوط ادامه هستند که به تراکنش در خط ۱ تعلق دارند. آنها معمولاً فاقد تاریخ و مبلغ هستند و در همان مختصات x ستون توضیحات، با تورفتگی ظاهر میشوند.
انتقال موجودی
برخی بانکها خطوط "موجودی منتقل شده" یا "موجودی آورده شده" را در بالای صفحات ادامه قرار میدهند. اینها اطلاعاتی هستند، نه تراکنش، و باید از دادههای استخراج شده حذف شوند.
مخففهای رایج تراکنش
صورتحسابهای بانکی از مخففهایی استفاده میکنند که در موسسات مختلف متفاوت است:
| مخفف | معنی |
|---|---|
| ACH | Automated Clearing House (انتقالات الکترونیکی) |
| ATM | Automated Teller Machine (دستگاه خودپرداز) |
| POS | Point of Sale (کارت بدهی) |
| EFT | Electronic Funds Transfer (انتقال الکترونیکی وجوه) |
| INT | Interest payment (پرداخت سود) |
| CHK / CK | Check (چک) |
| WD / W/D | Withdrawal (برداشت) |
| DEP | Deposit (سپرده) |
| DD | Direct Deposit (واریز مستقیم) |
| OD | Overdraft (اضافه برداشت) |
| NSF | Non-Sufficient Funds (وجوه ناکافی) |
| SRVCHG | Service Charge (کارمزد خدمات) |
| XFER | Transfer (انتقال) |
استانداردهای صنعتی که باید بدانید
این فرمتها در بانکداری شرکتی و مدیریت خزانه استفاده میشوند. شما به ندرت مستقیماً با آنها مواجه خواهید شد، اما درک آنها توضیح میدهد که چرا صورتحسابهای بانکی به شکلی که هستند کار میکنند.
BAI2 (Bank Administration Institute)
برای مدیریت خودکار وجوه نقد و تطبیق بانکی در سیستمهای ERP (SAP، Oracle) استفاده میشود. یک فرمت ASCII با عرض ثابت با کدهای نوع تراکنش (مانند ۱۶۵ = اعتبار ACH از پیش مجاز، ۴۵۵ = بدهی ACH، ۴۹۵ = انتقال سیمی خروجی). در اصل در سال ۱۹۸۷ منتشر شد، اکنون توسط ASC X9 نگهداری میشود.
SWIFT MT940 / MT940
صورتحسابهای بانکی پایان روز (MT940) و درون روز (MT942) که توسط بانکهای سراسر جهان برای مشتریان شرکتی و بخشهای خزانه استفاده میشود. SWIFT روزانه تقریباً ۴۵ میلیون پیام را پردازش میکند. فرمت مبتنی بر تگ با شناسه فیلدهای جدا شده با دو نقطه.
ISO 20022 (camt.053)
جایگزین مدرن مبتنی بر XML برای MT940. بخشی از استاندارد پیامرسانی مالی جهانی ISO 20022. دادههای غنیتر از MT940، بدون محدودیت طول فیلد، XML قابل تجزیه ماشینی با اعتبارسنجی XSD. SWIFT در حال مهاجرت از پیامهای MT به ISO 20022 است. SEPA (منطقه پرداخت واحد یورو) فرمت camt را برای پرداختهای اروپایی اجباری میکند.
NACHA ACH
فرمت فایل برای تراکنشهای Automated Clearing House در ایالات متحده. ASCII با عرض ثابت، دقیقاً ۹۴ کاراکتر در هر خط. ACH سالانه تقریباً ۳۰ میلیارد تراکنش را در ایالات متحده پردازش میکند. هنگامی که صورتحساب بانکی شما "ACH CREDIT" یا "ACH DEBIT" را نشان میدهد، تراکنش زیربنایی در فرمت NACHA بین بانکها منتقل شده است.
انتخاب فرمت مناسب برای گردش کار شما
راهنمای تصمیمگیری
اگر از QuickBooks استفاده میکنید (دسکتاپ یا آنلاین)، از QBO استفاده کنید. شما طبقهبندی نوع تراکنش، تشخیص تکراری از طریق FITID و غنیترین فراداده واردات را دریافت میکنید.
اگر از Xero، Sage، Wave یا سایر نرمافزارهای سازگار با OFX استفاده میکنید، از OFX استفاده کنید. Xero فیلدها را بدون پیکربندی دستی ستونها به طور خودکار نگاشت میکند.
اگر از Quicken استفاده میکنید، از QFX استفاده کنید. این تنها فرمتی است که Quicken میپذیرد.
اگر نیاز به بررسی، تجزیه و تحلیل یا دستکاری دادهها قبل از وارد کردن دارید، از Excel استفاده کنید. جداول محوری ایجاد کنید، فرمولها را اجرا کنید یا گزارشها را آماده کنید.
اگر نرمافزار شما در لیست بالا نیست، یا به حداکثر سازگاری در بین سیستمها نیاز دارید، از CSV استفاده کنید. آماده باشید تا ستونها را به صورت دستی نگاشت کنید.
اگر در حال ساخت گردش کارهای خودکار، ادغامهای API یا سیستمهای گزارشدهی سفارشی هستید، از JSON استفاده کنید.
نکات حرفهای
- همیشه از QBO/OFX به جای CSV استفاده کنید زمانی که نرمافزار شما از آن پشتیبانی میکند - فقط تشخیص تکراری از ساعتها پاکسازی جلوگیری میکند
- PDF اصلی را در کنار فایل تبدیل شده خود نگه دارید - این مسیر حسابرسی و سند منبع شماست
- پس از هر واردات تأیید کنید - موجودیهای آغازین/پایانی و چند تراکنش تصادفی را به طور تصادفی بررسی کنید
- فرمت را با نرمافزار مطابقت دهید - استفاده از فرمت بومی برای پلتفرم حسابداری شما از نگاشت دستی ستونها جلوگیری میکند و ویژگیهای خودکار را فعال میکند
رایگان امتحان کنید
آماده تبدیل اولین صورتحساب خود هستید؟ اکنون PDF را آپلود کنید - PDFSub به Excel، CSV، QBO، OFX، QFX و JSON تبدیل میکند. صورتحسابهای دیجیتال برای حداکثر حریم خصوصی به طور کامل در مرورگر شما پردازش میشوند. یک دوره آزمایشی رایگان ۷ روزه با دسترسی کامل به تمام فرمتها را شروع کنید.