将印度银行对账单(含印地语)转换为 Excel
印度超过 5.6 亿个银行账户生成的对账单面临独特挑战:lakh/crore 数字格式、密码保护的 PDF、印地语/天城体文本以及 UPI/NEFT/IMPS 交易代码。本文将介绍如何准确转换这些对账单。
仅在“人民财富计划 (Jan Dhan Yojana)”下,印度就拥有超过 5.6 亿个银行账户,数字银行用户超过 2.95 亿,685 家银行通过 UPI 每月处理 216 亿笔交易。几乎所有这些银行都发布 PDF 对账单,每份对账单都有其独特的布局、密码格式、日期约定和交易代码系统。
将印度银行对账单转换为 Excel 比看起来要困难。lakh/crore 数字系统与西方格式(1,23,456.78 对比 123,456.78)的逗号放置方式不同。大多数对账单都受密码保护,密码是银行特定的客户 ID、出生日期和账号组合。国有银行 (PSU banks) 的对账单中包含印地语(天城体)文本和英语。包含 UPI 交易 ID 和 NEFT UTR 号码的叙述字段经常跨多行显示,这会破坏标准的提取工具。
本指南涵盖了印度各大银行的对账单格式、密码模式、交易代码以及将其转换为 Excel、CSV 或 Tally 兼容格式的具体挑战。
印度银行对账单格式
标准列布局
大多数印度银行对账单采用以下列结构:
| 列 | 描述 |
|---|---|
| 日期 | 交易日期(格式因银行而异) |
| 起息日 | 资金实际清算日期 |
| 叙述 / 描述 / 详情 | 交易详情、代码和交易对手 |
| 支票/参考号 | 支票号码或参考号码 |
| 取款 / 借记 | 借记金额 |
| 存款 / 贷记 | 贷记金额 |
| 期末余额 | 每笔交易后的余额 |
有些银行(如 SBI、PNB)使用单独的借记和贷记列。其他银行则使用带有贷方/借方指示符的单一金额列。这种不一致是通用提取工具难以处理印度对账单的原因之一。
银行日期格式
印度银行没有统一的日期格式:
| 格式 | 示例 | 使用该格式的银行 |
|---|---|---|
| DD/MM/YYYY | 15/03/2026 | SBI, PNB, Canara Bank |
| DD-MM-YYYY | 15-03-2026 | ICICI, most PSU banks |
| DD-MMM-YYYY | 15-Mar-2026 | HDFC Bank |
| DD/MM/YY | 15/03/26 | Some older format statements |
| DD MMM YYYY | 15 Mar 2026 | Axis Bank |
BIS 标准 (IS 7900:2001) 建议采用遵循 ISO 8601 的 YYYY-MM-DD 格式,但几乎没有印度银行对账单使用此格式。转换为 Excel 时,日期解析必须正确处理所有这些变体——将日期错误地解释为 MM/DD 可能会导致交易月份错位。
叙述字段模式
叙述字段是印度银行对账单变得复杂的地方。常见模式:
- UPI/{VPA}/{名称}/{参考号} — 带有虚拟支付地址的 UPI 交易
- NEFT/{UTR}/{收款人姓名} — 带有 UTR 号码的 NEFT 转账
- RTGS/{UTR}/{收款人姓名} — RTGS 大额转账
- IMPS/{参考号}/{名称} — IMPS 即时转账
- ATM WDL 或 NWD — ATM 取款
- CHQ DEP — 支票存款
- INT CR — 利息入账
- POS DR — 销售点借记
- NACH — 全国自动清算所(定期付款)
- ECS — 电子清算服务
- CMS — 现金管理服务
- DD — 银行汇票
这些叙述在 PDF 中经常跨多行显示,特别是对于 UPI 交易(包括 username@bankname 等 VPA)和 NEFT 转账(包括 16 位 UTR 号码和收款人详情)。标准提取工具会将每个换行行视为单独的行,从而创建没有日期或金额的虚假交易。
密码保护:每家印度银行都不同
几乎所有印度银行都会对通过电子邮件发送给客户的 PDF 对账单进行密码保护。每家银行的密码格式都独一无二:
| 银行 | 密码格式 | 示例 |
|---|---|---|
| SBI(手机银行) | 11 位账号 | 12345678901 |
| SBI(电子邮件) | 手机号后 5 位 + 出生日期 (DDMMYY) | 56789010190 |
| HDFC Bank(账户) | 客户 ID | 12345678 |
| HDFC Bank(信用卡) | 姓名前 4 个大写字母 + 卡号后 4 位 | SWAT5692 |
| ICICI Bank | 账户名称前 4 个字母 + 出生日期 (DDMM) | SWAT1801 |
| Axis Bank | 姓名前 4 个大写字母 + 出生日期 (DDMM) | RAJA0508 |
| PNB | 9 位客户 ID(字母数字) | ABC123456 |
| Kotak Mahindra | CRN(客户关系号) | 9876543210 |
| Bank of Baroda | 姓名前 4 个小写字母 + 出生日期 (DDMM) | raje0508 |
| Bank of India | 姓名前 4 个小写字母 + 出生日期 (DDMM) | anan1606 |
| Canara Bank | 客户 ID(CIF 号码) | 9876543210 |
| Union Bank | 姓名格式 + 出生日期 | RAJA05081990 |
| IDBI Bank | 客户 ID | 1234567890 |
| Yes Bank | 客户 ID + 完整出生日期 (DDMMYYYY) | 123456789001011990 |
| IndusInd Bank | 名字前 4 个大写字母 + 出生日期 (DDMM) | RAJA0508 |
| Central Bank of India | 客户 ID@出生日期 (DDMMYYYY) | 9029080134@18031998 |
| Indian Bank | 完整银行账号 | (完整号码) |
PDFSub 的银行对账单转换器包含一个解锁步骤——您只需输入一次密码,转换器就会处理其余部分。密码在您的浏览器中本地使用;它绝不会发送到任何服务器。
印度数字系统:Lakh 和 Crore
印度数字系统在最初三位数字之后,其数字分组方式与西方系统不同:
| 金额 | 印度格式 | 西方格式 |
|---|---|---|
| 一千 | 1,000 | 1,000 |
| 一万 | 10,000 | 10,000 |
| 一 lakh | 1,00,000 | 100,000 |
| 十 lakh | 10,00,000 | 1,000,000 |
| 一 crore | 1,00,00,000 | 10,000,000 |
逗号模式:从右数第一个逗号在 3 位数字之后,然后每 2 位数字之后一个。
这对提取为何重要: 期望西方逗号放置(每 3 位数字)的转换器会错误解析印度格式的数字。金额“1,23,456.78”(一 lakh 二万三千)可能会被错误解析为“123,456.78”或“1,234,567.8”——两者都是错误的。
PDFSub 正确处理印度数字格式,无论逗号放置如何,都能保留实际的数值。
Excel 技巧: 要在 Excel 中显示印度格式的数字,您可以将系统区域设置更改为英语(印度),或者使用自定义数字格式:[>=10000000]##\,##\,##\,##0;[>=100000] ##\,##\,##0;##,##0
印地语和双语对账单
印地语出现的位置
印度储备银行 (RBI) 的《客户服务主通函》规定,所有指定商业银行面向客户的材料必须提供印地语、英语和当地语言版本。实际情况是:
- 标题可能同时出现印地语和英语(例如,“खाता विवरण / Account Statement”)
- 银行名称和分行在国有银行对账单上以印地语显示
- 叙述字段几乎总是英语(NEFT、UPI、IMPS 等交易代码是英语)
- 农村地区的政府/国有银行存折可能只有印地语标题
- 网上银行下载的数字 PDF 对账单主要是英语
常用印地语银行术语
| 印地语(天城体) | 音译 | 英语 |
|---|---|---|
| खाता | Khata | 账户 |
| बचत खाता | Bachat Khata | 储蓄账户 |
| चालू खाता | Chalu Khata | 活期账户 |
| जमा | Jama | 存款 |
| निकासी | Nikaasi | 取款 |
| शेष राशि | Shesh Rashi | 余额 |
| खाता विवरण | Khata Vivaran | 账户对账单 |
| ब्याज | Byaaj | 利息 |
| दिनांक | Dinank | 日期 |
| लेनदेन | Lenden | 交易 |
天城体 OCR 挑战
包含印地语文本的扫描对账单带来了特定的 OCR 挑战:
- 复杂的字符结构 — 天城体具有连体字符,比拉丁文字更难分割
- 印刷天城体准确率 — 清晰印刷文本的准确率为 90–95%
- 手写印地语准确率 — 清晰样本的准确率为 70–85%
- 多脚本混合 — 结合天城体和拉丁文的对账单需要能够同时处理两种脚本的 OCR 系统
- 旧字体编码 — 像 Kruti Dev 这样的非 Unicode 字体使用拉丁码点编码天城体字符,导致 OCR 失败
PDFSub 支持 130 多种语言,包括印地语(天城体文字)。对于数字 PDF 对账单(从网上银行下载的类型),无需 OCR 即可进行提取——文本已编码在 PDF 中。OCR 仅适用于扫描或拍照的对账单。
交易代码参考
印度银行对账单使用特定缩写来表示不同的支付系统:
| 代码 | 全称 | 描述 | 典型格式 |
|---|---|---|---|
| UPI | Unified Payments Interface | 即时移动支付 | UPI/{VPA}/{名称}/{参考号} |
| NEFT | National Electronic Funds Transfer | 批量结算转账 | NEFT/{UTR}/{名称} |
| RTGS | Real Time Gross Settlement | 高价值实时转账(最低 2 lakh 卢比) | RTGS/{UTR}/{名称} |
| IMPS | Immediate Payment Service | 实时转账(任意金额) | IMPS/{参考号}/{名称} |
| NACH | National Automated Clearing House | 批量/定期付款(分期付款、保险) | NACH/{Mandate}/{名称} |
| ECS | Electronic Clearing Service | 较旧的批量支付系统 | ECS/{Ref} |
| ATM WDL | ATM Withdrawal | 在 ATM 取现金 | ATM WDL/{Location} |
| NWD | Non-Home Branch Withdrawal | 在不同银行 ATM 取款 | NWD/{Bank}/{Location} |
| CHQ DEP | Cheque Deposit | 存入支票 | CHQ DEP/{Chq No} |
| POS | Point of Sale | 商户刷卡支付 | POS/{Merchant}/{City} |
| INT CR | Interest Credit | 账户利息入账 | INT CR |
| CMS | Cash Management Services | 企业现金管理 | CMS/{Ref} |
| DD | Demand Draft | 银行签发的付款 | DD/{No}/{Name} |
UTR(唯一交易参考号)格式:
- NEFT:16 位代码(银行代码 + 日期 + 序列号)
- RTGS:22 位代码(银行代码 + 完整日期 + 序列号)
- IMPS:12 位数字参考号
- UPI:带有 VPA(虚拟支付地址)的可变格式
了解这些代码有助于您验证提取的数据是否正确分类了交易类型。
各银行对账单特点
SBI(印度国家银行)
印度最大的银行,在资产方面占 23% 的市场份额,在贷款和存款方面占 25%。
- 布局: 独立的借记和贷记列
- 日期格式: DD/MM/YYYY
- 密码(手机银行): 11 位账号
- 密码(电子邮件): 手机号后 5 位 + 出生日期 (DDMMYY)
- 标题: 双语(印地语 + 英语)
- 叙述: 通常使用内部代码缩写
HDFC 银行
按市值计算最大的私营银行,拥有 9,100 多家分行。
- 布局: 独立的取款和存款列
- 日期格式: DD-MMM-YYYY(例如,15-Mar-2026)
- 密码(账户): 客户 ID
- 密码(信用卡): 姓名前 4 个大写字母 + 卡号后 4 位
- 标题: 仅英语
- 叙述: 相对详细,包含完整的收款人姓名
ICICI 银行
第二大私营银行,拥有 6,613 家分行。
- 布局: 独立的借记和贷记列
- 日期格式: DD-MM-YYYY
- 密码: 账户名称前 4 个字母 + 出生日期 (DDMM)
- 标题: 仅英语
- 叙述: 包含交易参考号
Axis 银行
第三大私营银行。
- 布局: 独立的借记和贷记列
- 日期格式: DD MMM YYYY(空格分隔)
- 密码: 姓名前 4 个大写字母 + 出生日期 (DDMM)
- 标题: 仅英语
PNB(旁遮普国家银行)
第二大国有银行,拥有 11,000 多家分行。
- 布局: 独立的借记和贷记列
- 日期格式: DD/MM/YYYY
- 密码: 9 位客户 ID(字母数字)
- 标题: 双语(印地语 + 英语)
- 叙述: 通常包含印地语文本,用于分行级交易
印度银行对账单转换用例
GST 合规与申报
在 GST 制度下,企业必须进行 GST 对账。银行对账单可作为以下事项的证明文件:
- GSTR-2A/2B 对账 — 将采购/销售数据与供应商记录进行匹配
- 进项税抵免申报 — 验证银行费用中支付的 GST
- GSTR-9C — 将 GST 申报与审计财务报表进行比较的年度对账单
- CGST 规则第 54(2) 条 — 当银行未开具税务发票时,银行对账单被视为发票
将对账单转换为 Excel 可以通过匹配交易日期、金额和交易对手详情,实现高效的每月 GST 对账。
所得税申报准备
特许会计师 (CA) 审计现金簿、分类账、日记账、银行对账单以及销售/采购发票。根据第 44AB 条款:
- 营业额超过 1 crore 卢比(如果现金交易在 5% 以内,则为 10 crore 卢比)需要税务审计
- 专业总收入超过 50 lakh 卢比需要税务审计
- 第 271B 条款下的罚款: 对于不合规行为,罚款 1 lakh 卢比或营业额的 0.5%(以较低者为准)
Excel 中组织良好的银行对账单可显著减少审计准备时间,并帮助 CA 高效验证收入、支出和现金流。
TDS/TCS 追踪
银行对每年超过 40,000 卢比(老年人为 50,000 卢比)的利息收入扣除 TDS。将银行对账单转换为 Excel 可以实现:
- 将 TDS 扣除与 Form 26AS 和年度信息报表 (AIS) 进行交叉参考
- 识别银行扣除的 TDS 与 TRACES 记录之间的不匹配
- 追踪承包商/专业人士 TDS(第 194C、194J 条款)和采购 TCS
贷款申请
所有主要的印度银行都要求提供最近 6 个月的银行对账单作为贷款申请的收入证明。自雇借款人需要额外的文件,包括活期账户对账单和 CC/OD 额度对账单。
转换为 Excel 有助于申请人审查其财务数据,识别任何异常情况,并确保对账单符合贷款机构的要求。
签证申请
大多数签证申请要求提供当前银行对账单作为资金证明:
- 最低余额通常为 1,50,000 至 5,00,000 卢比(因目的地国家/地区而异)
- 建议提供过去 6 个月的对账单
- 申请前突然大额存款会显得可疑
小型企业记账
许多印度中小企业通过个人银行账户进行所有交易,这使得区分个人支出和业务支出变得困难。将 PDF 对账单转换为 Excel 可以实现定期分类和对账,而不是在年终手忙脚乱。
会计软件兼容性
TallyPrime(印度使用最广泛的软件)
TallyPrime 7.0 支持 145 家以上银行的对账单导入。
- 首选导入格式: XML(结构化数据最可靠)
- 也接受: Excel、CSV、MT940
- 关键要求: XML 中的银行账户名称必须与 Tally 中的银行分类账名称匹配
- 自动对账: 将导入的交易与现有的 Tally 记录进行匹配
- 凭证日期要求: 必须在当前财政年度内
工作流程: 使用 PDFSub 将银行对账单转换为 Excel → 将列映射到 Tally 预期的结构 → 导出为 XML → 导入到 TallyPrime。
Zoho Books
在印度中小企业和初创公司中很受欢迎。
- 支持格式: CSV、TSV、OFX、QIF、CAMT.053
- 支持: 单列(带类型金额)和双列(独立存款/取款)格式
- 列映射: 导入时可配置
QuickBooks India
- 支持格式: CSV(3 列或 4 列)
- 日期格式: 建议使用 DD/MM/YYYY
- 要求: 去除货币符号,删除千位分隔符,英文文本,文件小于 350 KB,每次上传最多 1,000 行
Vyapar
印度中小企业流行的开票和会计应用程序。
- 支持格式: Excel、CSV
Busy Accounting
印度流行的桌面会计软件。
- 支持格式: Excel、CSV
导入格式摘要
| 软件 | Excel | CSV | XML | OFX | QIF |
|---|---|---|---|---|---|
| TallyPrime | 是 | 是 | 是(首选) | 否 | 否 |
| Zoho Books | 否 | 是 | 否 | 是 | 是 |
| QuickBooks India | 否 | 是 | 否 | 否 | 否 |
| Vyapar | 是 | 是 | 否 | 否 | 否 |
| Busy Accounting | 是 | 是 | 否 | 否 | 否 |
PDFSub 支持导出为 Excel、CSV、TSV、JSON、OFX、QBO、QFX 和 QIF 格式——涵盖所有主要的印度会计平台。
数据隐私:DPDP 法案和基于浏览器的处理
印度数字个人数据保护法案 (2023)
印度首部全面的数字隐私法于 2023 年 8 月颁布,DPDP 规则 2025 于 2025 年 11 月发布。预计将于 2027 年 5 月 13 日全面合规。
七项核心原则:
- 同意和透明 — 数据处理者必须提前披露处理详情
- 目的限制 — 数据仅用于声明的目的
- 数据最小化 — 仅收集必要数据
- 准确性 — 保持数据正确和最新
- 存储限制 — 不得保留超过所需时间
- 安全保障 — 防止数据泄露
- 问责制 — 组织对合规负责
印度储备银行 (RBI) 数据本地化
印度储备银行 (RBI) 规定所有支付系统数据必须仅存储在印度境内。这对于任何处理银行对账单的工具都尤为重要——基于云的工具可能会将数据通过印度境外的服务器路由。
基于浏览器的处理为何重要
当 PDFSub 在您的浏览器中处理您的银行对账单时:
- PDF 从您的设备读取到浏览器内存中
- 提取在本地进行——日期、描述、金额被识别
- 输出文件(Excel、CSV 等)在您的浏览器中生成
- 您将结果直接下载到您的设备
没有数据传输到任何服务器。 银行对账单绝不会离开您的设备,这符合:
- DPDP 法案数据最小化 — 不进行数据收集
- 印度储备银行 (RBI) 数据本地化 — 数据保留在您位于印度的设备上
- AICPA/CA 专业标准 — 不向第三方披露
您可以验证这一点:在处理对账单时,打开浏览器的开发者工具 (F12 → 网络选项卡)。没有包含财务数据的出站请求。
常见挑战与解决方案
多行叙述换行
问题: 印度银行对账单的叙述经常跨 2-3 行。只有第一行包含日期、金额和余额。标准工具会将每行视为单独的交易。
解决方案: PDFSub 的提取引擎通过识别没有日期和金额的行来检测多行叙述,然后将其合并到父交易中。结果是每笔交易一行清晰的数据。
Lakh/Crore 数字解析
问题: 以西方为中心的工具期望每 3 位数字一个逗号。印度格式(1,23,456.78)会被错误解析。
解决方案: PDFSub 识别印度数字格式并保留正确的数值。在 Excel 输出中,数字以实际数值存储,您可以对其进行求和、排序和分析。
密码保护的 PDF
问题: 每家印度银行都使用不同的密码格式。用户浪费时间试图记住他们的银行使用哪种组合。
解决方案: 使用本指南中的密码参考表。PDFSub 的转换器包含一个密码解锁步骤——输入一次即可继续转换。密码在您的浏览器中本地处理。
日期格式不一致
问题: DD/MM/YYYY、DD-MMM-YYYY、DD MMM YYYY——每家银行都使用自己的格式。当区域设置不匹配时,Excel 可能会错误解释日期。
解决方案: PDFSub 在提取过程中标准化日期。在 Excel 输出中,日期以一致格式的正确日期值存储,从而防止与区域设置相关的错误解释。
印地语和英语混合文本
问题: 国有银行对账单包含印地语标题,偶尔还有印地语叙述。只期望英语文本的工具可能无法解析这些部分。
解决方案: PDFSub 支持 130 多种语言,包括印地语。数字 PDF(从网上银行下载的类型)的文本直接编码在文件中——无需 OCR。印地语和英语文本都能正确提取。
分步指南:转换您的印度银行对账单
步骤 1:下载您的对账单
登录您银行的网上银行门户并下载 PDF 对账单。数字对账单比扫描的存折页面更准确。
步骤 2:记下您的密码
请参考本指南中的密码表,了解您银行的格式。常见模式:
- 客户 ID(HDFC、Canara、IDBI)
- 姓名缩写 + 出生日期(ICICI、Axis、Bank of Baroda)
- 账号(SBI 手机银行、Indian 银行)
步骤 3:上传并转换
- 前往 PDFSub 的银行对账单转换器
- 上传您的 PDF 对账单
- 在提示时输入密码
- 选择您的输出格式(Excel、CSV 或您的会计软件首选格式)
- 下载转换后的文件
对于大多数对账单,整个过程不到 30 秒。您的文件在浏览器中处理,绝不会上传到任何服务器。
步骤 4:导入到您的会计软件
对于 TallyPrime: 打开 Excel 文件,将列映射到 Tally 预期的字段,导出为 XML,然后导入到 TallyPrime。
对于 Zoho Books: 通过“银行 → 导入对账单”直接上传 CSV 文件。在导入时映射列。
对于 QuickBooks: 通过“银行 → 上传交易”上传 CSV 文件。确保日期格式匹配 DD/MM/YYYY。
步骤 5:验证
务必检查:
- 交易数量与源 PDF 匹配
- 期初和期末余额匹配
- 借方和贷方总额正确
- 日期在正确的月份(注意 DD/MM 与 MM/DD 的解释)
获得最佳结果的技巧
下载数字对账单。 网上银行的 PDF 具有完美的文本编码,使得提取几乎完美。扫描的存折页面由于 OCR 限制,准确性较低。
使用正确的输出格式。 Excel 最适合审查和分析。CSV 适用于大多数印度会计软件。XML 适用于 TallyPrime。
首先检查密码格式。 每家银行都使用不同的模式。在开始之前准备好密码可以节省时间。
在 Excel 中验证数字格式。 导入后,确认金额被识别为数字(右对齐),而不是文本(左对齐)。如果金额显示为文本,请选择该列并转换为数字格式。
谨慎处理多账户对账单。 有些银行将储蓄账户和活期账户合并在一份对账单中。检查交易是否正确归属于每个账户。
免费试用
准备好转换您的印度银行对账单了吗?立即上传您的 PDF——PDFSub 支持 20,000 多种银行格式,包括所有主要的印度银行。数字对账单完全在您的浏览器中处理。您的财务数据绝不会离开您的设备。
开始 7 天免费试用。无需信用卡。