如何使用 AI 从 W-2 和 1099 税务表格中提取数据(2026 年指南)
AI 提取技术可在几秒钟内读取 W-2、1099、K-1 和工资单——无需模板,无需手动输入。此外,还可以使用 PDF 表格填充器填写空白的 IRS 税务表格。已更新至 2026 年门槛和新的 W-2 代码。

四月已过,但税务表格尚未结束。簿记员仍需为客户遗忘的往年工作签发 1099-NEC。一位贷款官员正在审阅抵押贷款申请人的四份 W-2 和三份工资单。一位延期报税的会计师正在为客户 10 月 15 日的申报协调 47 份 K-1。一位小企业主刚刚意识到需要向他们错过的承包商邮寄修订后的 1099。
税务表格不是一月份的问题——它们是全年的问题。几乎所有处理这些表格的工作流程都以相同的方式开始:有人必须读取 PDF 的每个框,并将数值键入电子表格、会计软件或其他表格。
本指南将介绍 AI 提取如何自动读取税务表格数据,如何无需打印即可填写空白税务表格(W-9、W-4、1099 模板),以及您需要了解的关于 2026 年申报季的变化。
为什么税务表格数据录入如此痛苦
一份 W-2 表格在 20 个框中包含 25 个以上的数据点。一份 1099-NEC 包含 8 个。一份 K-1 可能包含 30 多个数据点,具体取决于合伙企业。将此乘以几十份表格,一个下午就会消失在人类特别不擅长的那种重复性工作中:清晰的字符识别。
错误并非随机。它们是每个人都会犯的相同几类错误:
- 社会安全号转置 - 翻转 9 位数字中的两个相邻数字
- 12 号框代码 - 忽略 D 代码(401(k))和 DD 代码(雇主健康保险)之间的区别
- 州工资 - 忘记在两个州工作的员工需要复制两行
- 小数点错位 -
$1,234.56变成$12,345.60 - 14 号框自由文本 - 手动重新输入不一致的标签,如
STDIS、401K LOAN或PA SUI
这些错误并非总是立即显现。它们会在六周后显现,当时自动导入管道拒绝了 47 条记录中的 4 条,或者 IRS 发送 CP2000 通知,指出收入不匹配。
您需要了解的 2026 年变化
两项监管变化对所有 2026 年表格工作都很重要,这两项变化都源于《一项宏大美丽法案》(OBBBA)。
1099-NEC 和 1099-MISC 门槛提高至 2,000 美元
几十年来,签发 1099-NEC 的门槛一直是 600 美元。从 2026 年开始,该门槛为 2,000 美元。1099-MISC 的门槛也提高到相同的数字。这意味着需要签发的表格更少——但承包商收到的表格也更少,这使得收入核对更加困难。承包商仍需对赚取的每一美元纳税,但他们可能不会收到低于 2,000 美元的工作的 1099 表格。从 2027 年开始,该门槛将根据通货膨胀进行调整。
1099-K 恢复至 20,000 美元 / 200 笔交易
1099-K 的门槛——适用于 PayPal、Venmo、Stripe 和信用卡处理商等支付应用程序——原本要降至 600 美元。《OBBBA》将其恢复到 2022 年之前的水平:20,000 美元的付款和超过 200 笔交易。大多数自由职业者和副业卖家在 2026 年不会收到 1099-K,除非他们同时达到这两个门槛。
2026 年新的 W-2 第 12 号框代码
2026 年的 W-2 增加了三个以前不存在的第 12 号框代码:
- TA - 雇主对特朗普账户(新的税收优惠储蓄工具)的缴款
- TP - 向雇主报告的现金小费总额
- TT - 合格的加班补偿总额
第 14 号框也分为 14a(用于州残疾、工会会费等现有的“其他”字段)和 14b(用于确定新的小费扣除资格的财政部小费职业代码的新字段)。
任何未针对这些更改进行更新的提取工具都会默默地删除新字段。在使用该工具处理 2026 年表格之前,请验证您的工具是否能处理它们。
电子申报要求仍为 10 份表格
IRS 的电子申报门槛仍然是 10 份信息申报表——按所有表格类型汇总。如果您签发了四份 1098 和六份 1099-NEC,则总共是 10 份,您必须进行电子申报。迟交或遗漏 1099 表格的罚款现在为每份表格 60 美元(30 天内更正)、每份表格 130 美元(30 天后但 8 月 1 日之前)、每份表格 340 美元(8 月 1 日之后或未申报),以及故意不遵守规定的每份表格 680 美元,无最高上限。
W-2 表格上实际包含的内容
W-2 表格有六个字母框(a–f)用于识别信息,以及 20 个数字框用于金额。以下是每个框的内容。
身份识别
- a 框: 雇员的社会安全号码
- b 框: 雇主识别号码 (EIN)
- c 框: 雇主名称、地址、邮政编码
- d 框: 控制号码(可选的工资系统参考)
- e–f 框: 雇员姓名和地址
工资和税款
| 框 | 字段 | 说明 |
|---|---|---|
| 1 | 工资、小费和其他报酬 | 应税联邦金额 - 通常是最重要的数字 |
| 2 | 已扣缴联邦所得税 | 作为抵扣额计入联邦申报表 |
| 3 | 社会安全工资 | 达到年度社保工资基数上限 |
| 4 | 已扣缴社会安全税 | 3 号框的 6.2% |
| 5 | 医疗保险工资和小费 | 无上限 - 通常高于 1 号框 |
| 6 | 已扣缴医疗保险税 | 5 号框的 1.45% 加上 20 万美元以上的 0.9% 额外税款 |
| 7 | 社会安全小费 | 需缴纳社保税的已报告小费 |
| 8 | 分配的小费 | 雇主分配的小费 |
| 9 | (保留) | 目前未使用 |
| 10 | 受抚养人护理福利 | DCAP / FSA 缴款 |
| 11 | 非合格计划 | 来自 457(b) 或其他 NQ 计划的分配 |
12 号框 - 大量代码
12 号框有四个子字段(12a、12b、12c、12d)和超过 30 种可能的代码。最常见的:
- D - 401(k) 选择性递延缴款
- E - 403(b) 选择性递延缴款
- DD - 雇主赞助的医疗保险费用(仅供参考)
- W - HSA 缴款(雇主 + 雇员)
- C - 超过 5 万美元的团体定期寿险
- AA - Roth 401(k) 缴款
- BB - Roth 403(b) 缴款
- EE - Roth 457(b) 缴款
- TA (2026 年新增) - 特朗普账户缴款
- TP (2026 年新增) - 已报告的现金小费
- TT (2026 年新增) - 合格的加班补偿
每个代码旁边都有一个数字。提取工具需要同时读取两者——D 8400.00 与 DD 8400.00 的区别很大。
13–14 号框 - 复选框和自由文本
- 13 号框: 三个复选框 - 法定雇员、退休计划、第三方病假工资
- 14a 框: “其他” - 州残疾税、工会会费、慈善捐款、停车费等。
- 14b 框 (2026 年新增):财政部小费职业代码 (TTOC),用于确定小费扣除资格
14a 号框是自由领域。雇主可以在此处放置任何他们想要的内容,没有标准格式。STDIS 234.50 和 STATE DISABILITY 234.50 含义相同——您的提取工具需要同时处理它们。
15–20 号框 - 州和地方
这六个框各有两行,支持在多个州或地方工作的雇员:
- 15 号框: 州和雇主所在州的 ID 号码
- 16 号框: 州工资
- 17 号框: 州所得税
- 18 号框: 地方工资
- 19 号框: 地方所得税
- 20 号框: 地方名称
多州雇员会造成最多的提取错误——两行都需要单独捕获,并且州代码(PA、NJ、NY)需要附加到正确的金额上。
1099 表格上实际包含的内容
到 2026 年,1099 系列有 21 种变体。大多数工作流程会接触到其中一小部分:
| 表格 | 报告内容 | 常见发送方 |
|---|---|---|
| 1099-NEC | 非雇员报酬 | 支付承包商的客户 |
| 1099-MISC | 租金、奖金、特许权使用费、和解金 | 房东、律师、零工平台 |
| 1099-K | 支付应用程序和信用卡处理商收入 | PayPal、Stripe、Venmo、Square |
| 1099-INT | 利息收入 | 银行、信用合作社 |
| 1099-DIV | 股息和资本利得分配 | 券商、共同基金 |
| 1099-B | 券商交易(证券销售) | 券商 |
| 1099-R | 退休和养老金分配 | 401(k) 管理人、IRA 受托人 |
| 1099-G | 政府付款(失业、退税) | 州机构 |
| 1099-S | 房地产销售 | 产权公司 |
1099-NEC 最简单——付款人信息、收款人信息、1 号框(非雇员报酬)、4 号框(已扣缴联邦税)、州税字段。1099-DIV 和 1099-B 最复杂,有许多合格/普通类别和跨越多页的成本基础详细信息。
两种工作流程:提取和填写
税务表格工作分为两种不同的工作流程。大多数文章只涵盖其中一种。现实情况是,任何经常处理税务表格的人都需要两者。
工作流程 1:从收到的表格中提取数据
您处于接收方。承包商发送了 W-9。雇员为税务准备客户提供了三份 W-2。抵押贷款申请人上传了他们的 2024 年和 2025 年 W-2 以及四份工资单。您需要将数据输入电子表格、会计软件或承保系统中。
手动方法: 打开 PDF,读取每个框,然后键入到目标位置。每份表格 5-15 分钟。初次检查后准确率约为 95%。第二次检查后约为 99%。
AI 方法: 上传 PDF。AI 读取文档,通过上下文(而非模板位置)识别字段,并返回结构化数据。每份表格 2-5 秒。数字 PDF 准确率 96-99%,照片或扫描表格准确率 88-95%。
PDFSub 的提取数据工具可以处理此问题——将其指向任何税务表格 PDF,它将返回带有每个字段标签的干净 JSON 或 CSV。AI 知道“工资、小费和其他报酬”后面的数字会进入 box_1_wages 字段,无论它在页面上的位置如何。
工作流程 2:填写空白税务表格
您处于签发方。您是一位需要向四位承包商签发 1099-NEC 的小企业主。您是一位人力资源协调员,正在给新员工一份空白的 W-4 表格供其在线填写。您是一位会计师,正在为合伙企业的投资者准备 K-1。
手动方法: 打印、书写、扫描、邮寄。或者与 Adobe Acrobat 的表单字段搏斗。或者为少量表格购买专门的 1099 软件,每年花费 80-300 美元。
PDF 方法: 在识别表单字段的工具中打开 IRS 的可填写 PDF,键入数据,保存,然后进行电子交付或打印。PDFSub 的PDF 表格填充器会自动检测现有的 AcroForm 字段——它适用于 IRS W-9、W-4、W-2、1099 模板以及大多数税务软件导出。
对于不可填写的 PDF(或需要添加标准字段之外信息的税务表格),编辑 PDF 工具允许您在不破坏底层文档的情况下在页面上的任何位置放置文本、签名和形状。
组合工作流程:
- 从 irs.gov 下载官方 IRS PDF
- 在PDF 表格填充器中打开 - 字段自动检测
- 填写付款人/收款人信息、金额、代码
- 使用电子签名签名
- 使用编辑 PDF工具在发送给收款人的副本之前,通过绘制红色框来编辑社会安全号码/EIN
- 为您的记录保存副本
(关于签发 1099 的说明:如果您签发 10 份或更多信息申报表(所有类型合计),IRS 要求进行电子申报。PDF 方法适用于纸质申报和收款人副本,但 IRS 的提交本身通过 SSA 的 BSO 门户或第三方电子申报服务进行。PDFSub 处理文档方面,IRS 处理传输方面。)

准确性:实际预期
在某些方面,税务表格比发票更容易进行 AI 提取,而在其他方面则更难。
更容易:
- 标准布局(IRS 表格结构固定)
- 预印标签(AI 可以锁定已知字段名称)
- 固定值类型(数字金额、日期、EIN/SSN 模式)
更难:
- 12 号框有四个子字段和代码 - 容易将代码和金额配错
- 14 号框是自由文本,没有标准
- 州框 15-20 有两行,这会混淆基于模板的工具
- 照片表格(手机快照)会引入眩光、透视变形和反射
实际准确性范围:
| 来源 | 头部字段 | 数字框 | 12 号框代码 | 14 号框 |
|---|---|---|---|---|
| 数字 PDF(IRS 官方) | 99%+ | 98–99% | 96–98% | 92–95% |
| 数字 PDF(工资系统导出) | 98–99% | 97–99% | 95–97% | 90–94% |
| 扫描件(300+ DPI) | 96–98% | 94–97% | 90–94% | 85–90% |
| 手机照片 | 90–95% | 88–93% | 82–88% | 75–82% |
对于高风险用例(抵押贷款承保、税务申报、审计响应),请务必将 1 号框、2 号框和 SSN 与原始 PDF 进行交叉核对。其余 1-2% 的错误率很重要,因为错误的数字可能导致贷款被拒或收到 CP2000 通知。
隐私:SSN 是 PII
每份 W-2 和 1099 都包含社会安全号码。SSN 是任何提取工作流程中风险最高的 PII——泄露直接导致身份盗窃,并且许多州要求在任何 SSN 暴露后 30 天内进行违规通知。
这使得“数据去向何处?”成为询问任何提取工具时最重要的问题。
风险模式:
- 仅限云的工具会将您的 PDF 上传到其服务器,运行提取,并可能保留文件以进行“模型改进”——请仔细阅读隐私政策。
- 基于浏览器的工具,如果声称是“客户端”,仍应进行验证——打开开发者工具并检查文件是否确实离开了您的浏览器。
- 第三方 API(Google Document AI、AWS Textract、Azure)在服务器端处理文档,但通常不保留它们;请检查 SLA。
PDFSub 对税务表格的特定方法:
- 对于包含嵌入文本的数字 PDF,文本在您的浏览器客户端进行提取,只有结构化文本(而非文件)会被发送到 AI 进行标记。
- 对于扫描表格或手机照片,文件被发送到服务器端,在隔离环境中处理,并自动删除。
- 对于共享提取的表格(例如,发送给税务 preparer),编辑工具会在 SSN 数字上绘制一个标有“REDACTED”的不透明黑色矩形。对于必须清除底层内容流(而不仅仅是视觉覆盖)的最高安全性工作流程,请使用专用的编辑工具,该工具执行完整的内容流删除,直到 PDFSub 的永久删除功能上线。
如果您为客户处理税务表格(会计师、簿记员、贷方),这一点更为重要——您对 SSN 泄露的责任不是理论上的。
分步操作:使用 PDFSub 提取税务表格数据
工作流程:
- 转到提取数据工具 或在 Studio 仪表板中打开它。
- 上传您的税务表格 - 拖放,或单击浏览。支持高达 20MB;处理 W-2、1099 系列、K-1、1098、W-9 和工资单。
- 单击“提取数据” - AI 分析表格,自动识别表格类型,并提取每个带标签的字段。
- 查看输出 - 每个字段都有标签(例如,
box_1_wages、box_12a_code、box_12a_amount)。 - 导出 - 下载为 JSON 以进行系统集成,CSV 以用于电子表格,或直接将字段复制到您的税务软件中。
对于批量处理(例如,为客户税务准备处理 47 份 1099),请在单次会话中上传多个文件——每个表格独立处理。
专业提示: 如果您的税务表格是手机照片,请先将其通过清理扫描 PDF 处理。倾斜校正和对比度标准化通常会将准确率从 88% 提高到 95% 以上。
分步操作:使用 PDFSub 填写空白税务表格
对于签发方工作流程:
- 从irs.gov/forms下载官方 IRS PDF。大多数 IRS 表格都是 AcroForm 可填写的。
- 打开PDF 表格填充器 并上传 IRS PDF。
- 字段自动检测 - 每个文本框、复选框和签名字段都会出现一个标签。
- 键入您的数据 - 付款人姓名、EIN、收款人信息、金额、代码。
- 对于不可填写的区域(IRS 表格很少见,但对于旧 PDF 或税务软件导出很常见),请使用编辑 PDF 在任何位置放置文本。
- 使用电子签名签名 - 将您的签名拖到签名框中。
- 保存 PDF - 您填写的版本已准备好打印、电子交付或附加到电子邮件中。
对于需要收款人副本的 1099 表格,请在副本 B 上运行编辑 PDF 来屏蔽收款人的完整社会安全号码 - 大多数签发方在发送收款人副本之前会屏蔽除最后四位数字之外的所有内容。
常见税务表格用例
相同的提取 + 填写工作流程出现在不同的上下文中:
抵押贷款和贷款申请
贷方需要两年的 W-2、最近的工资单以及 1-2 年的纳税申报表。AI 提取使贷款处理员能够在 30 秒内验证收入,而不是 30 分钟。收入计算将 1 号框(W-2)与附表 C 的净利润(1040)以及 7 号框(最后一份工资单)进行交叉核对。
税务准备
对于延期报税的会计师(10 月 15 日的截止日期临近),每一分钟都很重要。典型的个人申报表涉及 4-8 份 W-2/1099 以及 K-1。在 30 秒内提取它们而不是 30 分钟,是计费小时数和加班费的区别。
IRS 审计响应
当 IRS 发送 CP2000 通知要求报告未申报收入时,响应需要重新检查收到的每份 1099。提取加速了与银行存款的核对 - 将此与银行对账单转换器结合使用,以匹配 1099 收入与实际存款。
簿记对账
对于 1099-NEC 的签发方(大多数支付承包商的小企业),年底需要核对已签发的 1099 与承包商实际收到的 1099。提取使交叉检查自动化。
入职套餐
人力资源团队使用PDF 表格填充器向新员工发送预填的 W-4、I-9 和直接存款授权表格。新员工填写剩余字段并返回签名的 PDF - 无需打印。
保险承保
人寿保险和残疾保险承保人会审查税务表格以验证收入。AI 提取将每位申请人的处理时间缩短了 60-80%。
最佳实践
一些习惯可以显著改善结果:
尽可能使用原始 PDF,而非照片
每个雇主和券商都可以在其门户网站上提供 PDF 下载。官方 PDF 包含嵌入文本 - 提取效果完美。打印的 W-2 的手机照片没有嵌入文本,需要先进行 OCR,并导致准确率下降 5-10%。务必索要 PDF。
首次使用时验证 SSN、EIN 和 1 号框
从新工资系统或券商处理的第一份表格,请目视检查三个字段:SSN、EIN 和最大的金额。如果这三个字段正确,其余的通常也会正确。如果其中任何一个不正确,则表格布局存在值得调查的异常。
标准化输出格式
选择 CSV 用于电子表格,JSON 用于 API。不要在批次中间切换 - 后续解析器会因格式更改而中断。提取数据工具允许您一次设置输出格式,并将其应用于会话中的每个表格。
分享前进行编辑
在将提取的数据或 PDF 电子邮件发送给组织外部的任何人之前,请在 SSN/EIN 上运行编辑 PDF。PDFSub 的编辑会在内容上绘制一个标有“REDACTED”的不透明黑色矩形。对于处理大量 PII 或用于受监管工作流程的用户,应注意视觉编辑不会从底层 PDF 内容流中删除文本——对于这种级别的安全性(其中文本提取工具无法恢复编辑后的内容),请使用专用的编辑工具,该工具执行完整的内容流删除,直到 PDFSub 的永久删除功能上线。
保留提取表格的审计日志
对于会计和贷款,请保留记录:文件名、提取日期、提取者、下游使用的字段。如果 IRS 或审计员质疑某个数字,您可以显示源 PDF 和提取输出。
不要跳过 2026 年的新框
如果您使用的是旧的提取工具,请验证它们是否能处理 12 号框代码 TA、TP、TT 和 14b 框。默默删除这些字段的工具将产生技术上干净的导出,但缺少法律要求的数据。
超越 W-2 和 1099
相同的 AI 提取还可以处理相关的税务表格:
- Schedule K-1 - 合伙企业、S 型公司和信托的收入(迄今为止最复杂的税务表格 - 30 多个字段)
- 工资单 - 当前发薪期、年初至今总额、扣除额、年初至今明细
- Form 1098 - 抵押贷款利息、学生贷款利息、学费支付
- Form W-9 - 付款人信息收集(提取并导入 AP 系统)
- Form W-4 - 代扣代缴额(提取用于工资系统录入)
- Form 1040 / Schedule C - 全套纳税申报表(提取贷款申请的收入行)
对于更广泛的财务文档工作流程,银行对账单转换器、收据扫描仪和发票提取器涵盖了财务文档的其余部分——所有这些都包含在同一订阅中。
常问问题 (FAQ)
W-2 表格的 1 号框和 5 号框有什么区别?
1 号框是联邦应税工资 - 它不包括税前扣除额,如 401(k) 缴款和 FSA 缴款。5 号框是医疗保险工资 - 它包括这些扣除额,并且没有上限。大多数 W-2 阅读器首先检查 1 号框,因为它会填入 1040 表格,但 5 号框是社会安全和医疗保险计算的正确数字。
AI 提取能读取 W-2 的手机照片吗?
是的,但准确率会下降到 88-95%,具体取决于光线和对焦。为获得最佳效果,请使用雇主或工资提供商提供的官方 PDF。如果您只有照片,请先将其通过清理扫描 PDF 处理以进行倾斜校正和对比度增强。
PDFSub 能处理多州 W-2 表格吗?
是的。该工具会读取 15-20 号框的两行,将州代码附加到正确的工资和税款金额,并在输出中将每个州的税款数据作为单独的对象返回。
我能用 PDFSub 填写 IRS 1099-NEC 表格吗?
是的 - 在PDF 表格填充器中打开官方 IRS 1099-NEC PDF。字段会自动检测。输入付款人信息、收款人信息和金额。保存并打印以进行纸质申报,或使用保存的 PDF 获取收款人副本。(对于 IRS 提交,如果您总共签发 10 份或更多信息申报表,您需要通过 SSA 的 BSO 门户或第三方传输器进行电子申报。)
税务表格数据提取后会怎样?
对于包含嵌入文本的数字 PDF,提取在客户端进行 - 文件永远不会离开您的浏览器。AI 只接收提取的文本(不含文件)。对于扫描表格或照片,文件被发送到服务器端,在隔离环境中处理,并自动删除。PDFSub 在处理后不会保留税务表格文件。
AI 提取如何正确处理 12 号框代码?
AI 将四个子字段(12a、12b、12c、12d)中的每一个读取为代码+金额对。因此,W-2 表格在 12a 框中为 D 8400.00,在 12b 框中为 DD 14200.00,会返回两个不同的行,每个行都有正确的代码-金额映射。基于模板的工具通常会因读取位置而非关系而将它们配错。
K-1 表格呢?它们因合伙企业而异。
K-1 表格因实体类型(合伙企业、S 型公司、信托)和合伙企业特定的分配而异,但框布局在每种变体中都是标准化的。AI 提取可以处理所有三种 K-1 类型(Form 1065、1120-S、1041)。对于具有非标准补充附表的合伙企业,预计主要 K-1 的准确率为 90-95%,但需要手动审查补充项目。
我可以提取往年税务表格的数据吗?
是的。IRS 每年都会修订表格,但 AI 是基于多年布局训练的。2018 年及以后的 W-2 和 1099 表格可以可靠地提取。对于包含已停用框的 2018 年之前的表格(例如,2020 年起被 1099-NEC 取代的旧 1099-MISC 第 7 框),AI 可以正确处理旧布局。
新的 1099 报告门槛 2,000 美元是否适用于所有州?
从 2026 年开始,联邦门槛为 2,000 美元,但几个州有较低的州级 1099 门槛。即使不需要联邦 1099,加利福尼亚州、马萨诸塞州等州可能仍要求在 600 美元时进行 1099 报告。在仅依赖联邦门槛之前,请查阅您所在州税务机关的指南。
为少量承包商签发 1099 的最便宜方法是什么?
如果您总共签发的信息申报表少于 10 份,IRS 允许纸质申报。下载 IRS 1099-NEC PDF,使用PDF 表格填充器填写,在 IRS 或办公用品商店购买的红色墨水可扫描纸张上打印副本 A,然后邮寄给 IRS。这可以避免为低批量签发者支付 1099 电子申报服务的费用。
入门
如果您正在处理税务表格——无论是从收到的表格中提取数据还是填写空白表格——计算都很简单。每份表格 5 分钟,处理 50 份表格需要约 4 小时。AI 提取总共只需 2 分钟即可完成,且准确率更高。
试用 PDFSub 的提取数据工具 - 开始 7 天免费试用,完全访问所有 PDF 工具。上传 W-2 或 1099,查看结构化输出,并在承诺付费计划之前确定准确性是否符合您的工作流程。
今年需要签发 1099 表格?PDF 表格填充器可以处理 IRS PDF,无需专门的税务准备软件。
税务表格不会消失。好消息是:2026 年是您不必再手动键入它们的第一个年份。