Cara Mengekstrak Data dari Formulir Pajak W-2 dan 1099 dengan AI (Panduan 2026)
Ekstraksi AI membaca W-2, 1099, K-1, dan slip gaji dalam hitungan detik — tanpa template, tanpa mengetik. Ditambah cara mengisi formulir pajak IRS kosong dengan PDF Form Filler. Diperbarui untuk ambang batas 2026 dan kode W-2 baru.

April sudah lewat, tetapi formulir pajak belum selesai. Seorang pembukuan masih harus menerbitkan 1099-NEC untuk pekerjaan tahun sebelumnya yang dilupakan klien. Seorang petugas pinjaman menatap empat W-2 dan tiga slip gaji dari pemohon hipotek. Seorang akuntan yang mengajukan perpanjangan sedang merekonsiliasi 47 K-1 untuk pengajuan klien pada 15 Oktober. Seorang pemilik usaha kecil baru saja menyadari bahwa mereka perlu mengirimkan 1099 yang diamandemen kepada kontraktor yang mereka lewatkan.
Formulir pajak bukanlah masalah Januari — ini adalah masalah sepanjang tahun. Dan hampir setiap alur kerja yang menyentuhnya dimulai dengan cara yang sama: seseorang harus membaca setiap kotak pada PDF dan mengetik nilainya ke dalam spreadsheet, perangkat lunak akuntansi, atau formulir lain.
Panduan ini membahas cara ekstraksi AI membaca data formulir pajak secara otomatis, cara mengisi formulir pajak kosong (W-9, W-4, template 1099) tanpa mencetaknya, dan apa yang telah berubah untuk tahun pengajuan 2026 yang perlu Anda ketahui.
Mengapa Entri Data Formulir Pajak Begitu Menyebalkan
Satu W-2 memiliki 25+ titik data di 20 kotak. 1099-NEC memiliki 8. K-1 bisa memiliki 30+ tergantung kemitraan. Kalikan itu dengan beberapa lusin formulir dan sore hari menghilang ke dalam jenis pekerjaan berulang yang secara unik buruk bagi manusia: pengenalan karakter yang bersih.
Kesalahan tidak acak. Ini adalah segelintir kesalahan yang sama yang dibuat semua orang:
- Pertukaran SSN — membalik dua digit yang berdekatan dalam angka 9 digit
- Kode Kotak 12 — melewatkan perbedaan antara Kode D (401(k)) dan Kode DD (cakupan kesehatan pemberi kerja)
- Gaji negara bagian — melupakan bahwa karyawan yang bekerja di dua negara bagian memerlukan kedua baris disalin
- Ketidaksejajaran desimal —
$1,234.56menjadi$12,345.60 - Teks bebas Kotak 14 — mengetik ulang label yang tidak konsisten seperti
STDIS,401K LOAN, atauPA SUI
Kesalahan ini tidak selalu muncul segera. Mereka muncul enam minggu kemudian ketika saluran impor otomatis menolak 4 dari 47 catatan, atau ketika IRS mengirimkan pemberitahuan CP2000 yang menandai pendapatan yang tidak cocok.
Perubahan 2026 yang Perlu Anda Ketahui
Dua pergeseran peraturan penting untuk pekerjaan formulir 2026, keduanya berasal dari Undang-Undang Satu Undang-Undang Besar yang Indah (OBBBA).
Ambang Batas 1099-NEC dan 1099-MISC Naik Menjadi $2.000
Selama beberapa dekade, ambang batas untuk menerbitkan 1099-NEC adalah $600. Mulai tahun 2026, jumlahnya adalah $2.000. Ambang batas 1099-MISC naik ke jumlah yang sama. Ini berarti lebih sedikit formulir untuk diterbitkan — tetapi juga lebih sedikit formulir yang diterima oleh kontraktor, yang membuat rekonsiliasi pendapatan lebih sulit. Kontraktor masih berutang pajak atas setiap dolar yang diperoleh, tetapi mereka mungkin tidak mendapatkan 1099 untuk pekerjaan di bawah $2.000. Ambang batas akan disesuaikan dengan inflasi mulai tahun 2027.
1099-K Kembali ke $20.000 / 200 Transaksi
Ambang batas 1099-K — untuk aplikasi pembayaran seperti PayPal, Venmo, Stripe, dan pemroses kartu kredit — seharusnya turun menjadi $600. OBBBA mengembalikannya ke tingkat sebelum 2022: $20.000 dalam pembayaran DAN lebih dari 200 transaksi. Sebagian besar pekerja lepas dan penjual sampingan tidak akan menerima 1099-K pada tahun 2026 kecuali mereka mencapai kedua ambang batas.
Kode Kotak W-2 Baru untuk 2026
W-2 tahun 2026 menambahkan tiga kode Kotak 12 yang sebelumnya tidak ada:
- TA — Kontribusi pemberi kerja ke rekening Trump (kendaraan tabungan yang menguntungkan pajak baru)
- TP — Total tip tunai yang dilaporkan kepada pemberi kerja
- TT — Total kompensasi lembur yang memenuhi syarat
Kotak 14 juga dibagi menjadi 14a (bidang "Lainnya" yang ada untuk pajak disabilitas negara bagian, iuran serikat pekerja, dll.) dan 14b (bidang baru untuk Kode Pekerjaan Tipped Departemen Keuangan, yang digunakan untuk menentukan kelayakan untuk pengurangan tip baru).
Alat ekstraksi apa pun yang belum diperbarui untuk perubahan ini akan secara diam-diam menghilangkan bidang baru. Verifikasi alat Anda menanganinya sebelum menggunakannya pada formulir 2026.
Persyaratan E-File Tetap 10 Formulir
Ambang batas e-filing IRS tetap 10 pengembalian informasi — diagregasi di semua jenis formulir. Jika Anda menerbitkan empat 1098 dan enam 1099-NEC, itu total 10, dan Anda harus mengajukan e-file. Denda untuk 1099 yang terlambat atau hilang sekarang berjalan $60 per formulir (diperbaiki dalam waktu 30 hari), $130 per formulir (setelah 30 hari tetapi sebelum 1 Agustus), $340 per formulir (setelah 1 Agustus atau tidak diajukan), dan $680 per formulir untuk kelalaian yang disengaja tanpa batas maksimum.
Apa Sebenarnya yang Ada di W-2
W-2 memiliki enam kotak berhuruf (a–f) untuk identifikasi dan 20 kotak bernomor untuk jumlah. Berikut adalah isi masing-masing.
Identifikasi
- Kotak a: Nomor Jaminan Sosial Karyawan
- Kotak b: Nomor Identifikasi Pemberi Kerja (EIN)
- Kotak c: Nama, alamat, ZIP Pemberi Kerja
- Kotak d: Nomor kontrol (referensi sistem penggajian opsional)
- Kotak e–f: Nama dan alamat Karyawan
Gaji dan Pajak
| Kotak | Bidang | Catatan |
|---|---|---|
| 1 | Gaji, tip, kompensasi lainnya | Jumlah kena pajak federal — biasanya angka terpenting |
| 2 | Pajak penghasilan federal yang dipotong | Masuk ke pengembalian federal sebagai kredit |
| 3 | Gaji Jaminan Sosial | Dibatasi pada basis gaji SS tahunan |
| 4 | Pajak Jaminan Sosial yang dipotong | 6,2% dari Kotak 3 |
| 5 | Gaji dan tip Medicare | Tidak ada batasan — biasanya lebih tinggi dari Kotak 1 |
| 6 | Pajak Medicare yang dipotong | 1,45% dari Kotak 5 ditambah 0,9% tambahan di atas $200K |
| 7 | Tip Jaminan Sosial | Tip yang dilaporkan dikenai pajak SS |
| 8 | Tip yang dialokasikan | Tip yang ditugaskan oleh pemberi kerja |
| 9 | (Dicadangkan) | Saat ini tidak digunakan |
| 10 | Tunjangan penitipan anak | Kontribusi DCAP / FSA |
| 11 | Rencana non-kualifikasi | Distribusi dari 457(b) atau rencana NQ lainnya |
Kotak 12 — Banyak Kode
Kotak 12 memiliki empat sub-bidang (12a, 12b, 12c, 12d) dan lebih dari 30 kode yang mungkin. Yang paling umum:
- D — Pengurangan sukarela 401(k)
- E — Pengurangan sukarela 403(b)
- DD — Biaya cakupan kesehatan yang disponsori pemberi kerja (hanya informasi)
- W — Kontribusi HSA (pemberi kerja + karyawan)
- C — Asuransi jiwa kelompok di atas $50K
- AA — Kontribusi Roth 401(k)
- BB — Kontribusi Roth 403(b)
- EE — Kontribusi Roth 457(b)
- TA (baru 2026) — Kontribusi rekening Trump
- TP (baru 2026) — Tip tunai yang dilaporkan
- TT (baru 2026) — Kompensasi lembur yang memenuhi syarat
Setiap kode memiliki angka di sebelahnya. Alat ekstraksi perlu membaca keduanya — D 8400.00 sangat berbeda dari DD 8400.00.
Kotak 13–14 — Kotak Centang dan Teks Bebas
- Kotak 13: Tiga kotak centang — karyawan yang diatur, rencana pensiun, pembayaran sakit pihak ketiga
- Kotak 14a: "Lainnya" — pajak disabilitas negara bagian, iuran serikat pekerja, kontribusi amal, parkir, dll.
- Kotak 14b (baru 2026): Kode Pekerjaan Tipped Departemen Keuangan (TTOC) untuk kelayakan pengurangan tip
Kotak 14a adalah dunia liar. Pemberi kerja menempatkan apa pun yang mereka inginkan di sini, tanpa format standar. STDIS 234.50 dan STATE DISABILITY 234.50 berarti hal yang sama — alat ekstraksi Anda perlu menangani keduanya.
Kotak 15–20 — Negara Bagian dan Lokal
Keenam kotak ini memiliki dua baris masing-masing, mendukung karyawan yang bekerja di beberapa negara bagian atau lokalitas:
- Kotak 15: Negara bagian dan nomor ID negara bagian pemberi kerja
- Kotak 16: Gaji negara bagian
- Kotak 17: Pajak penghasilan negara bagian
- Kotak 18: Gaji lokal
- Kotak 19: Pajak penghasilan lokal
- Kotak 20: Nama lokalitas
Karyawan multi-negara bagian menciptakan kesalahan ekstraksi paling banyak — kedua baris harus ditangkap secara terpisah, dan kode negara bagian (PA, NJ, NY) harus dilampirkan ke jumlah yang benar.
Apa Sebenarnya yang Ada di 1099
Keluarga 1099 memiliki 21 varian pada tahun 2026. Sebagian besar alur kerja menyentuh sebagian kecil:
| Formulir | Apa yang Dilaporkan | Pengirim Umum |
|---|---|---|
| 1099-NEC | Kompensasi non-karyawan | Klien membayar kontraktor |
| 1099-MISC | Sewa, hadiah, royalti, penyelesaian | Pemilik properti, pengacara, platform gig |
| 1099-K | Pendapatan aplikasi pembayaran dan pemroses kartu kredit | PayPal, Stripe, Venmo, Square |
| 1099-INT | Pendapatan bunga | Bank, serikat kredit |
| 1099-DIV | Dividen dan distribusi keuntungan modal | Pialang, reksa dana |
| 1099-B | Transaksi pialang (penjualan sekuritas) | Pialang |
| 1099-R | Distribusi pensiun dan pensiun | Administrator 401(k), kustodian IRA |
| 1099-G | Pembayaran pemerintah (pengangguran, pengembalian dana) | Badan negara bagian |
| 1099-S | Penjualan real estat | Perusahaan judul |
1099-NEC adalah yang paling sederhana — info pembayar, info penerima, Kotak 1 (kompensasi non-karyawan), Kotak 4 (pajak federal yang dipotong), bidang pajak negara bagian. 1099-DIV dan 1099-B adalah yang paling kompleks, dengan banyak kategori yang memenuhi syarat/biasa dan detail basis biaya yang mencakup beberapa halaman.
Dua Alur Kerja: Mengekstrak dan Mengisi
Pekerjaan formulir pajak terbagi menjadi dua alur kerja yang berbeda. Sebagian besar artikel hanya mencakup satu. Kenyataannya adalah siapa pun yang berurusan dengan formulir pajak secara teratur membutuhkan keduanya.
Alur Kerja 1: Ekstrak Data dari Formulir yang Diterima
Anda berada di sisi penerima. Seorang kontraktor mengirimkan W-9. Seorang karyawan menyerahkan tiga W-2 untuk klien persiapan pajak. Seorang pemohon hipotek mengunggah W-2 tahun 2024 dan 2025 mereka ditambah empat slip gaji. Anda membutuhkan data dalam spreadsheet, di perangkat lunak akuntansi Anda, atau dalam sistem underwriting.
Pendekatan manual: buka PDF, baca setiap kotak, ketik ke tujuan. 5–15 menit per formulir. Akurasi ~95% setelah percobaan pertama. ~99% setelah percobaan kedua.
Pendekatan AI: unggah PDF. AI membaca dokumen, mengidentifikasi bidang berdasarkan konteks (bukan berdasarkan posisi template), dan mengembalikan data terstruktur. 2–5 detik per formulir. Akurasi 96–99% pada PDF digital, 88–95% pada formulir yang difoto atau dipindai.
Alat Ekstrak Data PDFSub menangani ini — arahkan ke PDF formulir pajak apa pun dan alat ini mengembalikan JSON atau CSV bersih dengan setiap bidang diberi label. AI tahu bahwa angka setelah "Gaji, tip, kompensasi lainnya" masuk ke bidang box_1_wages, terlepas dari posisinya di halaman.
Alur Kerja 2: Isi Formulir Pajak Kosong
Anda berada di sisi penerbit. Anda adalah pemilik usaha kecil yang perlu mengirimkan 1099-NEC ke empat kontraktor. Anda adalah koordinator HR yang memberikan formulir W-4 kosong kepada karyawan baru untuk diisi secara digital. Anda adalah akuntan yang menyiapkan K-1 untuk investor kemitraan.
Pendekatan manual: cetak, tulis, pindai, kirim. Atau bertarung dengan bidang formulir Adobe Acrobat. Atau beli perangkat lunak 1099 khusus seharga $80–$300/tahun untuk beberapa formulir.
Pendekatan PDF: buka PDF yang dapat diisi IRS di alat yang mengenali bidang formulir, ketik data Anda, simpan, dan kirimkan melalui email atau cetak. PDF Form Filler PDFSub mendeteksi bidang AcroForm yang ada secara otomatis — berfungsi untuk template IRS W-9, W-4, W-2, 1099, dan sebagian besar ekspor perangkat lunak pajak.
Untuk PDF yang tidak dapat diisi (atau untuk formulir pajak di mana Anda perlu menambahkan informasi di luar bidang standar), alat Edit PDF memungkinkan Anda menempatkan teks, tanda tangan, dan bentuk di mana saja di halaman tanpa merusak dokumen yang mendasarinya.
Alur kerja gabungan:
- Tarik PDF IRS resmi dari irs.gov
- Buka di PDF Form Filler — bidang terdeteksi secara otomatis
- Isi info pembayar/penerima, jumlah, kode
- Tandatangani dengan E-Sign
- Redaksi SSN/EIN sebelum mengirim salinan penerima dengan Redact PDF
- Simpan salinan untuk catatan Anda
(Catatan tentang penerbitan 1099: IRS mewajibkan e-filing jika Anda menerbitkan 10 atau lebih pengembalian informasi dari semua jenis gabungan. Pendekatan PDF berfungsi untuk pengajuan kertas dan salinan penerima, tetapi pengiriman IRS itu sendiri melalui portal BSO SSA atau layanan e-file pihak ketiga. PDFSub menangani sisi dokumen; IRS menangani sisi transmisi.)

Akurasi: Apa yang Sebenarnya Diharapkan
Formulir pajak lebih mudah daripada faktur untuk ekstraksi AI dalam beberapa hal dan lebih sulit dalam hal lain.
Lebih mudah:
- Tata letak standar (formulir IRS memiliki struktur tetap)
- Label yang dicetak sebelumnya (AI dapat mengunci nama bidang yang diketahui)
- Jenis nilai tetap (jumlah numerik, tanggal, pola EIN/SSN)
Lebih sulit:
- Kotak 12 memiliki empat sub-bidang dengan kode — mudah salah memasangkan kode dan jumlah
- Kotak 14 adalah teks bebas tanpa standar
- Kotak negara bagian 15–20 memiliki dua baris yang membingungkan alat berbasis template
- Formulir yang difoto (foto ponsel) menimbulkan silau, distorsi perspektif, dan pantulan
Rentang akurasi yang realistis:
| Sumber | Bidang Header | Kotak Numerik | Kode Kotak 12 | Kotak 14 |
|---|---|---|---|---|
| PDF Digital (resmi IRS) | 99%+ | 98–99% | 96–98% | 92–95% |
| PDF Digital (ekspor sistem penggajian) | 98–99% | 97–99% | 95–97% | 90–94% |
| Dipindai (300+ DPI) | 96–98% | 94–97% | 90–94% | 85–90% |
| Foto ponsel | 90–95% | 88–93% | 82–88% | 75–82% |
Untuk kasus penggunaan berisiko tinggi (underwriting hipotek, pengajuan pajak, tanggapan audit), selalu periksa kembali Kotak 1, Kotak 2, dan SSN terhadap PDF asli. Sisa tingkat kesalahan 1–2% penting ketika digit yang salah berarti pinjaman ditolak atau pemberitahuan CP2000.
Privasi: SSN adalah PII
Setiap W-2 dan 1099 berisi Nomor Jaminan Sosial. SSN adalah PII berisiko tertinggi dalam alur kerja ekstraksi apa pun — kebocoran secara langsung menyebabkan pencurian identitas, dan banyak negara bagian mewajibkan pemberitahuan pelanggaran dalam waktu 30 hari untuk setiap paparan SSN.
Ini menjadikan "ke mana data pergi?" pertanyaan terpenting untuk ditanyakan pada alat ekstraksi apa pun.
Pola risiko:
- Alat khusus cloud mengunggah PDF Anda ke server mereka, menjalankan ekstraksi, dan dapat menyimpan file untuk "peningkatan model" — baca kebijakan privasi dengan cermat
- Alat berbasis browser yang mengatakan "sisi klien" tetap harus diverifikasi — buka DevTools dan periksa apakah file benar-benar meninggalkan browser Anda
- API pihak ketiga (Google Document AI, AWS Textract, Azure) memproses dokumen di sisi server tetapi biasanya tidak menyimpannya; periksa SLA
Pendekatan PDFSub khusus untuk formulir pajak:
- Untuk PDF digital dengan teks tertanam, teks diekstrak di sisi klien di browser Anda dan hanya teks terstruktur (bukan file) yang dikirim ke AI untuk pelabelan
- Untuk formulir yang dipindai atau foto ponsel, file dikirim ke sisi server, diproses secara terisolasi, dan dihapus secara otomatis
- Untuk berbagi formulir yang diekstrak (misalnya, mengirim ke penyiap pajak), alat Redact menggambar persegi panjang hitam buram berlabel DITUTUP di atas digit SSN. Untuk alur kerja keamanan tertinggi di mana aliran konten yang mendasarinya harus dihapus (tidak hanya ditutupi secara visual), gunakan alat redaksi khusus yang melakukan penghapusan aliran konten penuh sampai fitur penghapusan permanen PDFSub dirilis
Jika Anda menangani formulir pajak untuk klien (akuntan, pembukuan, pemberi pinjaman), ini lebih penting — kewajiban Anda untuk kebocoran SSN bukanlah teori.
Langkah demi Langkah: Mengekstrak Data Formulir Pajak dengan PDFSub
Alur kerjanya:
- Buka alat Ekstrak Data atau buka di dasbor Studio
- Unggah formulir pajak Anda — seret dan lepas, atau klik untuk menelusuri. Mendukung hingga 20MB; menangani W-2, keluarga 1099, K-1, 1098, W-9, dan slip gaji
- Klik "Ekstrak Data" — AI menganalisis formulir, mengidentifikasi jenis formulir secara otomatis, dan menarik setiap bidang yang diberi label
- Tinjau outputnya — setiap bidang diberi label (misalnya,
box_1_wages,box_12a_code,box_12a_amount) - Ekspor — unduh sebagai JSON untuk integrasi sistem, CSV untuk spreadsheet, atau salin bidang langsung ke perangkat lunak pajak Anda
Untuk pemrosesan batch (misalnya, 47 1099 untuk persiapan pajak klien), unggah beberapa file dalam satu sesi — setiap formulir diproses secara independen.
Tips pro: Jika formulir pajak Anda adalah foto ponsel, jalankan melalui Bersihkan PDF Pindai terlebih dahulu. Normalisasi kemiringan dan kontras biasanya mendorong akurasi dari 88% menjadi 95%+.
Langkah demi Langkah: Mengisi Formulir Pajak Kosong dengan PDFSub
Untuk alur kerja sisi penerbit:
- Unduh PDF IRS resmi dari irs.gov/forms. Sebagian besar formulir IRS dapat diisi dengan AcroForm
- Buka PDF Form Filler dan unggah PDF IRS
- Bidang terdeteksi secara otomatis — setiap kotak teks, kotak centang, dan bidang tanda tangan muncul dengan label
- Ketik data Anda — nama pembayar, EIN, info penerima, jumlah, kode
- Untuk tempat yang tidak dapat diisi (jarang untuk formulir IRS tetapi umum untuk PDF lama atau ekspor perangkat lunak pajak), gunakan Edit PDF untuk menempatkan teks di mana saja
- Tandatangani dengan E-Sign — seret tanda tangan Anda ke kotak tanda tangan
- Simpan PDF — versi terisi Anda siap untuk dicetak, dikirim melalui email, atau dilampirkan ke email
Untuk 1099 yang memerlukan salinan penerima, jalankan Redact PDF pada Salinan B untuk menutupi SSN lengkap penerima — sebagian besar penerbit menutupi semua kecuali empat digit terakhir sebelum mengirimkan salinan kepada penerima.
Kasus Penggunaan Umum Formulir Pajak
Alur kerja ekstraksi + pengisian yang sama muncul dalam konteks yang berbeda:
Aplikasi Hipotek dan Pinjaman
Pemberi pinjaman memerlukan W-2 selama 2 tahun, slip gaji terbaru, dan SPT 1–2 tahun. Ekstraksi AI memungkinkan pemroses pinjaman memverifikasi pendapatan dalam 30 detik, bukan 30 menit. Perhitungan pendapatan mencocokkan Kotak 1 (W-2) dengan laba bersih Jadwal C (1040) dengan Kotak 7 (slip gaji terakhir).
Persiapan Pajak
Bagi akuntan yang mengajukan perpanjangan (batas waktu 15 Oktober mendekat), setiap menit berharga. Pengembalian individu biasa menyentuh 4–8 W-2/1099 ditambah K-1. Mengekstraknya dalam 30 detik vs. 30 menit adalah perbedaan antara jam yang dapat ditagih dan lembur.
Tanggapan Audit IRS
Ketika IRS mengirimkan pemberitahuan CP2000 untuk pendapatan yang tidak dilaporkan, tanggapan memerlukan pemeriksaan ulang setiap 1099 yang diterima. Ekstraksi mempercepat rekonsiliasi terhadap setoran bank — pasangkan ini dengan Konverter Laporan Bank untuk mencocokkan pendapatan 1099 dengan setoran aktual.
Rekonsiliasi Pembukuan
Untuk penerbit 1099-NEC (sebagian besar usaha kecil yang membayar kontraktor), akhir tahun memerlukan rekonsiliasi 1099 yang diterbitkan terhadap 1099 yang sebenarnya diterima oleh kontraktor. Ekstraksi membuat pemeriksaan silang menjadi otomatis.
Paket Onboarding
Tim HR menggunakan PDF Form Filler untuk mengirimkan W-4, I-9, dan formulir otorisasi setoran langsung yang sudah diisi sebelumnya kepada karyawan baru. Karyawan baru mengisi sisa bidang dan mengembalikan PDF yang ditandatangani — tidak perlu mencetak.
Underwriting Asuransi
Underwriter asuransi jiwa dan disabilitas meninjau formulir pajak untuk memverifikasi pendapatan. Ekstraksi AI memangkas waktu pemrosesan per pelamar sebesar 60–80%.
Praktik Terbaik
Beberapa kebiasaan secara signifikan meningkatkan hasil:
Gunakan PDF Asli, Bukan Foto, Jika Memungkinkan
Setiap pemberi kerja dan pialang menawarkan unduhan PDF dari portal mereka. PDF resmi memiliki teks tertanam — ia mengekstrak dengan sempurna. Foto ponsel W-2 yang dicetak tidak memiliki teks tertanam, memerlukan OCR terlebih dahulu, dan menimbulkan penurunan akurasi 5–10%. Selalu minta PDF.
Verifikasi SSN, EIN, dan Kotak 1 pada Penggunaan Pertama
Formulir pertama yang Anda proses dari sistem penggajian atau pialang baru, periksa tiga bidang: SSN, EIN, dan jumlah dolar terbesar. Jika ketiganya benar, sisanya biasanya mengikuti. Jika salah satu dari mereka salah, tata letak formulir memiliki keunikan yang perlu diselidiki.
Standarisasi Format Output
Pilih CSV untuk spreadsheet, JSON untuk API. Jangan beralih di tengah batch — parser hilir rusak pada perubahan format. Alat Ekstrak Data memungkinkan Anda mengatur format output sekali dan menerapkannya ke setiap formulir dalam satu sesi.
Redaksi Sebelum Berbagi
Sebelum mengirimkan data yang diekstrak atau PDF melalui email kepada siapa pun di luar organisasi Anda, jalankan Redact PDF pada SSN/EIN. Redaksi PDFSub menggambar persegi panjang hitam buram berlabel REDACTED di atas konten. Pengguna yang menangani PII dalam volume tinggi atau untuk alur kerja yang diatur harus menyadari bahwa redaksi visual tidak menghapus teks dari aliran konten PDF yang mendasarinya — untuk tingkat keamanan itu (di mana alat ekstraksi teks tidak dapat memulihkan konten yang direduksi), gunakan alat redaksi khusus yang melakukan penghapusan aliran konten penuh sampai fitur penghapusan permanen PDFSub dirilis.
Simpan Log Audit Formulir yang Diekstrak
Untuk akuntansi dan pinjaman, simpan jejak: nama file, tanggal diekstrak, siapa yang mengekstrak, bidang yang digunakan di hilir. Jika IRS atau auditor mempertanyakan suatu angka, Anda dapat menunjukkan PDF sumber dan output ekstraksi.
Jangan Lewatkan Kotak Baru 2026
Jika Anda menggunakan alat ekstraksi lama, verifikasi bahwa alat tersebut menangani kode Kotak 12 TA, TP, TT dan Kotak 14b Kode Pekerjaan Tipped Departemen Keuangan. Alat yang secara diam-diam menghilangkan bidang ini akan menghasilkan ekspor yang secara teknis bersih tetapi tidak memiliki data yang diwajibkan secara hukum.
Di Luar W-2 dan 1099
Ekstraksi AI yang sama menangani formulir pajak terkait:
- Jadwal K-1 — pendapatan kemitraan, S-corp, dan perwalian (formulir pajak paling kompleks sejauh ini — 30+ bidang)
- Slip Gaji — periode gaji saat ini, total YTD, potongan, rincian YTD
- Formulir 1098 — bunga hipotek, bunga pinjaman mahasiswa, pembayaran biaya kuliah
- Formulir W-9 — pengumpulan informasi pembayar (ekstrak dan impor ke sistem AP)
- Formulir W-4 — tunjangan pemotongan (ekstrak untuk entri sistem penggajian)
- Formulir 1040 / Jadwal C — SPT penuh (ekstrak baris pendapatan untuk aplikasi pinjaman)
Untuk alur kerja dokumen keuangan yang lebih luas, Konverter Laporan Bank, Pemindai Kuitansi, dan Ekstraktor Faktur mencakup sisa spektrum dokumen keuangan — semuanya dalam langganan yang sama.
FAQ
Apa perbedaan antara Kotak 1 dan Kotak 5 pada W-2?
Kotak 1 adalah gaji kena pajak federal — tidak termasuk potongan pra-pajak seperti kontribusi 401(k) dan kontribusi FSA. Kotak 5 adalah gaji Medicare — termasuk potongan tersebut dan tidak memiliki batasan. Sebagian besar pembaca W-2 memeriksa Kotak 1 terlebih dahulu karena itulah yang masuk ke Formulir 1040, tetapi Kotak 5 adalah angka yang benar untuk perhitungan Jaminan Sosial dan Medicare.
Bisakah ekstraksi AI membaca foto ponsel W-2?
Ya, tetapi akurasinya turun menjadi 88–95% tergantung pada pencahayaan dan fokus. Untuk hasil terbaik, gunakan PDF resmi dari pemberi kerja atau penyedia penggajian. Jika Anda hanya memiliki foto, jalankan melalui Bersihkan PDF Pindai terlebih dahulu untuk meratakan dan meningkatkan kontras.
Apakah PDFSub menangani W-2 multi-negara bagian?
Ya. Alat ini membaca kedua baris kotak 15–20, melampirkan kode negara bagian ke jumlah gaji dan pajak yang benar, dan mengembalikan data setiap negara bagian sebagai objek terpisah dalam output.
Bisakah saya mengisi IRS 1099-NEC dengan PDFSub?
Ya — buka PDF IRS 1099-NEC resmi di PDF Form Filler. Bidang terdeteksi secara otomatis. Ketik info pembayar, info penerima, dan jumlah. Simpan dan cetak untuk pengajuan kertas atau gunakan PDF yang disimpan untuk salinan penerima. (Untuk pengiriman IRS, Anda perlu mengajukan e-file melalui portal BSO SSA atau pemancar pihak ketiga jika Anda menerbitkan total 10+ formulir.)
Apa yang terjadi pada data formulir pajak saya setelah ekstraksi?
Untuk PDF digital dengan teks tertanam, ekstraksi terjadi di sisi klien — file tidak pernah meninggalkan browser Anda. AI hanya menerima teks yang diekstrak (bukan file). Untuk formulir yang dipindai atau foto, file dikirim ke sisi server, diproses secara terisolasi, dan dihapus secara otomatis. PDFSub tidak menyimpan file formulir pajak setelah pemrosesan.
Bagaimana ekstraksi AI menangani kode Kotak 12 dengan benar?
AI membaca setiap dari empat sub-bidang (12a, 12b, 12c, 12d) sebagai pasangan kode+jumlah. Jadi W-2 dengan D 8400.00 di Kotak 12a dan DD 14200.00 di Kotak 12b mengembalikan dua baris terpisah, masing-masing dengan pemetaan kode-jumlah yang benar. Alat berbasis template sering salah memasangkan ini karena mereka membaca posisi, bukan hubungan.
Bagaimana dengan K-1 — mereka berbeda per kemitraan?
K-1 bervariasi berdasarkan jenis entitas (kemitraan, S-corp, perwalian) dan berdasarkan alokasi khusus kemitraan, tetapi tata letak kotaknya distandarisasi dalam setiap varian. Ekstraksi AI menangani ketiga jenis K-1 (Formulir 1065, 1120-S, 1041). Untuk kemitraan dengan jadwal tambahan non-standar, harapkan akurasi 90–95% pada K-1 utama dengan tinjauan manual item tambahan.
Bisakah saya mengekstrak data dari formulir pajak tahun sebelumnya?
Ya. IRS merevisi formulir setiap tahun, tetapi AI dilatih pada tata letak beberapa tahun. W-2 dan 1099 dari tahun 2018 dan seterusnya diekstrak dengan andal. Untuk formulir sebelum 2018 dengan kotak yang dihentikan (misalnya, 1099-MISC lama Kotak 7 yang digantikan oleh 1099-NEC mulai tahun 2020), AI menangani tata letak lama dengan benar.
Apakah ambang batas pelaporan 1099 baru sebesar $2.000 sama untuk setiap negara bagian?
Ambang batas federal adalah $2.000 mulai tahun 2026, tetapi beberapa negara bagian memiliki ambang batas 1099 tingkat negara bagian yang lebih rendah. California, Massachusetts, dan lainnya mungkin masih memerlukan pelaporan 1099 pada $600 untuk tujuan negara bagian meskipun tidak ada 1099 federal yang diperlukan. Periksa panduan badan pendapatan negara bagian Anda sebelum hanya mengandalkan ambang batas federal.
Apa cara termurah untuk menerbitkan 1099 untuk beberapa kontraktor?
Jika Anda menerbitkan kurang dari 10 pengembalian informasi total, IRS mengizinkan pengajuan kertas. Unduh PDF IRS 1099-NEC, isi dengan PDF Form Filler, cetak Salinan A pada kertas yang dapat dipindai dengan tinta merah (dibeli dari IRS atau toko perlengkapan kantor), dan kirimkan ke IRS. Ini menghindari biaya layanan e-file 1099 untuk penerbit volume rendah.
Memulai
Jika Anda memproses formulir pajak — mengekstrak dari formulir yang diterima atau mengisi formulir kosong — perhitungannya sederhana. Dengan 5 menit per formulir, memproses 50 formulir membutuhkan waktu ~4 jam. Ekstraksi AI melakukannya dalam total 2 menit, dengan akurasi lebih tinggi.
Coba alat Ekstrak Data PDFSub — mulai uji coba gratis 7 hari dengan akses penuh ke semua alat PDF. Unggah W-2 atau 1099, lihat output terstruktur, dan putuskan apakah akurasinya sesuai dengan alur kerja Anda sebelum berkomitmen pada paket berbayar.
Menerbitkan 1099 tahun ini? PDF Form Filler menangani PDF IRS tanpa perangkat lunak persiapan pajak khusus.
Formulir pajak tidak akan hilang. Kabar baiknya: tahun 2026 adalah tahun pertama Anda tidak perlu mengetiknya dengan tangan.