您掃描了上週二午餐的收據。總金額顯示為 $14.73，而不是 $114.73。一個數字的遺漏，就可能導致您的費用報銷單出錯。

這正是收據 OCR 的核心問題：該技術在運作時看似神奇，但「大致正確」與「真正正確」之間的差距，正是造成實際金錢損失的地方。95% 的字元準確度聽起來令人印象深刻，但實際上意味著每百個字元就有五個錯誤——在一張 30 行的餐廳收據上，這足以損壞總金額、誤讀日期或弄亂商家名稱。

過去兩年，收據掃描技術有了戲劇性的進步。但準確度仍然因您使用的工具、收據的狀況以及您嘗試提取的欄位而有極大的差異。本指南將詳細介紹您實際可以期待的準確度——提供具體數字，而非行銷宣傳。

Receipt OCR accuracy comparison: traditional OCR vs AI-powered extraction across different receipt conditions

為何收據 OCR 比文件 OCR 更難？

如果您曾對標準商業信函或打字報告使用過 OCR，您可能會認為收據掃描也同樣可靠。事實並非如此。收據是 OCR 引擎處理起來最困難的文件之一，其原因在於結構性而非僅僅是技術性。

熱感紙的劣化

影響準確度的最大殺手並非 OCR 引擎——而是紙張。大約 93% 的銷售點收據是使用熱感紙列印的，這種紙使用對熱敏感的化學塗層而非墨水。這會造成三個問題：

褪色是不可避免的。 在正常條件下（涼爽、乾燥、光線不足），熱感收據在六個月到一年內開始褪色。在惡劣環境下——例如夏天的汽車手套箱、潮濕的錢包——褪色可能在幾週內就開始。標準級別的熱感紙在理想儲存條件下，可保持五年到七年的清晰度，但「理想」條件意味著溫度低於 77 華氏度 (25°C)、相對濕度 45-65%，且無光照。這描述的是一個恆溫恆濕的檔案庫，而不是一個鞋盒。
褪色是不均勻的。 邊緣和摺痕最先褪色，因為摩擦和壓力會加速化學分解。這意味著經常出現總金額和分項總計的區域——收據底部——會最快劣化。
BPA 污染。 大多數熱感紙含有雙酚 A (BPA) 或其替代品雙酚 S (BPS) 作為顯色劑。單張收據中的 BPA 含量可能比罐頭食品中的含量高出 250 到 1,000 倍。這些化學物質並非與紙張進行化學鍵結，因此很容易轉移到皮膚、錢包和其他儲存的紙張上。這本身並非直接的 OCR 問題，但強烈建議立即將收據數位化，並盡量減少實體接觸。

版面變化多樣

標準商業文件——發票、銀行對帳單、稅務表格——的版面相對可預測。但收據則不然。僅考慮四種常見收據類型的變化：

收據類型	版面特徵	OCR 挑戰
餐廳	項目化食品/飲料、小費欄、多個分項總計、服務員姓名	手寫小費金額、可變間距
零售/超市	長項目列表、SKU 代碼、折扣、會員優惠	50+ 行項目、混合字母數字代碼
加油站	幫浦號碼、燃料等級、加侖數、每加侖價格、里程表	縮寫欄位名稱、風吹日曬影響
線上/電子郵件	HTML 渲染、格式一致、訂單號碼	通常乾淨——但 PDF 匯出可能引入瑕疵

一個基於範本且針對零售收據訓練的 OCR 系統，在處理餐廳收據的手寫小費時會失敗。一個針對英語收據優化的引擎，在處理國際旅行中常見的多語言格式時會遇到困難。而一個為標準信紙大小文件設計的系統，可能根本無法處理熱感紙狹窄、連續捲軸的格式。

字體小且對比度低

收據印表機通常使用 7 到 10 點的字體——比大多數文件中的標準內文文字還要小。結合熱感列印固有的較低對比度（與雷射或噴墨列印相比），即使是頂尖的 OCR 引擎，這也會造成字元識別上的挑戰。像 "1" 和 "l"、"0" 和 "O"、"5" 和 "S" 這樣的字元，在小字體尺寸下變得模糊不清，尤其是在輕微褪色之後。

實體損壞

收據會在口袋裡被揉皺，在錢包裡被摺疊，或被塞進信封。每一次摺痕都會產生一條線，OCR 引擎可能會將其解釋為字元邊界、刪除線或雜訊。雨水或潑濺造成的損壞會使紙張變形並導致墨水暈染。食物收據上的油脂和油污會遮蓋文字。掃描乾淨的雷射列印辦公文件時，這些問題都不存在。

Receipt OCR process: Capture → OCR → Verify → Export, with accuracy benchmarks

理解準確度：三種不同的指標

當供應商聲稱「99% 準確度」時，您需要問：99% 的什麼？有三種根本不同的方法來衡量 OCR 準確度，每種方法都講述著一個截然不同的故事。

字元準確度（字元錯誤率）

字元準確度衡量引擎正確讀取的個別字元數量。它使用字元錯誤率 (CER) 計算，該指標計算字元級別的插入、刪除和替換。

範例： 如果收據的一行顯示「COFFEE MEDIUM $4.50」，而 OCR 輸出為「C0FFEE MEDIUN $4.5O」，這表示 21 個字元中有 3 個錯誤——準確度為 85.7%。

字元準確度是最細粒度的指標，也是最容易客觀比較的。但它對實際用途的用處最小，因為它平等對待所有錯誤。在描述中將「MEDIUM」誤讀為「MEDIUN」很惱人。將「$4.50」誤讀為「$4.5O」（字母 O 而非數字零）則是資料損壞錯誤。

欄位準確度（欄位級 F1 分數）

欄位準確度衡量特定資料欄位是否被正確提取為完整單元。系統是否正確識別並提取了總金額？日期？商家名稱？稅額？

範例： 如果 OCR 系統讀取收據並返回：

總計：$47.83（正確）
日期：2026/02/28（正確）
商家：「STARBCUKS」（錯誤——應為「STARBUCKS」）
稅額：$3.42（正確）

這表示 4 個欄位中有 3 個正確——欄位準確度為 75%。

欄位準確度對於費用管理和會計流程至關重要。描述中的字元錯誤是可以容忍的。總金額欄位中的錯誤會使整個收據無效。

文件準確度（端對端成功率）

文件準確度衡量整個收據是否被正確處理——所有欄位、所有項目、沒有任何錯誤。這是最嚴格的指標，也是生產流程中最實際的指標。

如果一張收據有 8 個可提取欄位，而系統正確了 7 個但誤讀了一個項目數量，則文件準確度為 0%——任何一個錯誤都意味著整個文件需要審核。

行業基準概覽：

指標	傳統 OCR	AI 驅動提取
字元準確度	85-92%	95-99%
欄位準確度（關鍵欄位）	70-85%	93-99%
文件準確度（所有欄位正確）	40-60%	75-92%

字元準確度和文件準確度之間的差距，解釋了為何一個工具可以聲稱「95% 準確度」但仍然在半數收據上產生需要手動更正的結果。

傳統 OCR 在收據上的準確度：基準

傳統 OCR——基於規則的引擎，通過模式匹配和分割來識別字元——已經存在數十年。該領域主要由兩個系統主導。

Tesseract（開源）

Tesseract 最初由 HP Labs 在 1980 年代開發，後來由 Google 維護，是最廣泛使用的開源 OCR 引擎。在標準文件（乾淨的打字頁面掃描）上，Tesseract 可達到 95-99% 的字元準確度。但在收據上，情況遠不如此理想。

獨立基準測試顯示，Tesseract 在收據上的字元準確度為 50-80%，具體取決於圖像品質和收據狀況。該引擎的設計和優化是為了識別標準文件中的單字句子——而不是收據上發現的縮寫、混合格式文字。常見的失敗模式包括：

SKU 代碼和項目編號被誤讀，因為它們看起來像經過英語文本訓練的語言模型的隨機字元串。
當空格檢測失敗時，價格欄失去小數對齊。
小字體熱感列印產生低信心的字元匹配。
旋轉或傾斜的圖像（來自手機相機）顯著降低準確度。

Tesseract 需要大量的預處理——去歪斜、二值化、雜訊去除、對比度增強——才能在收據上達到可接受的準確度。即使經過優化的預處理，關鍵欄位（如總金額和日期）的欄位級準確度通常也僅在 60-75% 之間。

ABBYY FineReader（商業版）

ABBYY 代表了傳統 OCR 的高端。在乾淨、結構化的文件上，ABBYY 可達到 99.8% 的字元準確度——這是傳統 OCR 類別中的最佳表現。在收據上，ABBYY 的表現明顯優於 Tesseract，通常在相對清晰的收據上可達到 88-93% 的字元準確度。

ABBYY 的優勢來自於數十年的訓練數據、卓越的預處理演算法以及廣泛的語言和字體覆蓋範圍。然而，它本質上仍然依賴字元級別的識別，而缺乏對文件結構的語義理解。它可以準確讀出收據上的內容，但它不理解底部的數字是總金額，頂部的日期是交易發生的時間。

範本問題

傳統 OCR 系統若要超越原始字元識別達到欄位提取，通常依賴範本——預定義的座標圖，告訴系統「總金額在頁面的 X,Y 位置」。這種方法對於標準化表格（稅務文件、保險索賠）效果很好，但對於收據則會失敗，因為：

不同商家、POS 系統和國家/地區之間存在數千種獨特的收據格式。
即使是同一家連鎖店，在升級 POS 硬體時也可能更改其收據版面。
範本的創建和維護工作量大——每種新版面都需要手動配置。
收據長度各不相同（包含 50 項商品的超市收據在物理上與包含 2 項商品的咖啡店收據不同）。

基於範本的系統通常支持 50-200 種收據版面。這足以涵蓋單一國家/地區的主要零售商。但無法涵蓋數量眾多的小型企業、國際收據或餐廳。

AI 驅動提取：一種不同的方法

現代 AI 收據提取與傳統 OCR 的工作方式完全不同。AI 系統不識別單個字元並將座標映射到範本，而是使用大型語言模型和視覺模型來理解文件上下文。

AI 提取的工作原理

該過程通常遵循三個步驟：

視覺理解。 AI 模型將收據圖像（或 PDF）作為視覺輸入進行處理，識別文字區域、版面結構和空間關係。這與傳統 OCR（獨立處理字元）根本不同。
上下文提取。 模型不是問「X,Y 位置的字元是什麼？」，而是問「這張收據上的總金額是多少？」它理解總金額通常位於底部附近，前面有類似「Total」、「Amount Due」或「Grand Total」的詞語，並且格式為貨幣值。這種上下文理解是 AI 提取能夠獨立於格式的關鍵——無需範本。
結構化輸出。 模型返回一個帶有標籤欄位的結構化資料對象：商家名稱、日期、項目列表、小計、稅額、總計、付款方式。無論輸入收據的版面如何，輸出格式都是一致的。

按條件劃分的 AI 準確度

AI 驅動的提取比傳統 OCR 實現了顯著更高的準確度，但數字因收據狀況而異：

收據狀況	欄位準確度（關鍵欄位）	欄位準確度（所有欄位）	備註
乾淨的數位收據（PDF/電子郵件）	98-99%+	95-98%	近乎完美；格式一致
新鮮的熱感收據（0-3 個月）	96-99%	92-96%	對比度高，文字清晰
老舊的熱感收據（3-12 個月）	90-95%	82-90%	有些褪色，尤其是邊緣
褪色的熱感收據（1-3 年）	75-88%	65-80%	大量文字丟失；上下文有助於識別
嚴重劣化（3 年以上，高溫暴露）	50-70%	40-60%	文字區域缺失；部分提取
揉皺/褶皺	85-93%	78-88%	摺痕干擾線條檢測
低品質照片（運動模糊、陰影）	80-90%	70-85%	圖像品質是瓶頸

關鍵的見解是，即使在條件惡化時，AI 也能保持比傳統 OCR 更高的準確度，因為它可以利用上下文來填補空白。如果引擎能讀出「Tot」後面跟著「$47.8_」（最後一個數字模糊不清），它會從上下文中知道這是總計欄位，並且根據上面的項目，遺漏的數字很可能是「3」。傳統 OCR 只會輸出一個問號或其最佳的單字元猜測。

關鍵欄位的準確度差距

並非所有欄位都同樣重要。對於費用管理和稅務合規，存在明顯的層級劃分：

欄位	優先級	重要性	AI 準確度（乾淨收據）
總金額	關鍵	決定費用價值和扣除額	98-99%
日期	關鍵	確定稅務年度和期間分配	97-99%
商家名稱	高	分類和審計追蹤所需	95-98%
稅額	高	稅務申報和進項稅額抵扣所需	96-98%
付款方式	中	與信用卡對帳單核對有用	93-96%
項目列表	中	詳細費用分類所需	88-95%
小費金額	中	與餐費相關，常為手寫	85-92%
地址/電話	低	費用處理很少需要	90-95%

AI 提取工具在最重要的欄位——總金額和日期——上始終保持最高準確度，因為這些欄位具有強烈的上下文信號（位置、格式、周圍文字），模型即使在單個字元模糊不清時也能利用這些信號。

影響準確度的因素

了解哪些因素會降低準確度，有助於您更好地決定何時信任自動提取，何時需要手動驗證。

圖像品質

圖像品質是影響 OCR 準確度最主要的、可控的因素。精心拍攝的圖像與匆忙拍攝的照片之間的差異，可能使欄位準確度相差 15-20 個百分點。

因素	對準確度的影響	應對方法
解析度	低於 200 DPI，準確度急劇下降	使用至少 300 DPI；大多數手機相機都超過此標準
光照	光線不均勻會造成對比度問題	使用自然、柔和的光線；避免直接頂光
陰影	手/手機陰影會遮蓋文字	將光源置於側面；如有需要，使用檯燈
閃光燈反光	熱感紙具有反光性；閃光燈會產生白斑，經常遮蓋最重要文字	禁用閃光燈；改用環境光
對焦	模糊的文字，無論解析度多高都無法讀取	點擊螢幕對焦於文字；保持手機穩定
角度	透視變形會扭曲字元	將相機直接置於收據上方，與表面平行
裁剪	過多的背景會混淆邊緣檢測	讓收據佔據畫面 80% 的空間

紙張狀況

紙張狀況是最大的不可控因素。您可以通過技巧改善圖像品質；但無法讓褪色的收據恢復原狀。

熱感收據的褪色時間表很大程度上取決於儲存條件：

理想儲存（黑暗、涼爽、濕度 45-65%）：標準級別可保存 5-7 年，頂級塗層熱感紙可保存長達 25 年。
正常條件（辦公桌抽屜、文件夾）：1-3 年。
錢包或口袋：3-12 個月。
汽車儀表板或手套箱：數週至數月，取決於氣候。
陽光直射：數天至數週。

實際的結論很明確：在收到收據後 48 小時內進行數位化。 延遲一天，就會降低可實現的 OCR 準確度上限。購買當天掃描的收據將產生近乎完美的結果。六個月後掃描同一張收據，其文字清晰度可能會損失 10-20%。

收據長度和複雜性

包含更多項目的長收據，由於出錯的機會更多，因此在文件級準確度上自然較低。一張 5 項商品的咖啡店收據，其 100% 正確的可能性遠高於一張 60 項商品的超市收據。

收據長度	平均項目數	文件準確度（AI）	最可能出錯的欄位
短（1-5 項）	8-15 行	90-95%	商家名稱（縮寫）
中（6-20 項）	16-40 行	80-90%	項目描述
長（21-50 項）	41-80 行	70-82%	項目數量、單價
非常長（50+ 項）	80+ 行	55-70%	多個欄位；累積錯誤

字體和格式

某些 POS 系統使用自訂或狹窄的字體，對 OCR 來說尤其具有挑戰性。點矩陣收據印表機——在某些加油站和舊式零售點仍然很常見——產生的字元品質低於熱感印表機。全大寫格式雖然對人類閱讀更困難，但對 OCR 引擎來說實際上更容易，因為大寫字母的形狀更具辨識度。

按收據類型劃分的準確度

不同的收據類別帶來獨特的挑戰，並產生不同的準確度表現。

餐廳收據

餐廳收據對 OCR 來說是最具挑戰性的之一，因為它們經常包含手寫元素——小費金額、總計和簽名。AI 提取能很好地處理印刷部分（商家、日期、小計的欄位準確度為 95-98%），但在小費欄的手寫識別方面會遇到困難（準確度為 70-85%）。小費金額通常是手寫欄位中最具財務重要性的。

最佳實踐： 如果小費準確度對您的工作流程很重要，請手動驗證小費和總計。小計、稅額和商家欄位通常無需審核即可信賴。

零售和超市收據

零售收據因項目數量龐大而對 OCR 構成挑戰。一張典型的超市收據包含 30-60 個項目，每個項目都有描述、數量和價格。項目描述通常是縮寫的（例如，「ORG BNS CHKN」代表「有機去骨雞肉」），並且可能包含內部 SKU 代碼，這些代碼對 OCR 引擎來說看起來像是損壞的文字。

關鍵欄位準確度（總計、日期、商家）很高，為 96-99%。由於縮寫和格式不一致，項目準確度較低，為 85-92%。就費用分類而言，總計和商家通常已足夠——您很少需要逐字記錄每個項目。

加油站收據

加油站收據雖然簡短，但經常損壞。它們在戶外油泵處分發，暴露於天氣影響，經常被戴手套或油膩的手接觸，並且經常立即被揉皺。熱感紙的品質可能低於室內使用的紙張。新鮮收據的總金額和日期欄位準確度通常為 90-96%，但由於環境暴露，其下降速度比其他收據類型更快。

線上和電子郵件收據

數位收據——電子郵件確認、線上購買的 PDF 下載、數位 POS 系統的電子收據——是最容易處理的 OCR 類別。它們具有一致的格式、高對比度、無紙張劣化，並且欄位位置可預測。所有欄位的欄位準確度通常超過 98%，文件準確度達到 92-97%。

如果您有收到數位收據的選項，請務必選擇。它們完全消除了熱感紙問題，並產生最高的提取準確度。

各收據類型的比較

收據類型	總計準確度	日期準確度	商家準確度	項目準確度	總體欄位平均值
線上/電子郵件 (PDF)	99%	99%	98%	96%	98%
新鮮零售	98%	98%	96%	90%	95%
新鮮餐廳	97%	97%	95%	92%	93%
加油站	95%	94%	92%	88%	91%
老舊熱感（6+ 個月）	88%	87%	82%	72%	82%
褪色/損壞	72%	70%	65%	50%	64%

PDFSub 如何處理收據掃描

PDFSub 的收據掃描器使用 AI 驅動的提取技術來處理任何格式的收據——熱感紙掃描、手機照片、PDF 下載和電子郵件附件。

提取內容

收據掃描器識別並從每張收據中提取結構化資料：

商家名稱和地址——包括可用的店號和地點。
交易日期和時間——自動檢測日期格式（MM/DD、DD/MM、YYYY-MM-DD）。
項目列表——每個項目的描述、數量、單價和行總計。
小計、稅額和總計——分離為獨立欄位，確保會計準確性。
付款方式——現金、信用卡（末四碼）、簽帳金融卡、行動支付。
貨幣——從符號和格式自動檢測。

如何處理可變版面

PDFSub 不使用範本。AI 引擎獨立分析每張收據，通過上下文而非座標映射來理解文件結構。這意味著它適用於任何商家、任何國家/地區的任何收據版面，無需預先配置。無論您上傳的是布魯克林咖啡店的收據、慕尼黑藥局的收據，還是東京計程車的收據，提取過程都是相同的。

處理與隱私

對於數位 PDF 收據，初始文字提取在您的瀏覽器中完成——無需上傳。對於需要 AI 處理的掃描圖像或收據，文件會被發送到提取引擎進行處理，並在提取完成後不保留原始文件。

您可以通過 7 天免費試用來試用收據掃描器——上傳幾張收據，並將提取結果與原始文件進行比較，以評估針對您特定收據類型的準確性。可隨時取消。

提升收據掃描準確度的技巧

通過遵循一些簡單的收據擷取實踐，您可以顯著提高提取準確度。

擷取技巧

使用自然、柔和的光線。 白天在窗邊掃描比使用人造頂光效果更好。目標是均勻照明，無刺眼陰影。
將收據放在平坦、深色的表面上。 深色桌面或檯面可產生對比度，有助於邊緣檢測和文字識別。避免在白色表面上掃描收據——邊緣會變得難以辨識。
將相機直接置於上方。 將相機與收據表面平行放置，以避免透視變形。即使是輕微的角度也可能扭曲字元，足以降低準確度。
禁用閃光燈。 熱感紙具有反光性。相機閃光燈會產生反光點，在 OCR 引擎看來是空白區域，經常恰好覆蓋最重要文字。
填滿畫面。 收據應佔圖像的 80% 左右。過多的背景會浪費解析度。裁剪過緊則有切掉邊緣文字的風險。
點擊對焦於文字。 自動對焦通常會鎖定在紙張表面而不是印刷文字上。點擊文字區域以確保清晰的字元渲染。
撫平摺痕和皺紋。 掃描前將收據壓平。摺痕會產生陰影，OCR 引擎可能會將其解釋為字元或換行符。如果收據嚴重褶皺，請嘗試先將其放在重物下壓幾分鐘。

時機

在 48 小時內掃描。 熱感收據會立即開始降解。越早擷取，準確度越高。將收據掃描養成每日或每日結束的習慣，而不是每月一次的批次處理。
不要等到批次處理日。 將收據保存一個月然後一次性掃描的做法，保證了較低的準確度。其中一些收據會在錢包、口袋或汽車裡度過四周——期間一直在褪色。

文件管理

保留原始圖像。 即使在提取後，也要保留原始掃描件或照片。如果您以後需要使用改進的工具重新提取，原始圖像就是您的真相來源。
盡可能使用 PDF 格式。 如果您的掃描器應用程式或手機提供 PDF 輸出，請優先選擇它而不是 JPEG。PDF 可保留更高品質，並能處理多頁收據（例如，長超市收據被分成兩部分掃描）。

何時需要手動驗證

對於低風險收據——例如 4.50 美元的咖啡、12 美元的停車費收據——AI 提取的準確度已經足夠，可以盲目信任。但某些情況需要手動驗證。

始終驗證這些

超過 500 美元的收據。 對於高價值收據，提取錯誤的財務影響值得花 30 秒進行手動檢查。
對稅務至關重要的收據。 您計劃用於稅務扣除的任何收據都應進行驗證。美國國稅局要求對超過 75 美元的單項費用提供證明文件，扣除額上的錯誤金額可能會引發審計問題。
包含手寫元素的收據。 小費金額、手動價格調整和手寫筆記仍然是 AI 提取的薄弱環節。如果收據包含手寫內容，請檢查這些欄位。
褪色或損壞的收據。 如果您自己也難以看清收據，請不要在未經驗證的情況下信任 AI 提取。嚴重劣化的收據應被視為近似值而非權威。
外幣收據。 貨幣轉換和不熟悉的數字格式（句點與逗號作為小數分隔符）可能導致提取錯誤。請驗證國際收據上的金額和貨幣。

抽查這些

包含 20 多項商品的超市收據。 抽查 3-5 個項目，並驗證總計是否與總和相符。如果總計正確，單個項目的錯誤不太可能影響您的費用報告。
來自不熟悉商家的收據。 來自新商家的第一張收據可能會產生較低的準確度，因為 AI 以前未見過該特定版面。驗證第一張後，來自同一商家的後續收據通常更可靠。
批次處理的收據。 如果您一次處理 50 多張收據，請抽查其中 10-15%。如果準確度始終很高，您可以信任其餘的。

無需檢查的信任

格式乾淨、版面標準的數位/電子郵件收據。
來自主要零售商的新鮮收據，其總金額為整數或與您的銀行對帳單相符。
低於 25 美元的收據，其中驗證成本超過潛在錯誤的成本。

立即數位化收據的商業價值

準確度數據指向一個壓倒性的結論：掃描收據的最佳時機是立即進行。延遲一天就會損失準確度，而因熱感紙褪色而損失的準確度永遠無法恢復。

考慮經濟效益：

平均可扣除收據價值： $35-75
一年內褪色到無法 OCR 讀取的機率： 30-50%（錢包儲存）
每月遺失在掃描前的機率： 15-25%
每張收據的平均稅務節省（假設邊際稅率為 25%）：$8.75-18.75
使用手機掃描一張收據所需時間： 5-10 秒

數學很簡單。一次 10 秒的掃描可保留 12 美元的稅務減免，相當於每小時 4,320 美元的生產力。即使您只掃描高價值收據，投入時間的回報也是巨大的。

將 BPA 暴露納入考量——處理熱感收據會通過皮膚接觸轉移可測量的雙酚類化合物——立即數位化的理由就兼具了財務和健康方面的考量。歐盟已經開始逐步淘汰熱感紙中的 BPA，美國也有幾個州已頒布或提議類似的限制。

未來的預期

在過去五年中，收據 OCR 準確度每年約提高 2-3 個百分點，這主要歸功於視覺語言模型的進步，而非傳統 OCR 工程的發展。當前一代的 AI 提取工具代表了一個有意義的準確度閾值：這是首次，乾淨收據上的關鍵欄位準確度持續超過 97%，使得完全自動化的收據處理對於大多數商業流程來說變得可行。

剩餘的準確度差距——手寫小費、嚴重褪色的熱感紙、奇特的 POS 格式——將繼續縮小。但熱感紙問題是物理問題，而非計算問題。任何 AI 的進步都無法恢復已從紙張表面化學消失的文字。

實際解決方案仍然相同：儘早擷取，在光線充足的條件下擷取，讓 AI 處理提取。 對於最重要的收據，請驗證總計。對於其他所有收據，請相信數字並繼續處理。

PDFSub 的收據掃描器可處理任何格式、任何商家、任何語言的收據。開始 7 天免費試用，用您自己的收據測試它——本文中的準確度數字是行業基準，而唯一重要的數字是您在自己文件上看到的數字。