Ви скануєте чек з бізнес-ланчу минулого вівторка. Загальна сума виходить $14.73 замість $114.73. Одна пропущена цифра — і ваш звіт про витрати неправильний.

У цьому полягає головна проблема OCR чеків: технологія здається магічною, коли працює, але прірва між «майже правильно» і «дійсно правильно» — це те місце, де втрачаються реальні гроші. 95% точність розпізнавання символів звучить вражаюче, доки ви не усвідомите, що це означає п’ять помилок на сто символів — а на чеку з ресторану з 30 рядків цього достатньо, щоб спотворити загальну суму, неправильно прочитати дату або перекрутити назву постачальника.

Сканування чеків значно покращилося за останні два роки. Але точність все ще сильно варіюється залежно від інструменту, який ви використовуєте, стану чека та полів, які ви намагаєтеся вилучити. Цей посібник розкриває, чого реально можна очікувати — з конкретними цифрами, а не маркетинговими обіцянками.

Receipt OCR accuracy comparison: traditional OCR vs AI-powered extraction across different receipt conditions

Чому OCR чеків складніший за OCR документів

Якщо ви коли-небудь використовували OCR для стандартного ділового листа чи друкованого звіту, ви можете припустити, що сканування чеків буде таким же надійним. Це не так. Чеки є одними з найскладніших документів для обробки OCR-системами, і причини цього є структурними, а не просто технічними.

Деградація термопаперу

Найбільший вбивця точності — це не OCR-система, а папір. Приблизно 93% чеків з точок продажу друкуються на термопапері, який використовує чутливі до нагрівання хімічні покриття замість чорнила. Це створює три проблеми:

Вицвітання неминуче. За нормальних умов (прохолодно, сухо, мало світла) термочеки починають вицвітати протягом шести місяців-одного року. У суворих умовах — бардачок автомобіля влітку, вологий гаманець — вицвітання може початися протягом тижнів. Термопапір стандартної якості зберігає читабельність п’ять-сім років за ідеальних умов зберігання, але «ідеальні» означає температуру нижче 25 градусів за Цельсієм, відносну вологість 45-65% та відсутність світла. Це описує архів з клімат-контролем, а не взуттєву коробку.
Вицвітання нерівномірне. Краї та складки вицвітають першими, оскільки тертя та тиск прискорюють хімічний розпад. Це означає, що саме ті ділянки, де часто розташовуються загальні суми та проміжні підсумки — низ чека — деградують найшвидше.
Забруднення BPA. Більшість термопаперу містить бісфенол А (BPA) або його замінник бісфенол S (BPS) як проявник кольору. Окремі чеки можуть містити BPA в концентраціях, що в 250-1000 разів перевищують ті, що містяться в консервній банці. Хімікати не зв'язані хімічно з папером, тому легко передаються на шкіру, гаманці та інші папери, що зберігаються поруч. Це не є прямою проблемою OCR, але це вагомий аргумент на користь негайної оцифровки чеків та мінімізації фізичного контакту.

Змінні макети

Стандартні ділові документи — рахунки-фактури, банківські виписки, податкові форми — мають відносно передбачувані макети. Чеки — ні. Розглянемо варіації лише чотирьох поширених типів чеків:

Тип чека	Характеристики макета	Проблема для OCR
Ресторан	Деталізовані страви/напої, рядок для чайових, кілька проміжних підсумків, ім'я офіціанта	Суми чайових, написані від руки, змінний інтервал
Роздріб/Продукти	Довгі списки товарів, коди SKU, знижки, бонуси лояльності	50+ позицій, змішані буквено-цифрові коди
Заправка	Номер колонки, марка палива, літри, ціна за літр, показник одометра	Скорочені назви полів, вплив погодних умов
Онлайн/Електронна пошта	Відрендерені в HTML, послідовне форматування, номери замовлень	Зазвичай чисті — але експорт у PDF може внести артефакти

Шаблонна OCR-система, навчена на роздрібних чеках, зазнає невдачі з чеками з ресторанів із чайовими, написаними від руки. Система, оптимізована для англомовних чеків, буде мати труднощі з багатомовними форматами, поширеними під час міжнародних подорожей. А система, розроблена для стандартних документів формату Letter, може взагалі не впоратися з вузьким форматом безперервного рулону термопаперу.

Дрібні шрифти та низький контраст

Принтери чеків зазвичай використовують шрифти розміром від 7 до 10 пунктів — менші за стандартний основний текст у більшості документів. У поєднанні з природно нижчим контрастом термодруку порівняно з лазерним або струменевим друком, це створює проблеми з розпізнаванням символів навіть для найсучасніших OCR-систем. Символи, такі як «1» і «l», «0» і «O», «5» і «S», стають неоднозначними при малих розмірах, особливо після навіть незначного вицвітання.

Фізичні пошкодження

Чеки мнуться в кишенях, складаються в гаманцях і запихаються в конверти. Кожна складка створює лінію, яку OCR-система може інтерпретувати як межу символу, закреслення або шум. Пошкодження водою від дощу чи розливів спотворює папір і призводить до розпливання чорнила. Олія та жир від чеків з продуктів харчування затуманюють текст. Жодна з цих проблем не виникає при скануванні бездоганного офісного документа з лазерного принтера.

Receipt OCR process: Capture → OCR → Verify → Export, with accuracy benchmarks

Розуміння точності: три різні метрики

Коли постачальник заявляє «99% точності», вам потрібно запитати: 99% чого? Існує три принципово різні способи вимірювання точності OCR, і кожен розповідає зовсім іншу історію.

Точність символів (рівень помилок символів)

Точність символів вимірює, скільки окремих символів система розпізнає правильно. Вона розраховується за допомогою рівня помилок символів (CER), який підраховує вставки, видалення та заміни на рівні символів.

Приклад: Якщо рядок чека читається як «КАВА СЕРЕДНЯ $4.50», а OCR видає «КАВА СЕРЕДНЮ $4.5O», це 3 помилки на 21 символ — 85,7% точності символів.

Точність символів є найбільш детальною метрикою і найлегшою для об'єктивного вимірювання. Вона також найменш корисна для практичних цілей, оскільки однаково ставиться до всіх помилок. Неправильне прочитання «СЕРЕДНЯ» як «СЕРЕДНЮ» в описі дратує. Неправильне прочитання «$4.50» як «$4.5O» (літера O замість нуля) є помилкою пошкодження даних.

Точність полів (F1-оцінка на рівні полів)

Точність полів вимірює, чи правильно вилучаються конкретні поля даних як повні одиниці. Чи правильно система визначила та вилучила загальну суму? Дату? Назву постачальника? Суму податку?

Приклад: Якщо OCR-система читає чек і повертає:

Загальна сума: $47.83 (правильно)
Дата: 28.02.2026 (правильно)
Постачальник: «STARBCUKS» (неправильно — має бути «STARBUCKS»)
Податок: $3.42 (правильно)

Це 3 з 4 полів правильні — 75% точності полів.

Точність полів — це те, що має значення для робочих процесів управління витратами та бухгалтерського обліку. Помилка символу в описі є прийнятною. Помилка поля в загальній сумі робить весь чек недійсним.

Точність документа (рівень успішності від початку до кінця)

Точність документа вимірює, чи був весь чек оброблений правильно — усі поля, усі позиції в списку, жодних помилок. Це найсуворіша метрика і найбільш реалістична для виробничих робочих процесів.

Якщо чек має 8 полів, що підлягають вилученню, а система правильно отримує 7, але неправильно читає одну позицію в списку, точність документа становить 0% — одна помилка де завгодно означає, що весь документ потребує перевірки.

Галузеві орієнтири одним поглядом:

Метрика	Традиційний OCR	Вилучення за допомогою ШІ
Точність символів	85-92%	95-99%
Точність полів (критичні поля)	70-85%	93-99%
Точність документа (усі поля правильні)	40-60%	75-92%

Розрив між точністю символів і точністю документа пояснює, чому інструмент може претендувати на «95% точності» і все одно видавати результати, які потребують ручного виправлення на половині всіх чеків.

Точність традиційного OCR на чеках: базова лінія

Традиційний OCR — системи на основі правил, які ідентифікують символи за допомогою зіставлення шаблонів і сегментації — існує десятиліттями. Два системи домінують у цій сфері.

Tesseract (відкритий код)

Tesseract, спочатку розроблений HP Labs у 1980-х роках і пізніше підтримуваний Google, є найпоширенішою OCR-системою з відкритим кодом. На стандартних документах (чисті скани друкованих сторінок) Tesseract досягає 95-99% точності символів. На чеках картина набагато менш райдужна.

Незалежні тести показують, що Tesseract досягає 50-80% точності символів на чеках, залежно від якості зображення та стану чека. Система була розроблена та оптимізована для розпізнавання речень слів у стандартних документах — а не скороченого тексту змішаного формату, знайденого на чеках. Поширені збої включають:

Коди SKU та номери товарів неправильно читаються, оскільки вони виглядають як випадкові рядки символів для мовної моделі, навченої на англійському тексті.
Цінові стовпці втрачають вирівнювання десяткових знаків, коли виявлення пробілів не вдається.
Дрібні термічні шрифти дають низькоякісні збіги символів.
Повернуті або нахилені зображення з камер телефонів значно знижують точність.

Tesseract вимагає значної попередньої обробки — вирівнювання, бінаризації, видалення шуму, покращення контрасту — щоб наблизитися до прийнятної точності на чеках. Навіть з оптимізованою попередньою обробкою, точність на рівні полів для критичних полів, таких як загальні суми та дати, зазвичай становить від 60% до 75%.

ABBYY FineReader (комерційний)

ABBYY представляє високий рівень традиційного OCR. На чистих, структурованих документах ABBYY досягає до 99,8% точності символів — найкращий показник у категорії традиційного OCR. На чеках ABBYY працює значно краще, ніж Tesseract, зазвичай досягаючи 88-93% точності символів на відносно чітких чеках.

Перевага ABBYY полягає в десятиліттях навчальних даних, передових алгоритмах попередньої обробки та широкому охопленні мов і шрифтів. Однак він все ще фундаментально покладається на розпізнавання на рівні символів без семантичного розуміння структури документа. Він може точно прочитати те, що написано на чеку, але не розуміє, що число внизу — це загальна сума, а дата вгорі — це час транзакції.

Проблема шаблонів

Традиційні OCR-системи, які виходять за рамки простого розпізнавання символів для вилучення полів, зазвичай покладаються на шаблони — попередньо визначені карти координат, які повідомляють системі, що «загальна сума знаходиться в позиції X,Y на сторінці». Цей підхід добре працює для стандартизованих форм (податкові документи, страхові заяви), але не працює для чеків, тому що:

Існують тисячі унікальних форматів чеків від постачальників, POS-систем і країн.
Навіть одна й та сама мережа магазинів може змінити макет свого чека під час оновлення POS-обладнання.
Створення та підтримка шаблонів вимагає багато ручної роботи — кожен новий макет потребує ручного налаштування.
Довжина чека варіюється (чек з продуктового магазину з 50 товарами фізично відрізняється від чека з кав'ярні з 2 товарами).

Шаблонні системи зазвичай підтримують 50-200 макетів чеків. Це охоплює великих роздрібних продавців в одній країні. Це не охоплює довгий хвіст малого бізнесу, міжнародні чеки чи ресторани.

Вилучення даних за допомогою ШІ: інший підхід

Сучасне вилучення даних з чеків за допомогою ШІ працює зовсім не так, як традиційний OCR. Замість зіставлення шаблонів окремих символів і відображення координат на шаблонах, системи ШІ використовують великі мовні моделі та візуальні моделі, які розуміють контекст документа.

Як працює вилучення за допомогою ШІ

Процес зазвичай складається з трьох кроків:

Візуальне розуміння. Модель ШІ обробляє зображення чека (або PDF) як візуальний вхід, визначаючи текстові області, структуру макета та просторові зв'язки. Це принципово відрізняється від традиційного OCR, який обробляє символи ізольовано.
Контекстне вилучення. Замість запитання «який символ знаходиться в позиції X,Y?», модель запитує «яка загальна сума на цьому чеку?». Вона розуміє, що загальна сума зазвичай знаходиться внизу, їй передує слово на кшталт «Всього», «Сума до сплати» або «Загальна сума», і вона має формат валюти. Це контекстне розуміння є причиною того, що вилучення за допомогою ШІ не залежить від формату — шаблони не потрібні.
Структурований вивід. Модель повертає структурований об'єкт даних із позначеними полями: назва постачальника, дата, позиції в списку, проміжний підсумок, податок, загальна сума, спосіб оплати. Формат виводу є послідовним незалежно від макета вхідного чека.

Точність ШІ за умов

Вилучення за допомогою ШІ досягає значно вищої точності, ніж традиційний OCR, але цифри суттєво варіюються залежно від стану чека:

Стан чека	Точність полів (критичні поля)	Точність полів (усі поля)	Примітки
Чистий цифровий чек (PDF/email)	98-99%+	95-98%	Майже бездоганно; послідовне форматування
Свіжий термочек (0-3 міс.)	96-99%	92-96%	Високий контраст, чіткий текст
Старий термочек (3-12 міс.)	90-95%	82-90%	Деяке вицвітання, особливо по краях
Вицвілий чек (1-3 роки)	75-88%	65-80%	Значна втрата символів; контекст допомагає
Сильно деградований (3+ роки, вплив тепла)	50-70%	40-60%	Відсутні текстові області; часткове вилучення
Зім'ятий/пошкоджений	85-93%	78-88%	Складки заважають виявленню рядків
Фото низької якості (розмиття руху, тіні)	80-90%	70-85%	Якість зображення є вузьким місцем

Ключовий висновок полягає в тому, що ШІ підтримує вищу точність, ніж традиційний OCR, навіть при погіршенні умов, оскільки він може використовувати контекст для заповнення прогалин. Якщо система може прочитати «Всього» з наступним «$47.8_» (де остання цифра нечитабельна), вона знає з контексту, що це поле загальної суми, і відсутня цифра, ймовірно, «3», виходячи з рядків вище. Традиційний OCR просто видав би знак питання або свій найкращий здогад щодо одного символу.

Розрив у точності критичних полів

Не всі поля однаково важливі. Для управління витратами та податкової відповідності існує чітка ієрархія:

Поле	Пріоритет	Чому це важливо	Точність ШІ (чистий чек)
Загальна сума	Критично	Визначає вартість витрат та суму відрахування	98-99%
Дата	Критично	Визначає податковий рік та період	97-99%
Назва постачальника	Високий	Необхідно для категоризації та аудиторського сліду	95-98%
Сума податку	Високий	Потрібно для податкової звітності та кредитів з вхідного податку	96-98%
Спосіб оплати	Середній	Корисно для звірки з виписками по картці	93-96%
Позиції в списку	Середній	Потрібно для детальної категоризації витрат	88-95%
Сума чайових	Середній	Актуально для витрат на харчування, часто пишеться від руки	85-92%
Адреса/телефон	Низький	Рідко потрібно для обробки витрат	90-95%

Інструменти вилучення даних за допомогою ШІ стабільно досягають найвищої точності на полях, які мають найбільше значення — загальна сума та дата — оскільки ці поля мають сильні контекстні сигнали (позиція, форматування, навколишній текст), які модель може використовувати, навіть коли окремі символи неоднозначні.

Фактори, що впливають на точність

Розуміння того, що знижує точність, допомагає вам приймати кращі рішення щодо того, коли довіряти автоматизованому вилученню, а коли перевіряти вручну.

Якість зображення

Якість зображення — це найбільший контрольований фактор точності OCR. Різниця між ретельно зробленим знімком і поспішним фото може змінити точність полів на 15-20 процентних пунктів.

Фактор	Вплив на точність	Що робити
Роздільна здатність	Нижче 200 DPI точність різко падає	Використовуйте щонайменше 300 DPI; більшість камер телефонів перевищують це
Освітлення	Нерівномірне освітлення створює проблеми з контрастом	Використовуйте природне, розсіяне світло; уникайте прямого верхнього світла
Тіні	Тіні від рук/телефона затуляють текст	Розташуйте джерело світла збоку; використовуйте лампу за потреби
Спалах	Термопапір відбиває світло; спалах створює білі плями	Вимкніть спалах; використовуйте навколишнє світло замість цього
Фокус	Розмите зображення нечитабельне при будь-якій роздільній здатності	Натисніть на область тексту, щоб сфокусуватися; тримайте телефон нерухомо
Кут	Спотворення перспективи спотворює символи	Тримайте камеру прямо над чеком, паралельно поверхні
Обрізка	Надмірний фон заважає виявленню країв	Заповніть 80% кадру чеком

Стан паперу

Стан паперу — це найбільший неконтрольований фактор. Ви можете покращити якість зображення за допомогою техніки; ви не можете повернути вицвілий чек.

Термін вицвітання термочеків сильно залежить від умов зберігання:

Ідеальне зберігання (темно, прохолодно, 45-65% вологості): 5-7 років читабельності для стандартного класу, до 25 років для термопаперу з верхнім покриттям.
Нормальні умови (шухляда столу, файлова папка): 1-3 роки.
Гаманець або кишеня: 3-12 місяців.
Панель автомобіля або бардачок: тижні до місяців, залежно від клімату.
Пряме сонячне світло: дні до тижнів.

Практичний висновок очевидний: оцифровуйте чеки протягом 48 годин після отримання. Кожен день затримки зменшує максимально досяжну точність OCR. Чек, відсканований у день покупки, дасть майже бездоганні результати. Той самий чек, відсканований через шість місяців, може втратити 10-20% чіткості тексту.

Довжина та складність чека

Довші чеки з більшою кількістю позицій мають нижчу точність на рівні документа просто тому, що є більше можливостей для помилок. Чек з кав'ярні на 5 товарів має набагато вищий шанс бути на 100% правильним, ніж чек з продуктового магазину на 60 товарів.

Довжина чека	Середня кількість позицій	Точність документа (ШІ)	Поля, найімовірніше, з помилками
Короткий (1-5 товарів)	8-15 рядків	90-95%	Назва постачальника (скорочення)
Середній (6-20 товарів)	16-40 рядків	80-90%	Описи позицій в списку
Довгий (21-50 товарів)	41-80 рядків	70-82%	Кількість одиниць, ціни за одиницю
Дуже довгий (50+ товарів)	80+ рядків	55-70%	Кілька полів; кумулятивні помилки

Шрифт та форматування

Деякі POS-системи використовують власні або вузькі шрифти, які особливо складні для OCR. Матричні принтери чеків — все ще поширені на деяких заправках та в старих роздрібних магазинах — створюють символи нижчої якості, ніж термічні принтери. Форматування великими літерами, хоча й складніше для читання людьми, насправді легше для OCR-систем, оскільки великі літери мають більш виразні форми.

Точність за типом чека

Різні категорії чеків представляють унікальні виклики та дають різні профілі точності.

Чеки з ресторанів

Чеки з ресторанів є одними з найскладніших для OCR, оскільки вони часто містять елементи, написані від руки — сума чайових, загальна сума та підпис. Вилучення за допомогою ШІ добре обробляє друковані частини (95-98% точності полів для постачальника, дати, проміжного підсумку), але має труднощі з розпізнаванням рукописного тексту на рядках чайових (70-85% точності). Сума чайових часто є найважливішим полем, написаним від руки.

Найкраща практика: Якщо точність чайових важлива для вашого робочого процесу, перевіряйте суму чайових та загальну суму вручну. Проміжний підсумок, податок та поля постачальника зазвичай надійні без перевірки.

Роздрібні та продуктові чеки

Роздрібні чеки кидають виклик OCR через їхній обсяг. Типовий чек з продуктового магазину містить 30-60 позицій, кожна з описом, кількістю та ціною. Описи позицій часто скорочені (наприклад, «ОРГ КУРЯЧА ГРУДКА» замість «Органічна куряча грудка без кісток») і можуть містити внутрішні коди SKU, які виглядають як пошкоджений текст для OCR-системи.

Точність критичних полів (загальна сума, дата, постачальник) висока — 96-99%. Точність позицій у списку нижча — 85-92% — через скорочення та невідповідності форматування. Для цілей категоризації витрат загальна сума та постачальник зазвичай достатні — вам рідко потрібні всі позиції, переписані ідеально.

Чеки з АЗС

Чеки з АЗС короткі, але часто деградовані. Вони видаються на відкритих колонках, піддаються впливу погоди, обробляються руками в рукавичках або жирними руками, і часто одразу мнуться. Термопапір може бути нижчої якості, ніж той, що використовується в приміщенні. Точність полів для суми та дати зазвичай становить 90-96% для свіжих чеків, але знижується швидше, ніж у інших типів чеків, через вплив навколишнього середовища.

Онлайн-чеки та чеки з електронної пошти

Цифрові чеки — підтвердження електронною поштою, PDF-завантаження з онлайн-покупок, електронні чеки з цифрових POS-систем — є найлегшою категорією для OCR. Вони мають послідовне форматування, високий контраст, відсутність деградації паперу та передбачувані позиції полів. Точність полів зазвичай перевищує 98% для всіх полів, а точність документа досягає 92-97%.

Якщо у вас є можливість отримувати цифрові чеки, завжди обирайте їх. Вони повністю усувають проблему термопаперу та забезпечують найвищу точність вилучення даних.

Порівняння за типами чеків

Тип чека	Точність загальної суми	Точність дати	Точність постачальника	Точність позицій у списку	Середня загальна точність полів
Онлайн/електронна пошта (PDF)	99%	99%	98%	96%	98%
Свіжий роздрібний	98%	98%	96%	90%	95%
Свіжий ресторанний	97%	97%	95%	92%	93%
АЗС	95%	94%	92%	88%	91%
Старий термочек (6+ міс.)	88%	87%	82%	72%	82%
Вицвілий/пошкоджений	72%	70%	65%	50%	64%

Як PDFSub обробляє сканування чеків

Сканер чеків PDFSub використовує вилучення даних за допомогою ШІ для обробки чеків у будь-якому форматі — скани термопаперу, фотографії з телефону, PDF-завантаження та вкладення електронних чеків.

Що він вилучає

Сканер чеків визначає та вилучає структуровані дані з кожного чека:

Назва та адреса постачальника — включаючи номер магазину та місцезнаходження, якщо доступно.
Дата та час транзакції — з автоматичним визначенням формату дати (MM/DD, DD/MM, YYYY-MM-DD).
Позиції в списку — опис, кількість, ціна за одиницю та загальна сума за позицію для кожного товару.
Проміжний підсумок, податок та загальна сума — розділені на окремі поля для точності бухгалтерського обліку.
Спосіб оплати — готівка, кредитна картка (останні чотири цифри), дебет, мобільний платіж.
Валюта — автоматично визначається за символами та форматуванням.

Як він обробляє змінні макети

PDFSub не використовує шаблони. ШІ-двигун аналізує кожен чек незалежно, розуміючи структуру документа через контекст, а не через відображення координат. Це означає, що він працює з будь-яким макетом чека від будь-якого постачальника, у будь-якій країні, без необхідності попередньої конфігурації. Незалежно від того, завантажуєте ви чек з кав'ярні з Брукліна, чек з аптеки з Мюнхена чи чек з таксі з Токіо, процес вилучення даних буде однаковим.

Обробка та конфіденційність

Для цифрових PDF-чеків початкове вилучення тексту відбувається у вашому браузері — завантаження не потрібне. Для сканованих зображень або чеків, які потребують обробки ШІ, файл надсилається до двигуна вилучення, обробляється, і оригінал не зберігається після завершення вилучення.

Ви можете спробувати сканер чеків з 7-денною безкоштовною пробною версією — завантажте кілька чеків і порівняйте результати вилучення з оригіналами, щоб оцінити точність для ваших конкретних типів чеків. Скасувати можна будь-коли.

Поради для кращого сканування чеків

Ви можете значно покращити точність вилучення даних, дотримуючись кількох простих практик під час захоплення чеків.

Техніка захоплення

Використовуйте природне, розсіяне світло. Сканування біля вікна вдень дає кращі результати, ніж штучне верхнє освітлення. Мета — рівномірне освітлення без різких тіней.
Розмістіть чек на плоскій темній поверхні. Темний стіл або стільниця створюють контраст, що допомагає виявленню країв та розпізнаванню тексту. Уникайте сканування чеків на білих поверхнях — краї стають невидимими.
Тримайте камеру прямо над чеком. Розташуйте камеру паралельно до чека, щоб уникнути спотворення перспективи. Навіть невеликий кут може спотворити символи настільки, що знизить точність.
Вимкніть спалах. Термопапір відбиває світло. Спалах камери створює відблиски, які виглядають як білі плями для OCR-системи, часто прямо над найважливішим текстом.
Заповніть кадр. Чек повинен займати близько 80% зображення. Занадто багато фону — марна трата роздільної здатності. Занадто щільне кадрування ризикує обрізати текст по краях.
Натисніть на текст, щоб сфокусуватися. Автофокус часто фокусується на поверхні паперу, а не на надрукованому тексті. Натисніть на область тексту, щоб забезпечити чітке відображення символів.
Розгладьте складки та зморшки. Притисніть чек перед скануванням. Складки створюють тіні, які OCR-система може інтерпретувати як символи або розриви рядків. Якщо чек сильно зім'ятий, спробуйте спочатку потримати його під важкою книгою кілька хвилин.

Час

Скануйте протягом 48 годин. Термочеки починають деградувати негайно. Чим раніше ви їх захопите, тим вищою буде точність. Зробіть сканування чеків щоденною звичкою або звичкою наприкінці дня, а не щомісячним пакетним процесом.
Не чекайте дня пакетної обробки. Поширена практика збереження чеків на місяць, а потім їх одночасного сканування гарантує нижчу точність. Деякі з цих чеків чотири тижні провели в гаманці, кишені чи машині — весь час вицвітаючи.

Управління файлами

Зберігайте оригінальне зображення. Навіть після вилучення даних збережіть оригінальний скан або фото. Якщо вам потрібно буде повторно вилучити дані пізніше за допомогою покращеного інструменту, оригінальне зображення буде вашим джерелом правди.
Використовуйте формат PDF, коли це можливо. Якщо ваш додаток для сканування або телефон пропонує вивід у форматі PDF, надавайте йому перевагу над JPEG. PDF зберігає вищу якість і обробляє багатосторінкові чеки (наприклад, довгі продуктові чеки, які були відскановані двома частинами).

Коли варто перевіряти вручну

Вилучення даних за допомогою ШІ достатньо добре, щоб сліпо довіряти йому для чеків з низьким ризиком — кава за $4.50, парковка за $12. Але деякі ситуації вимагають ручної перевірки.

Завжди перевіряйте ці чеки

Чеки на суму понад $500. Фінансовий вплив помилки вилучення даних на чеку з високою вартістю виправдовує 30 секунд ручної перевірки.
Чеки, критично важливі для податків. Будь-який чек, який ви плануєте використовувати як податкове відрахування, слід перевірити. IRS вимагає документацію для окремих витрат понад $75, а неправильна сума відрахування може викликати запитання під час аудиту.
Чеки з рукописними елементами. Суми чайових, ручні коригування цін та рукописні нотатки все ще є найслабшою ланкою для вилучення даних за допомогою ШІ. Якщо чек містить рукописний текст, перевірте ці поля.
Вицвілі або пошкоджені чеки. Якщо ви ледве можете прочитати чек на власні очі, не довіряйте вилученню даних за допомогою ШІ без перевірки. Сильно деградовані чеки слід розглядати як приблизні, а не як авторитетні.
Чеки в іноземній валюті. Конвертація валюти та незнайомі формати чисел (крапки замість ком як роздільники десяткових знаків) можуть спричинити помилки вилучення даних. Перевіряйте суму та валюту на міжнародних чеках.

Вибірково перевіряйте ці чеки

Продуктові чеки з 20+ позиціями. Вибірково перевірте 3-5 позицій у списку та переконайтеся, що загальна сума відповідає їхньому підсумку. Якщо загальна сума правильна, окремі помилки в позиціях навряд чи вплинуть на ваш звіт про витрати.
Чеки від незнайомих постачальників. Перший чек від нового постачальника може дати нижчу точність, оскільки ШІ ще не бачив цього конкретного макета. Після перевірки першого, наступні чеки від того ж постачальника зазвичай надійніші.
Чеки, оброблені пакетом. Якщо ви обробляєте 50+ чеків одночасно, вибірково перевірте 10-15% з них. Якщо точність стабільно висока, ви можете довіряти решті.

Довіряйте без перевірки

Цифрові/електронні чеки з чистим форматуванням та стандартними макетами.
Свіжі чеки від великих роздрібних продавців, де загальна сума є круглим числом або відповідає вашій банківській виписці.
Чеки на суму менше $25, де вартість перевірки перевищує вартість потенційної помилки.

Економічне обґрунтування негайної оцифровки чеків

Дані про точність вказують на один переважний висновок: найкращий час для сканування чека — негайно. Кожен день затримки коштує точності, а точність, втрачена через вицвітання термопаперу, ніколи не може бути відновлена.

Розглянемо економіку:

Середня вартість чека, що підлягає відрахуванню: $35-75
Ймовірність вицвітання до нечитабельності OCR протягом 1 року: 30-50% (зберігання в гаманці)
Ймовірність втрати перед скануванням: 15-25% на місяць
Середня податкова економія на чек (за граничної ставки 25%): $8.75-18.75
Час на сканування одного чека за допомогою телефону: 5-10 секунд

Математика проста. 10-секундне сканування, яке зберігає податкове відрахування на $12, коштує $4,320 на годину еквівалентної продуктивності. Навіть якщо ви скануєте лише чеки з високою вартістю, віддача від інвестованого часу є величезною.

Додайте до рівняння вплив BPA — обробка термочеків передає вимірні кількості сполук бісфенолу через контакт зі шкірою — і аргумент на користь негайної оцифровки стає як фінансовим, так і пов'язаним зі здоров'ям. Європейський Союз вже почав поступово виводити BPA з термопаперу, а кілька штатів США прийняли або запропонували подібні обмеження.

Чого очікувати в майбутньому

Точність OCR чеків покращувалася приблизно на 2-3 процентних пункти на рік за останні п’ять років, головним чином завдяки досягненням у візуально-мовних моделях, а не в традиційній інженерії OCR. Поточне покоління інструментів вилучення даних за допомогою ШІ представляє значний поріг точності: вперше точність критичних полів на чистих чеках стабільно перевищує 97%, роблячи повністю автоматизовану обробку чеків життєздатною для більшості бізнес-процесів.

Залишені розриви в точності — рукописні чайові, сильно вицвілий термопапір, екзотичні формати POS — будуть продовжувати скорочуватися. Але проблема термопаперу є фізичною, а не обчислювальною. Жоден прогрес ШІ не відновить текст, який хімічно зник з поверхні паперу.

Практичне рішення залишається незмінним: захоплюйте рано, захоплюйте при хорошому освітленні та дозвольте ШІ обробляти вилучення даних. Для чеків, які мають найбільше значення, перевіряйте загальну суму. Для всього іншого довіряйте цифрам і рухайтеся далі.

Сканер чеків PDFSub обробляє чеки в будь-якому форматі, від будь-якого постачальника, будь-якою мовою. Почніть 7-денну безкоштовну пробну версію, щоб протестувати його на власних чеках — показники точності в цій статті є галузевими орієнтирами, і єдині цифри, які мають значення, — це ті, які ви бачите на власних документах.