PDFSub
মূল্যতালিকাAPIMergeCompressEditE-Signব্যাংক স্টেটমেন্টব্লগ
ব্লগে ফিরে যান

কীভাবে স্বয়ংক্রিয়ভাবে পিডিএফ চালান থেকে ডেটা বের করবেন

১ মার্চ, ২০২৬
T
Todd Lahman
Founder, PDFSub

ম্যানুয়াল চালান এন্ট্রি প্রতি চালানে $12-26 খরচ করে এবং প্রতিটিতে 10-30 মিনিট সময় নেয়। এখানে দেখুন কিভাবে AI এক্সট্রাকশন এটিকে সেকেন্ডে কমিয়ে আনে - এবং কীসের দিকে খেয়াল রাখতে হবে।


আপনার ইনবক্সে ৪৭টি চালান এসেছে। বিভিন্ন বিক্রেতা, বিভিন্ন লেআউট, বিভিন্ন মুদ্রা। প্রতিটির জন্য একই জিনিস প্রয়োজন: কাউকে বিক্রেতার নাম, চালানের নম্বর, তারিখ, লাইন আইটেম, ট্যাক্স এবং মোট পরিমাণ বের করতে হবে - তারপর সবকিছু আপনার অ্যাকাউন্টিং সফ্টওয়্যারে টাইপ করতে হবে।

প্রতিটি চালানের জন্য ১৫ মিনিট ধরে নিলে, এটি প্রায় ১২ ঘন্টার ডেটা এন্ট্রি। মাসের জন্য। প্রতি মাসে।

এটি হল অ্যাকাউন্টস পেয়েবল বট্‌লনেক যা অটোমেশন সমাধানের জন্য তৈরি করা হয়েছিল। কিন্তু সব এক্সট্রাকশন টুল সমান নয়। কিছুর জন্য প্রতিটি বিক্রেতার জন্য একটি টেমপ্লেট প্রয়োজন। কিছু সংবেদনশীল আর্থিক নথি আপনার নিয়ন্ত্রণের বাইরের সার্ভারে আপলোড করার প্রয়োজনীয়তা তৈরি করে। এবং কিছু গত সপ্তাহে আপনার ইতালীয় সরবরাহকারী পাঠানো চালান পরিচালনা করতে পারে না।

আসুন দেখি কি আসলে কাজ করে।

How AI invoice extraction compares across methods, accuracy, and cost

ম্যানুয়াল চালান প্রক্রিয়াকরণের আসল খরচ

টুলস নিয়ে কথা বলার আগে, সমস্যাটিকে সংখ্যায় প্রকাশ করা যাক।

আর্ডেন্ট পার্টনারস এবং এপি কিউ সি (APQC) গবেষণার মতে, একটি একক চালান ম্যানুয়ালি প্রক্রিয়া করতে $12.88 থেকে $26.00 খরচ হয় - এবং এটি কেবল ডেটা এন্ট্রি কর্মীর সময় নয়। এতে ত্রুটি সংশোধন, অনুমোদন রাউটিং, ব্যতিক্রম হ্যান্ডলিং এবং মাঝে মাঝে ডুপ্লিকেট পেমেন্ট যা এড়িয়ে যায়, তাও অন্তর্ভুক্ত।

এখানে স্কেলে সংখ্যাগুলি কেমন দেখায়:

চালানের পরিমাণ মাসিক ম্যানুয়াল খরচ মাসিক ম্যানুয়াল ঘন্টা অটোমেশন সহ
৫০/মাস $644 - $1,300 12 - 25 ঘন্টা $104 - $200
২০০/মাস $2,576 - $5,200 50 - 100 ঘন্টা $416 - $800
৫০০/মাস $6,440 - $13,000 125 - 250 ঘন্টা $1,040 - $2,000
১,০০০/মাস $12,880 - $26,000 250 - 500 ঘন্টা $2,080 - $4,000

অটোমেশন সহ এটি একটি 79-80% খরচ হ্রাস, আপনার এপি টিমের বিক্রেতা আলোচনা, প্রারম্ভিক পেমেন্ট ডিসকাউন্ট এবং স্প্রেডশীট না দেখার জন্য ফিরে পাওয়া সময় গণনা করা হয়নি।

প্রায় ২৫% এপি কর্মীর সময় ম্যানুয়াল এন্ট্রির ত্রুটি সংশোধনে ব্যয় হয়। এবং সেই ত্রুটিগুলি কেবল বিরক্তিকর নয় - ২০২১ সালে কোম্পানিগুলির ৭৯% পেমেন্ট জালিয়াতির চেষ্টা বা প্রকৃত ঘটনা রিপোর্ট করেছে, যেখানে ডুপ্লিকেট পেমেন্ট মোট খরচের ১% থেকে ২.৫% পর্যন্ত হয়।

চালান থেকে কোন ডেটা বের করা হয়?

আধুনিক এআই এক্সট্রাকশন চালান থেকে দুই ধরণের তথ্য বের করে:

হেডার-লেভেল ফিল্ড - প্রতিটি চালানের শীর্ষে থাকা "কে, কখন, এবং কত":

  • বিক্রেতা/সরবরাহকারীর নাম, ঠিকানা, ফোন, ইমেল এবং ট্যাক্স আইডি
  • চালানের নম্বর এবং তারিখ
  • নির্ধারিত তারিখ এবং পেমেন্টের শর্তাবলী
  • ক্রয় আদেশ (PO) রেফারেন্স
  • গ্রাহকের বিলিং এবং শিপিং ঠিকানা
  • মুদ্রা

লাইন-আইটেম বিবরণ - প্রকৃত পণ্য এবং পরিষেবা:

  • আইটেমের বিবরণ এবং SKU/পার্ট নম্বর
  • পরিমাণ এবং পরিমাপের একক
  • ইউনিট মূল্য এবং লাইন মোট
  • সাবটোটাল, ট্যাক্স পরিমাণ, এবং ট্যাক্স হার
  • শিপিং চার্জ এবং ছাড়
  • গ্র্যান্ড টোটাল / প্রদেয় পরিমাণ

সেরা টুলগুলি বিদ্যমান রেকর্ডের বিপরীতে এক্সট্রাক্ট করা ডেটা ক্রস-রেফারেন্সও করে, যা অমিল মোট, ডুপ্লিকেট চালানের নম্বর বা আপনার অনুমোদিত তালিকার সাথে মেলে না এমন বিক্রেতাদের ফ্ল্যাগ করে।

টেমপ্লেট-ভিত্তিক বনাম এআই-ভিত্তিক এক্সট্রাকশন

এটি চালান এক্সট্রাকশন জগতের সবচেয়ে গুরুত্বপূর্ণ পার্থক্য, এবং এটি নির্ভুলতা থেকে শুরু করে চলমান রক্ষণাবেক্ষণ খরচ পর্যন্ত সবকিছুকে প্রভাবিত করে।

টেমপ্লেট-ভিত্তিক এক্সট্রাকশন

প্রচলিত টুলগুলি নির্দিষ্ট জোন ব্যবহার করে - "চালানের নম্বর সর্বদা পিক্সেল স্থানাঙ্ক (420, 180) এ থাকে, মোট সর্বদা নীচের ডান কোণে থাকে।" আপনি প্রতিটি বিক্রেতার চালানের লেআউটের জন্য একটি টেমপ্লেট তৈরি করেন, এবং টুলটি সেই নির্দিষ্ট অবস্থানগুলি থেকে ডেটা পড়ে।

সমস্যা: প্রতিটি নতুন বিক্রেতার জন্য একটি নতুন টেমপ্লেট প্রয়োজন। যখনই কোনও বিক্রেতা তাদের চালান পুনরায় ডিজাইন করে, টেমপ্লেটটি ভেঙে যায়। আপনি যদি ৫০+ বিক্রেতাদের সাথে কাজ করেন, টেমপ্লেট রক্ষণাবেক্ষণ নিজেই একটি কাজ হয়ে দাঁড়ায়।

টেমপ্লেট-ভিত্তিক টুলগুলি সাধারণত তাদের টেমপ্লেটগুলির সাথে পুরোপুরি মেলে এমন চালানগুলিতে ৮৫-৯৫% নির্ভুলতা অর্জন করে। যে চালানগুলি মেলে না - শূন্য।

এআই-ভিত্তিক (টেমপ্লেট-ফ্রি) এক্সট্রাকশন

এআই এক্সট্রাকশন পৃষ্ঠায় ডেটা কোথায় বসে তা নিয়ে চিন্তা করে না। এটি পুরো নথিটি পড়ে, প্রতিটি উপাদানের শব্দার্থিক অর্থ বোঝে এবং প্রসঙ্গের উপর ভিত্তি করে ফিল্ডগুলি সনাক্ত করে: "'মোট' শব্দের পাশে এই সংখ্যাটি সম্ভবত মোট পরিমাণ।"

এই পদ্ধতি পরিচালনা করে:

  • কনফিগারেশন ছাড়াই নতুন বিক্রেতা
  • ভাঙা ছাড়াই লেআউট পরিবর্তন
  • বহুভাষিক চালান
  • হাতে লেখা টীকা
  • জটিল বহু-পৃষ্ঠার লাইন আইটেম টেবিল

এআই-ভিত্তিক টুলগুলি ধারাবাহিকভাবে বিভিন্ন চালান ফর্ম্যাটে ৯৫-৯৯%+ নির্ভুলতা অর্জন করে এবং আরও বেশি নথি প্রক্রিয়া করার সাথে সাথে সময়ের সাথে সাথে উন্নত হয়।

শিল্পটি निर्णायकভাবে এআই-ভিত্তিক এক্সট্রাকশনের দিকে সরে গেছে। ২০২৬ সালের মধ্যে, সমস্ত নেতৃস্থানীয় প্ল্যাটফর্ম - রোসাম, এবিবিওয়াই, ন্যানোনেটস, ডকসুুমো - এআই-ফার্স্ট। টেমপ্লেট-ভিত্তিক হল লিগ্যাসি।

Invoice extraction process comparison: manual vs template vs AI

এআই চালান এক্সট্রাকশন আসলে কিভাবে কাজ করে

সাধারণ ওয়ার্কফ্লোতে চারটি ধাপ রয়েছে:

ধাপ ১: আপলোড। আপনি চালানটি পিডিএফ হিসাবে সরবরাহ করেন - হয় একটি ডিজিটাল পিডিএফ (চালান সফ্টওয়্যার দ্বারা তৈরি) বা একটি স্ক্যান করা কাগজের চালান।

ধাপ ২: টেক্সট এক্সট্রাকশন। ডিজিটাল পিডিএফগুলির জন্য, টুলটি সরাসরি এমবেডেড টেক্সট পড়ে। স্ক্যান করা চালানের জন্য, ওসিআর (OCR) প্রথমে চিত্রটিকে টেক্সটে রূপান্তর করে। এই ধাপের গুণমান ডাউনস্ট্রিমের সবকিছু নির্ধারণ করে।

ধাপ ৩: এআই বিশ্লেষণ। এআই মডেলটি টেক্সট (বা স্ক্যান করা পিডিএফগুলির জন্য পুরো ডকুমেন্ট চিত্র) প্রক্রিয়া করে, প্রসঙ্গের উপর ভিত্তি করে ফিল্ডের ধরণগুলি সনাক্ত করে এবং ডেটা একটি পরিষ্কার JSON বা স্প্রেডশীট ফর্ম্যাটে গঠন করে।

ধাপ ৪: এক্সপোর্ট। আপনি কাঠামোগত ডেটা CSV, Excel, JSON হিসাবে বা সরাসরি আপনার অ্যাকাউন্টিং সফ্টওয়্যারে আমদানি হিসাবে পান।

টুলগুলির মধ্যে গুরুত্বপূর্ণ পার্থক্য হল ধাপ ২ এবং ৩ এর মধ্যে কী ঘটে। কিছু টুল প্রক্রিয়াকরণের জন্য সর্বদা আপনার নথি ক্লাউড সার্ভারে আপলোড করে। অন্যরা - যেমন PDFSub এর ইনভয়েস এক্সট্রাক্টর - প্রথমে ক্লায়েন্ট-সাইডে টেক্সট এক্সট্রাক্ট করার চেষ্টা করে, শুধুমাত্র স্ক্যান করা পিডিএফ হলে বা টেক্সটের গুণমান খারাপ হলে সার্ভার-সাইড এআই-তে যায়।

এটি দুটি কারণে গুরুত্বপূর্ণ: গোপনীয়তা (আপনার চালানের ডেটা আপনার ব্রাউজার ছেড়ে যায় না যদি না এটি প্রয়োজনীয় হয়) এবং খরচ (টেক্সট-ভিত্তিক এক্সট্রাকশন ভিশন-ভিত্তিক প্রক্রিয়াকরণের চেয়ে কম এআই রিসোর্স ব্যবহার করে)।

নির্ভুলতা: আসলে কী আশা করবেন

আসুন নির্ভুলতার সংখ্যা সম্পর্কে সৎ হই, কারণ বিপণনের দাবিগুলি সবসময় বাস্তবতার সাথে মেলে না।

ডিজিটাল পিডিএফ (সফ্টওয়্যার দ্বারা তৈরি)

যদি আপনার বিক্রেতারা QuickBooks, Xero, FreshBooks, বা কোনও ইনভয়েসিং টুল-এ তৈরি চালান পাঠান, আপনি ডিজিটাল পিডিএফ নিয়ে কাজ করছেন। এগুলিতে সঠিক অক্ষর পজিশনিং সহ এমবেডেড টেক্সট থাকে।

এই চালানগুলির জন্য, এআই এক্সট্রাকশন নির্ভুলতা সত্যিই চমৎকার:

  • হেডার ফিল্ড (বিক্রেতার নাম, চালানের নম্বর, তারিখ, মোট): ৯৭-৯৯%+
  • লাইন আইটেম (বিবরণ, পরিমাণ, মূল্য): ৯৩-৯৭%
  • মুদ্রা এবং ট্যাক্স সনাক্তকরণ: ৯৫-৯৯%

অবশিষ্ট ত্রুটিগুলি প্রায়শই প্রান্তিক কেস: অস্বাভাবিক তারিখ বিন্যাস, হেডার এবং "পূর্ববর্তী ব্যালেন্স" বিভাগে উভয়ই পরিমাণ, অথবা তিন লাইনে বিস্তৃত হওয়া লাইন আইটেম বিবরণ।

স্ক্যান করা কাগজের চালান

এখানেই নির্ভুলতা কমে যায়। এমনকি সেরা ওসিআর ত্রুটি তৈরি করে:

  • বিবর্ণ কালি বা কম-রেজোলিউশনের স্ক্যান অক্ষর সনাক্তকরণকে দুর্বল করে
  • কফির দাগ, স্ট্যাপল গর্ত এবং ভাঁজ ফাঁক তৈরি করে
  • হাতে লেখা নোট মুদ্রিত টেক্সটের উপর থাকে
  • "0" বনাম "O" এবং "1" বনাম "l" হল ক্লাসিক ওসিআর বিভ্রান্তির পয়েন্ট

স্ক্যান করা চালানগুলিতে ৮৮-৯৫% নির্ভুলতা আশা করুন, স্ক্যানের মানের উপর নির্ভর করে। গুরুত্বপূর্ণ চালানের জন্য, সর্বদা ম্যানুয়ালি মোট পরিমাণ যাচাই করুন।

বহুভাষিক চালান

আন্তর্জাতিক চালানগুলি আরও একটি জটিলতা যোগ করে:

  • তারিখের বিন্যাস ভিন্ন: 01/03/2026 মার্কিন যুক্তরাষ্ট্রে জানুয়ারী ৩, ইউরোপে মার্চ ১
  • সংখ্যার বিন্যাস ভিন্ন: ১.২৩৪,৫৬ (ইউরোপীয়) বনাম ১,২৩৪.৫৬ (মার্কিন)
  • মুদ্রার প্রতীকগুলি ওভারল্যাপ করে: ¥ জাপানি ইয়েন এবং চীনা ইউয়ান উভয়কেই বোঝায়
  • ট্যাক্স পরিভাষা পরিবর্তিত হয়: ভ্যাট, জিএসটি, এমডব্লিউএসটি (MwSt.), আইভিএ (IVA), টিভিএ (TVA)

এখানেই বেশিরভাগ এক্সট্রাকশন টুল ব্যর্থ হয়। PDFSub ইনভয়েস এক্সট্রাক্টর স্বয়ংক্রিয় বিন্যাস সনাক্তকরণ সহ ১৩০+ ভাষা পরিচালনা করে - চালানের উৎপত্তিস্থল নির্বিশেষে তারিখ, সংখ্যা এবং মুদ্রা সঠিকভাবে পার্স করা হয়।

চালান এক্সট্রাকশন টুলগুলির তুলনা

বাজার লক্ষ লক্ষ চালান প্রক্রিয়াকরণকারী এন্টারপ্রাইজ প্ল্যাটফর্ম থেকে শুরু করে প্রতি মাসে কয়েক ডজন পরিচালনা করা হালকা টুল পর্যন্ত বিস্তৃত। এখানে প্রধান বিকল্পগুলি কীভাবে স্ট্যাক করে:

এন্টারপ্রাইজ প্ল্যাটফর্ম ($500+/মাস)

রোসাম (Rossum) (~$1,500/মাস) উচ্চ-ভলিউম চালান প্রক্রিয়াকরণের জন্য বাজারের শীর্ষস্থানীয়। তাদের অরোরা ইঞ্জিন (Aurora Engine) জটিল লেআউট পরিচালনা করে এবং Coupa এবং প্রধান ERP-এর সাথে ইন্টিগ্রেশন এটিকে বড় সংস্থাগুলির জন্য একটি স্বাভাবিক পছন্দ করে তোলে। কিন্তু দামের ট্যাগ এটিকে ছোট ব্যবসা এবং একক হিসাবরক্ষকদের নাগালের বাইরে রাখে।

ABBYY FlexiCapture ৯৯.৫% ফিল্ড-লেভেল নির্ভুলতার দাবির সাথে এন্টারপ্রাইজ-গ্রেড ওসিআর (OCR) সরবরাহ করে। বহুভাষিক সমর্থন শক্তিশালী, এবং ক্লাউড এবং অন-প্রাঙ্গণ উভয় স্থাপনার বিকল্প বিদ্যমান। মূল্য কাস্টম এবং সাধারণত এন্টারপ্রাইজ-স্তরের।

Kofax ReadSoft চালান প্রক্রিয়াকরণে ২৫+ বছরের অভিজ্ঞতা রয়েছে। গভীর ERP ইন্টিগ্রেশন এবং মাল্টি-চ্যানেল ক্যাপচার (কাগজ, ইমেল, আপলোড) শক্তি। কিন্তু প্ল্যাটফর্মটি এআই-নেটিভ বিকল্পগুলির তুলনায় পুরনো মনে হয় এবং নির্ভুলতা নথি প্রকারের উপর নির্ভর করে ৮০-৯৫% পর্যন্ত পরিবর্তিত হয়।

মিড-মার্কেট প্ল্যাটফর্ম ($25-500/মাস)

ন্যানোনেটস (Nanonets) প্রি-ট্রেইনড ইনভয়েস মডেলের সাথে পে-অ্যাজ-ইউ-গো (pay-as-you-go) মূল্য সরবরাহ করে। আপনি মালিকানাধীন ফর্ম্যাটের জন্য কাস্টম মডেল প্রশিক্ষণ দিতে পারেন। প্ল্যাটফর্মটি বহুমুখী তবে মূলত নথি প্রক্রিয়াকরণ ওয়ার্কফ্লোগুলির জন্য ডিজাইন করা হয়েছে, সাধারণ পিডিএফ টুলগুলির জন্য নয়।

ডকসুুমো (Docsumo) উচ্চতর নির্ভুলতার জন্য মানব ক্রস-ভেরিফিকেশন সহ এআই এক্সট্রাকশনকে একত্রিত করে। ডেটা যাচাইকরণের প্রয়োজন কিন্তু সামান্য দীর্ঘ প্রক্রিয়াকরণের সময় গ্রহণ করতে পারে এমন ব্যবসার জন্য ভাল।

হালকা এবং বহু-উদ্দেশ্যমূলক টুল

PDFSub একটি ভিন্ন পদ্ধতি গ্রহণ করে। এটি একচেটিয়াভাবে একটি চালান প্রক্রিয়াকরণ প্ল্যাটফর্ম হওয়ার পরিবর্তে, এটি একটি ব্যাপক পিডিএফ টুল স্যুট যার ৯০+ টুল রয়েছে - এবং ইনভয়েস এক্সট্রাক্টর হল এর এআই-চালিত আর্থিক সরঞ্জামগুলির মধ্যে একটি।

এটি কেন বিবেচনা করার যোগ্য:

  • টেমপ্লেট-ফ্রি এআই এক্সট্রাকশন - যেকোনো বিক্রেতার চালানের ফর্ম্যাটের সাথে কাজ করে
  • গোপনীয়তা-প্রথম প্রক্রিয়াকরণ - প্রথমে আপনার ব্রাউজারে টেক্সট এক্সট্রাক্ট করে, শুধুমাত্র স্ক্যান করা নথির জন্য সার্ভার-সাইড এআই ব্যবহার করে
  • ১৩০+ ভাষা - স্বয়ংক্রিয় তারিখ, সংখ্যা এবং মুদ্রা ফর্ম্যাট সনাক্তকরণ সহ আন্তর্জাতিক চালান পরিচালনা করে
  • একাধিক এক্সপোর্ট ফর্ম্যাট - এপিআই (API) এবং ইন্টিগ্রেশনের জন্য JSON, স্প্রেডশীটের জন্য CSV
  • একটি বৃহত্তর টুলকিটের অংশ - ব্যাংক স্টেটমেন্ট রূপান্তর, রসিদ স্ক্যানিং, পিডিএফ তুলনা, অনুবাদ, এবং মোট ৮৪+ টুল একটি সাবস্ক্রিপশনে অন্তর্ভুক্ত
  • ৭-দিনের বিনামূল্যে ট্রায়াল - যেকোনো পেইড প্ল্যানে সমস্ত টুলে সম্পূর্ণ অ্যাক্সেস

ট্রেডঅফ: PDFSub প্রতিদিন ১০,০০০ চালান ERP ইন্টিগ্রেশন সহ প্রক্রিয়াকরণের জন্য তৈরি করা হয়নি। এটি হিসাবরক্ষক, বুককিপার এবং ছোট ব্যবসার জন্য তৈরি করা হয়েছে যাদের তাদের অন্যান্য পিডিএফ ওয়ার্কফ্লোগুলির পাশাপাশি প্রতি মাসে কয়েকশ চালানের নির্ভুল এক্সট্রাকশন প্রয়োজন।

ক্লাউড প্ল্যাটফর্ম এপিআই (API)

Microsoft Azure Document Intelligence, Amazon Textract, এবং Google Document AI সকলেই চালান এক্সট্রাকশন এপিআই (API) সরবরাহ করে। এগুলি শক্তিশালী তবে ইন্টিগ্রেট করার জন্য উন্নয়ন সংস্থান প্রয়োজন। মূল্য সাধারণত প্রতি পৃষ্ঠা ($1-15 প্রতি ১,০০০ পৃষ্ঠা), যা এটিকে স্কেলে সাশ্রয়ী করে তোলে তবে সেট আপ করা জটিল।

এদের জন্য সেরা: ডেভেলপার সহ দল যারা কাস্টম ইন্টিগ্রেশন তৈরি করতে পারে।

PDFSub কোন ফিল্ডগুলি এক্সট্রাক্ট করে

আপনি যখন PDFSub এর ইনভয়েস এক্সট্রাক্টর এ একটি চালান আপলোড করেন, তখন এআই নথিটি বিশ্লেষণ করে এবং কাঠামোগত ডেটা প্রদান করে যার মধ্যে রয়েছে:

  • চালানের নম্বর এবং চালানের তারিখ
  • প্রদেয় তারিখ এবং পেমেন্টের শর্তাবলী
  • বিক্রেতা/সরবরাহকারীর তথ্য - নাম, ঠিকানা, ফোন, ইমেল, ট্যাক্স আইডি
  • গ্রাহক/বিল-টু তথ্য - নাম এবং ঠিকানা
  • লাইন আইটেম - প্রতিটি আইটেমের জন্য বিবরণ, পরিমাণ, ইউনিট মূল্য এবং পরিমাণ
  • সাবটোটাল, ট্যাক্স (হার এবং পরিমাণ), ছাড়
  • প্রদেয় মোট পরিমাণ
  • মুদ্রা

আউটপুট কাঠামোগত JSON হিসাবে আসে যা আপনি সরাসরি ডাউনলোড করতে পারেন বা Excel, Google Sheets, বা আপনার অ্যাকাউন্টিং সফ্টওয়্যারে আমদানির জন্য CSV তে রূপান্তর করতে পারেন।

ডিজিটাল পিডিএফগুলির জন্য, এক্সট্রাকশন সাধারণত কয়েক সেকেন্ডে সম্পন্ন হয়। স্ক্যান করা চালানগুলি একটু বেশি সময় নেয় কারণ এআই-কে ডকুমেন্ট চিত্রটি প্রক্রিয়া করতে হয়।

ধাপে ধাপে: PDFSub দিয়ে চালান ডেটা এক্সট্রাক্ট করা

এখানে আসল ওয়ার্কফ্লো:

১. ইনভয়েস এক্সট্রাক্টরে যান pdfsub.com/tools/invoice-extractor এ অথবা স্টুডিও ড্যাশবোর্ডে এটি খুলুন ২. আপনার চালান পিডিএফ আপলোড করুন - ড্র্যাগ এবং ড্রপ করুন বা ব্রাউজ করতে ক্লিক করুন। ২০এমবি পর্যন্ত ফাইল সমর্থন করে। ৩. "Extract Invoice Data" ক্লিক করুন - এআই স্বয়ংক্রিয়ভাবে নথিটি প্রক্রিয়া করে ৪. এক্সট্রাক্ট করা ডেটা পর্যালোচনা করুন - নির্ভুলতার জন্য কাঠামোগত আউটপুট পরীক্ষা করুন ৫. আপনার ফলাফল ডাউনলোড করুন - স্প্রেডশীটের জন্য CSV হিসাবে বা সিস্টেম ইন্টিগ্রেশনের জন্য JSON হিসাবে সংরক্ষণ করুন

ব্যাচ প্রক্রিয়াকরণের জন্য, আপনি এক সেশনে একাধিক চালান আপলোড করতে পারেন। প্রতিটি চালান স্বাধীনভাবে প্রক্রিয়া করা হয় এবং এর নিজস্ব আউটপুট ফাইল তৈরি করে।

প্রো টিপ: যদি আপনার চালান একটি স্ক্যান (ফটোগ্রাফ বা স্ক্যান করা কাগজ) হয়, টুলটি স্বয়ংক্রিয়ভাবে ভিশন-ভিত্তিক এআই এক্সট্রাকশনে স্যুইচ করে। সেরা ফলাফলের জন্য, যখনই সম্ভব আপনার বিক্রেতার ইনভয়েসিং সিস্টেম থেকে সরাসরি ডাউনলোড করা ডিজিটাল পিডিএফ ব্যবহার করুন।

নির্ভুল চালান এক্সট্রাকশনের জন্য সেরা অনুশীলন

এআই থাকা সত্ত্বেও, কয়েকটি অভ্যাস আপনার ফলাফল উল্লেখযোগ্যভাবে উন্নত করে:

সম্ভব হলে ডিজিটাল পিডিএফ ব্যবহার করুন

যারা এখনও কাগজের চালান পাঠান তাদের সাথে যোগাযোগ করুন এবং ইলেকট্রনিক সংস্করণগুলির জন্য জিজ্ঞাসা করুন। বেশিরভাগ ইনভয়েসিং প্ল্যাটফর্ম (QuickBooks, Xero, FreshBooks, Wave) এমবেডেড টেক্সট সহ পিডিএফ চালান তৈরি করে যা পুরোপুরি এক্সট্রাক্ট হয়।

প্রথমবার ব্যবহারের সময় মোট পরিমাণ যাচাই করুন

যখন আপনি প্রথমবার কোনও নতুন বিক্রেতার চালান প্রক্রিয়া করেন, তখন মূল পিডিএফ-এর সাথে এক্সট্রাক্ট করা মোট পরিমাণগুলি স্পট-চেক করুন। এআই এক্সট্রাকশন অত্যন্ত নির্ভুল, তবে লেআউটের অদ্ভুততা যেকোনো টুলকে আটকে দিতে পারে। একবার আপনি কোনও বিক্রেতার ফর্ম্যাট কাজ করছে তা নিশ্চিত করলে, আপনি আত্মবিশ্বাসের সাথে তাদের ভবিষ্যতের চালানগুলি প্রক্রিয়া করতে পারেন।

আপনার এক্সপোর্ট ফর্ম্যাট স্ট্যান্ডার্ডাইজ করুন

একটি আউটপুট ফর্ম্যাট বেছে নিন এবং তাতে থাকুন। CSV বেশিরভাগ স্প্রেডশীট আমদানির জন্য কাজ করে। আপনি যদি কোনও এপিআই (API) বা ডাটাবেসে ডেটা ফিড করছেন তবে JSON ভাল। ওয়ার্কফ্লোর মাঝে ফর্ম্যাট পরিবর্তন করা অপ্রয়োজনীয় রূপান্তর সমস্যা তৈরি করে।

বহু-পৃষ্ঠার চালান সাবধানে পরিচালনা করুন

একাধিক পৃষ্ঠা জুড়ে থাকা চালান - বিশেষ করে যেগুলিতে কন্টিনিউয়েশন লাইন আইটেম রয়েছে - যেকোনো এক্সট্রাকশন টুলের জন্য সবচেয়ে কঠিন নথি। পরীক্ষা করুন যে সমস্ত পৃষ্ঠা থেকে সমস্ত লাইন আইটেম আউটপুটে এসেছে। মোট পরিমাণ চালানের গ্র্যান্ড টোটালের সাথে মিলতে হবে।

একটি যাচাইকরণ চেকলিস্ট রাখুন

উচ্চ-মূল্যের চালানের জন্য, এই দ্রুত চেকলিস্টটি ব্যবহার করুন:

  • মোট পরিমাণ কি পিডিএফ-এর সাথে মেলে?
  • সমস্ত লাইন আইটেম কি উপস্থিত আছে?
  • ট্যাক্স পরিমাণ কি সঠিক?
  • বিক্রেতার নাম এবং চালানের নম্বর কি সঠিক?
  • আন্তর্জাতিক চালানের জন্য মুদ্রা কি সঠিক?

এটি প্রতি চালানে ৩০ সেকেন্ড সময় নেয় এবং সেই ১-৩% কেসগুলি ধরে ফেলে যেখানে এআই এক্সট্রাকশনের জন্য মানুষের সংশোধনের প্রয়োজন।

কখন বিভিন্ন টুল ব্যবহার করবেন

প্রতিটি চালান ওয়ার্কফ্লোর একই টুলের প্রয়োজন হয় না:

পরিস্থিতি সেরা পদ্ধতি
বিভিন্ন বিক্রেতার কাছ থেকে প্রতি মাসে ৫০-৫০০ চালান PDFSub ইনভয়েস এক্সট্রাক্টর - টেমপ্লেট-ফ্রি, একাধিক এক্সপোর্ট ফর্ম্যাট
ERP ইন্টিগ্রেশন সহ প্রতি মাসে ১,০০০+ চালান রোসাম (Rossum) বা এবিবিওয়াই (ABBYY) - এন্টারপ্রাইজ ওয়ার্কফ্লো এবং গভীর ইন্টিগ্রেশন
একাধিক ভাষায় আন্তর্জাতিক চালান PDFSub - স্বয়ংক্রিয় ফর্ম্যাট সনাক্তকরণ সহ ১৩০+ ভাষা সমর্থন
চালানের বাইরে কাস্টম নথি প্রকার ন্যানোনেটস (Nanonets) বা ডকসুুমো (Docsumo) - প্রশিক্ষণযোগ্য এআই মডেল
কাস্টম ইন্টিগ্রেশন তৈরি করা ডেভেলপার Azure Document Intelligence বা Amazon Textract - এপিআই (API)
দ্রুত টার্নঅ্যারাউন্ড সহ এককালীন চালান PDFSub - সম্পূর্ণ এক্সট্রাকশনের জন্য ৭-দিনের বিনামূল্যে ট্রায়াল শুরু করুন

চালানের বাইরে: সম্পূর্ণ আর্থিক ওয়ার্কফ্লো

চালান এক্সট্রাকশন খুব কমই বিচ্ছিন্নভাবে বিদ্যমান। আপনি যদি চালান প্রক্রিয়া করেন, আপনি সম্ভবত এর সাথেও ডিল করছেন:

  • ব্যাংক স্টেটমেন্ট যা মেলানো দরকার - PDFSub এর ব্যাংক স্টেটমেন্ট কনভার্টার Excel, CSV, QBO, OFX, এবং অন্যান্য ৪টি ফর্ম্যাটে এক্সপোর্ট করে
  • রসিদ যা ব্যয় প্রতিবেদনের জন্য ডিজিটাইজ করা দরকার - এআই রসিদ স্ক্যানার কাগজ এবং ডিজিটাল রসিদ পরিচালনা করে
  • আর্থিক প্রতিবেদন যা বিশ্লেষণ করা দরকার - আর্থিক প্রতিবেদন বিশ্লেষক বার্ষিক প্রতিবেদন এবং পিএন্ডএল (P&L) বিবৃতি থেকে মূল মেট্রিকগুলি এক্সট্রাক্ট করে

এই সমস্ত টুলগুলি একটি প্ল্যাটফর্মে থাকা মানে একটি সাবস্ক্রিপশন, একটি লগইন, এবং আপনার সমস্ত আর্থিক নথিতে একটি সামঞ্জস্যপূর্ণ এক্সট্রাকশন গুণমান। তিনটি ভিন্ন নথির প্রকারের জন্য তিনটি ভিন্ন বিক্রেতার মধ্যে স্যুইচ করার প্রয়োজন নেই।

প্রায়শই জিজ্ঞাসিত প্রশ্নাবলী (FAQ)

এআই এক্সট্রাকশন কোন চালান ফর্ম্যাট সমর্থন করে?

এআই-ভিত্তিক এক্সট্রাকশন যেকোনো চালান লেআউটের সাথে কাজ করে - টেমপ্লেট তৈরি করার কোনও প্রয়োজন নেই। আপনার বিক্রেতা QuickBooks, Xero, FreshBooks, SAP, বা একটি কাস্টম লেআউট ব্যবহার করুক না কেন, এআই নির্দিষ্ট অবস্থানের পরিবর্তে প্রসঙ্গের উপর ভিত্তি করে ফিল্ডগুলি সনাক্ত করে। ডিজিটাল পিডিএফ এবং স্ক্যান করা কাগজের চালান উভয়ই সমর্থিত।

এআই চালান এক্সট্রাকশন কতটা নির্ভুল?

ডিজিটাল পিডিএফগুলির জন্য (ইনভয়েসিং সফ্টওয়্যার দ্বারা তৈরি), বিক্রেতার নাম, চালানের নম্বর এবং মোট পরিমাণের মতো হেডার ফিল্ডগুলিতে ৯৭-৯৯%+ নির্ভুলতা আশা করুন। লাইন আইটেম নির্ভুলতা সাধারণত ৯৩-৯৭%। স্ক্যান করা চালানগুলি কম, প্রায় ৮৮-৯৫%, স্ক্যানের মানের উপর নির্ভর করে। সর্বদা উচ্চ-মূল্যের চালানের মোট পরিমাণ যাচাই করুন।

একটি অনলাইন এক্সট্রাকশন টুলে চালান আপলোড করা কি নিরাপদ?

এটি টুল অনুসারে ব্যাপকভাবে পরিবর্তিত হয়। কিছু পরিষেবা আপনার নথিগুলি অনির্দিষ্টকালের জন্য তাদের সার্ভারে সংরক্ষণ করে। PDFSub প্রথমে আপনার ব্রাউজারে ক্লায়েন্ট-সাইডে টেক্সট প্রক্রিয়া করে - আপনার চালানের ডেটা আপনার ডিভাইস ছেড়ে যায় না যদি না পিডিএফ সার্ভার-সাইড এআই প্রক্রিয়াকরণের প্রয়োজন হয় (স্ক্যান করা নথি)। সার্ভার-প্রসেসড ফাইলগুলি বিচ্ছিন্নভাবে প্রক্রিয়া করা হয় এবং স্বয়ংক্রিয়ভাবে মুছে ফেলা হয়।

আমি কি ইংরেজির বাইরে অন্য ভাষায় চালান থেকে ডেটা এক্সট্রাক্ট করতে পারি?

বেশিরভাগ এক্সট্রাকশন টুল শুধুমাত্র ইংরেজি বা অল্প কয়েকটি ভাষা সমর্থন করে। PDFSub স্বয়ংক্রিয়ভাবে আন্তর্জাতিক তারিখ ফর্ম্যাট (DD/MM/YYYY বনাম MM/DD/YYYY), সংখ্যা ফর্ম্যাট (১.২৩৪,৫৬ বনাম ১,২৩৪.৫৬), এবং মুদ্রা প্রতীক সনাক্তকরণ সহ ১৩০+ ভাষা সমর্থন করে। এটি কোনও ম্যানুয়াল কনফিগারেশন ছাড়াই যেকোনো দেশের চালান পরিচালনা করে।

চালান এক্সট্রাকশন এবং ওসিআর (OCR) এর মধ্যে পার্থক্য কী?

ওসিআর (OCR) (অপটিক্যাল ক্যারেক্টার রিকগনিশন) টেক্সটের চিত্রগুলিকে মেশিন-পাঠযোগ্য অক্ষরে রূপান্তর করে - এটি উত্তর দেয় "এই পৃষ্ঠায় কোন অক্ষর আছে?" চালান এক্সট্রাকশন আরও এগিয়ে যায়: এটি নথির কাঠামো বোঝে এবং সনাক্ত করে কোন টেক্সট হল বিক্রেতার নাম, কোনটি মোট, এবং কোনটি লাইন আইটেম বিবরণ। আধুনিক এআই এক্সট্রাকশনে ওসিআর একটি ধাপ হিসাবে অন্তর্ভুক্ত থাকে তবে উপরে শব্দার্থিক বোঝাপড়া যোগ করে।

আমি কিভাবে বহু-পৃষ্ঠার চালান পরিচালনা করব?

সম্পূর্ণ বহু-পৃষ্ঠার পিডিএফ আপলোড করুন - এটিকে পৃথক পৃষ্ঠাগুলিতে বিভক্ত করবেন না। এআই এক্সট্রাকশন সমস্ত পৃষ্ঠাগুলি একসাথে প্রক্রিয়া করে এবং পৃষ্ঠা বিরতি জুড়ে কন্টিনিউয়েশন লাইন আইটেমগুলি সংযুক্ত করে। এক্সট্রাকশনের পরে, লাইন আইটেমের সংখ্যা এবং গ্র্যান্ড টোটাল মূল চালানের সাথে মেলে কিনা তা যাচাই করুন।

শুরু করা

আপনি যদি এখনও হাতে চালান ডেটা টাইপ করেন, তবে হিসাবটি সহজ: প্রতি মাসে ৫০টি চালান হলেও, আপনি ১২+ ঘন্টা এবং $644+ ব্যয় করছেন এমন কাজের জন্য যা এআই মিনিটে পরিচালনা করে।

PDFSub এর ইনভয়েস এক্সট্রাক্টর চেষ্টা করুন - সম্পূর্ণ অ্যাক্সেস সহ একটি ৭-দিনের বিনামূল্যে ট্রায়াল শুরু করুন। একটি চালান আপলোড করুন, এক্সট্রাক্ট করা ডেটা দেখুন, এবং একটি পেইড প্ল্যানে প্রতিশ্রুতিবদ্ধ হওয়ার আগে নির্ভুলতা আপনার চাহিদা পূরণ করে কিনা তা সিদ্ধান্ত নিন।

উচ্চতর ভলিউম প্রক্রিয়াকরণকারী দলগুলির জন্য, PDFSub এর পেইড প্ল্যানগুলিতে অতিরিক্ত এআই ক্রেডিট, ব্যাচ প্রক্রিয়াকরণ এবং আর্থিক এক্সট্রাকশন সরঞ্জামগুলির পাশাপাশি সম্পূর্ণ ৯০+ পিডিএফ টুলের স্যুট অন্তর্ভুক্ত রয়েছে।

ব্লগে ফিরে যান

প্রশ্ন আছে? আমাদের সাথে যোগাযোগ করুন

PDFSub

আপনার প্রয়োজনীয় সকল PDF এবং ডকুমেন্ট টুলস এক জায়গায়। দ্রুত, নিরাপদ এবং ব্যক্তিগত গোপনীয়তা বজায় রাখে।

GDPR অনুগতCCPA অনুগতSOC 2 প্রস্তুত
PDFSub Engine দ্বারা চালিত

প্রোডাক্ট

  • সকল টুলস
  • ফিচারসমূহ
  • ব্যাংক স্টেটমেন্ট
  • API
  • মূল্যতালিকা
  • সচরাচর জিজ্ঞাসিত প্রশ্ন
  • ব্লগ

সাপোর্ট

  • আমাদের সম্পর্কে
  • হেল্প সেন্টার
  • যোগাযোগ
  • সচরাচর জিজ্ঞাসিত প্রশ্ন

লিগ্যাল

  • গোপনীয়তা নীতি
  • সেবার শর্তাবলী
  • কুকি নীতি

© 2026 PDFSub. সর্বস্বত্ব সংরক্ষিত।

বিশ্বের সকল মানুষের জন্য দিয়ে আমেরিকায় তৈরি