PDFSub
মূল্য নির্ধারণMergeSplitCompressEditE-Signব্যাংক স্টেটমেন্ট
ব্লগে ফিরে যান
গাইডএআই (AI)ওসিআর (OCR)আর্থিক নথিডেটা এক্সট্রাকশন

কেন এআই (AI) আর্থিক নথিপত্রের জন্য ওসিআর (OCR)-কে ছাড়িয়ে যায়

২ মার্চ, ২০২৬
PDFSub Team

ওসিআর (OCR) একটি স্ক্যান করা পৃষ্ঠা থেকে পাঠ্য পড়তে পারে, কিন্তু এটি লেনদেনের পরিমাণ এবং চলমান ব্যালেন্সের মধ্যে পার্থক্য করতে পারে না। ব্যাংক স্টেটমেন্ট, চালান এবং রসিদের জন্য এআই (AI)-চালিত এক্সট্রাকশন কেন অনেক ভালো ফলাফল দেয় তা এখানে আলোচনা করা হলো।


আপনি একটি ব্যাংক স্টেটমেন্ট স্ক্যান করেন, এটি ওসিআর (OCR) এর মাধ্যমে চালান এবং একটি বিশাল টেক্সট পান। অক্ষরগুলো বেশিরভাগই সঠিক। সংখ্যাগুলোও ঠিক আছে। কিন্তু যখন আপনি সেই ডেটা এক্সেল (Excel) বা আপনার অ্যাকাউন্টিং সফ্টওয়্যারে আমদানি করার চেষ্টা করেন, তখন সবকিছু ভেঙে পড়ে। তারিখগুলো কেবল স্ট্রিং। পরিমাণের কোনো চিহ্ন নেই। বিবরণ পরবর্তী কলামে চলে যায়। এবং চলমান ব্যালেন্স লেনদেনের পরিমাণের সাথে মিশে যায়।

এটিই ওসিআর (OCR) ব্যবধান — পৃষ্ঠার অক্ষর শনাক্ত করার এবং সেই অক্ষরগুলির অর্থ বোঝার মধ্যে দূরত্ব।

কয়েক দশক ধরে, অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) কাগজের নথি ডিজিটাইজ করার জন্য স্ট্যান্ডার্ড পদ্ধতি হিসেবে ব্যবহৃত হয়ে আসছে। এবং সহজ কাজের জন্য — একটি পরিষ্কার স্ক্যান থেকে একটি একক লাইনের পাঠ্য পড়া — এটি যথেষ্ট ভাল কাজ করে। কিন্তু আর্থিক নথি সহজ নয়। এগুলি ঘন, কাঠামোগত, বহু-কলামের বিন্যাস যা এমন সংখ্যায় ভরা থাকে যা দেখতে একই রকম কিন্তু সম্পূর্ণ ভিন্ন অর্থ বহন করে। একটি চলমান ব্যালেন্স একটি লেনদেনের পরিমাণ নয়। একটি বিভাগ শিরোনাম একটি প্রাপকের নাম নয়। একটি উপমোট একটি লাইন আইটেম নয়।

এআই (AI)-চালিত নথি এক্সট্রাকশন এই ব্যবধান পূরণ করে। কেবল অক্ষর শনাক্ত করার পরিবর্তে, এটি নথির কাঠামো, ফিল্ডের সম্পর্ক এবং আর্থিক প্রেক্ষাপট বোঝে। নির্ভুলতা এবং ব্যবহারযোগ্যতার পার্থক্য নগণ্য নয় — এটি বৈপ্লবিক।

এই গাইডটি ব্যাখ্যা করে যে ওসিআর (OCR) আসলে কী করে, আর্থিক নথিতে এটি কোথায় ব্যর্থ হয়, এআই (AI) কী যুক্ত করে এবং আপনার ওয়ার্কফ্লোর জন্য সঠিক পদ্ধতিটি কীভাবে বেছে নেবেন।

AI vs Traditional OCRAI vs OCR for Financial DocumentsModern Extraction vs Legacy ScanningTraditional OCRLow Accuracy on Tables (60-75%)No Contextual UnderstandingRigid Format RequirementsFails on Handwriting & Scans!Template Setup per Format!High Maintenance OverheadCharacter-Level Only60-75% AccuracyvsAI-Powered99%+ Accuracy on All FormatsUnderstands Document ContextAny Layout or FormatHandles Scans & HandwritingZero Configuration NeededSelf-Improving Over TimeSemantic Understanding99%+ AccuracyAI extraction understands document context — not just character patterns

ওসিআর (OCR) আসলে কী করে (এবং কী করে না)

OCR মানে অপটিক্যাল ক্যারেক্টার রিকগনিশন। এর মূল কাজ হলো: ছবির মতো পাঠ্যকে মেশিন-পাঠযোগ্য পাঠ্যে রূপান্তর করা। আপনি এটিকে একটি পৃষ্ঠার ছবি দেন এবং এটি সেখানে থাকা অক্ষরগুলো আপনাকে ফেরত দেয়।

এটি সত্যিই দরকারী। ওসিআর (OCR) এর আগে, স্ক্যান করা নথি থেকে ডেটা পাওয়ার একমাত্র উপায় ছিল ম্যানুয়ালি টাইপ করা। ওসিআর (OCR) "পড়ার" ধাপটি স্বয়ংক্রিয় করে — পিক্সেল প্যাটার্ন থেকে অক্ষর, সংখ্যা এবং প্রতীক শনাক্ত করা।

ঐতিহ্যবাহী ওসিআর (OCR) কীভাবে কাজ করে

ঐতিহ্যবাহী ওসিআর (OCR) ইঞ্জিন একটি অনুমানযোগ্য পাইপলাইন অনুসরণ করে:

  1. চিত্র প্রিপ্রসেসিং — কনট্রাস্ট সামঞ্জস্য করা, নয়েজ সরানো, চিত্রটি সোজা করা এবং রেজোলিউশন স্বাভাবিক করা।
  2. ক্যারেক্টার সেগমেন্টেশন — চিত্রটিকে ব্লক, তারপর লাইন এবং তারপর পৃথক অক্ষরে ভাগ করা।
  3. প্যাটার্ন ম্যাচিং — প্রতিটি অক্ষরকে পরিচিত আকারের লাইব্রেরির সাথে টেমপ্লেট ম্যাচিং বা পরিসংখ্যানগত ক্লাসিফায়ার ব্যবহার করে তুলনা করা।
  4. পোস্ট-প্রসেসিং — স্পষ্ট ত্রুটিগুলি সংশোধন করার জন্য ভাষা মডেল বা অভিধান পরীক্ষা প্রয়োগ করা (যেমন, "0" বনাম "O", "1" বনাম "l")।
  5. টেক্সট আউটপুট — আনুমানিক অবস্থান স্থানাঙ্ক সহ অক্ষরের একটি স্ট্রিং ফেরত দেওয়া।

কী অনুপস্থিত তা লক্ষ্য করুন: সেই অক্ষরগুলি কী উপস্থাপন করে সে সম্পর্কে কোনও বোঝাপড়া নেই। ওসিআর (OCR) "12/15/2025" কে একটি তারিখ হিসাবে নয়, কেবল অঙ্ক এবং স্ল্যাশের একটি ক্রম হিসাবে দেখে। এটি "$4,521.30" কে একটি ডলার চিহ্ন হিসাবে দেখে, কেবল অঙ্ক, কমা এবং একটি পিরিয়ড হিসাবে নয় — একটি আর্থিক পরিমাণ হিসাবে নয়। এটি "Beginning Balance" কে দুটি ইংরেজি শব্দ হিসাবে দেখে — কেবল একটি আর্থিক সারাংশের শুরু নির্দেশকারী একটি ফিল্ড লেবেল হিসাবে নয়।

ওসিআর (OCR) একটি অক্ষর শনাক্তকরণ ব্যবস্থা, কোনও নথি বোঝার ব্যবস্থা নয়। এই পার্থক্যটি প্রতিটি সমস্যার মূল যা অনুসরণ করে।

ওসিআর (OCR) নির্ভুলতার সীমা: জানার মতো সংখ্যা

ওসিআর (OCR) বিক্রেতারা ৯০% এর বেশি নির্ভুলতার হার প্রচার করতে পছন্দ করে। এবং নিয়ন্ত্রিত পরিস্থিতিতে — পরিষ্কার প্রিন্ট, স্ট্যান্ডার্ড ফন্ট, একক-কলাম লেআউট — সেই সংখ্যাগুলি বাস্তব। কিন্তু নির্ভুলতা পরিমাপের পদ্ধতি অত্যন্ত গুরুত্বপূর্ণ।

ক্যারেক্টার-লেভেল বনাম ফিল্ড-লেভেল নির্ভুলতা

বেশিরভাগ প্রকাশিত ওসিআর (OCR) নির্ভুলতার হার ক্যারেক্টার-লেভেল নির্ভুলতা পরিমাপ করে: পৃথক অক্ষরগুলির শতাংশ সঠিকভাবে স্বীকৃত। ৯৭% ক্যারেক্টার নির্ভুলতার হার চমৎকার শোনায় যতক্ষণ না আপনি একটি আর্থিক নথির উপর গণনা করেন।

একটি সাধারণ ব্যাংক স্টেটমেন্ট পৃষ্ঠায় প্রায় ২,০০০–৩,০০০ অক্ষর থাকে। ৯৭% নির্ভুলতায়, প্রতি পৃষ্ঠায় ৬০–৯০ টি অক্ষর ভুল থাকে। এখন বিবেচনা করুন যে একটি লেনদেনের পরিমাণে একটি একক ভুল অঙ্ক — যেমন "$1,523.40" কে "$1,523.10" হিসাবে পড়া — পুরো ডেটা পয়েন্টটিকে পুনর্মিলনের জন্য অকেজো করে তোলে।

ফিল্ড-লেভেল নির্ভুলতা — একটি সম্পূর্ণ ডেটা ফিল্ড (তারিখ, পরিমাণ, বিবরণ) সঠিকভাবে বের করা হয়েছে কিনা — ক্যারেক্টার-লেভেল নির্ভুলতার তুলনায় উল্লেখযোগ্যভাবে হ্রাস পায়। শিল্প গবেষণা দেখায় যে একটি ২% ক্যারেক্টার ত্রুটির হার জটিল আর্থিক নথি প্রক্রিয়াকরণের সময় ১৫–২০% তথ্য এক্সট্রাকশন ত্রুটিতে অনুবাদ হতে পারে। এটি "বেশিরভাগ সঠিক" এবং "ম্যানুয়াল পর্যালোচনার প্রয়োজন" এর মধ্যে পার্থক্য।

ওসিআর (OCR) ইঞ্জিনের নির্ভুলতার মানদণ্ড

বাস্তব-বিশ্বের পরিস্থিতিতে (পরিষ্কার পরীক্ষার ছবির উপর ভিত্তি করে বিপণন দাবির উপর নয়) আর্থিক নথিতে প্রধান ওসিআর (OCR) ইঞ্জিনগুলি কীভাবে পারফর্ম করে তা এখানে:

ওসিআর (OCR) ইঞ্জিন ক্যারেক্টার নির্ভুলতা (পরিষ্কার প্রিন্ট) ক্যারেক্টার নির্ভুলতা (আর্থিক নথি) কার্যকর ফিল্ড-লেভেল নির্ভুলতা
Tesseract (ওপেন সোর্স) ৯৫%+ (প্রিপ্রসেসিং সহ) ৮৫–৯২% ৬০–৭৫%
ABBYY FineReader ৯৯.৩–৯৯.৮% ৯৪–৯৭% ৮০–৯০%
Google Cloud Vision ৯৮%+ ৯৫–৯৮% ৮২–৯২%
Amazon Textract ৯৭%+ ৯৩–৯৭% ৮০–৯০%
Azure AI Document Intelligence ৯৭%+ ৯৩–৯৬% ৭৮–৮৮%

কয়েকটি বিষয় লক্ষণীয়:

Tesseract, সর্বাধিক ব্যবহৃত ওপেন-সোর্স ওসিআর (OCR) ইঞ্জিন, আর্থিক নথির সাথে লড়াই করে। এর নির্ভুলতা পরিষ্কার প্রিন্টে ৯৫%+ থেকে ব্যাংক স্টেটমেন্ট এবং জটিল লেআউট সহ চালানে ৮৫–৯২% এ নেমে আসে। একটি আর্থিক প্রতিষ্ঠান বিভিন্ন ফন্ট এবং লেআউটে ৭০% পর্যন্ত প্রাথমিক নির্ভুলতা রিপোর্ট করেছে, যা ব্যাপক চিত্র প্রিপ্রসেসিংয়ের পরে কেবল ৯২% এ পৌঁছেছে।

বাণিজ্যিক ইঞ্জিনগুলি (ABBYY, Google, Amazon, Azure) উল্লেখযোগ্যভাবে ভাল পারফর্ম করে, তবে ৯৭% ক্যারেক্টার নির্ভুলতায়ও, কার্যকর ফিল্ড-লেভেল এক্সট্রাকশন হার ৮০–৯০% এর কাছাকাছি থাকে। এর মানে হল প্রতি ৫ থেকে ১০ টি এক্সট্রাক্ট করা ফিল্ডে ত্রুটি থাকতে পারে। ৫০ টি লেনদেন সহ একটি ব্যাংক স্টেটমেন্টের জন্য, এর মানে হল ৫ থেকে ১০ টি লেনদেন ম্যানুয়াল সংশোধনের প্রয়োজন।

ওসিআর (OCR) ত্রুটির লুকানো খরচ

শিল্প বিশ্লেষণ ওসিআর (OCR) ত্রুটির বাস্তব-বিশ্বের খরচ প্রেক্ষাপটে রাখে। বড় পরিমাণে আর্থিক নথি প্রক্রিয়াকরণকারী উদ্যোগগুলির জন্য, ডেটা এক্সট্রাকশনে ৩% ত্রুটির হার উল্লেখযোগ্য ডাউনস্ট্রিম খরচের দিকে পরিচালিত করে — প্রতিটি ত্রুটি ম্যানুয়াল পুনর্মিলনের মাধ্যমে খুঁজে বের করতে এবং সংশোধন করতে $৫০–$১৫০ খরচ হয়। ৫০% এর বেশি ওসিআর (OCR) প্রক্রিয়াকৃত আর্থিক নথির ডেটা বিশ্বাসযোগ্য হওয়ার আগে এখনও কোনও না কোনও ধরণের মানব যাচাইকরণের প্রয়োজন হয়।

কেন ওসিআর (OCR) একা আর্থিক নথিতে ব্যর্থ হয়

AI Extraction vs. OCR: Capabilities ComparedTraditional OCRAI-Powered ExtractionCharacter recognitionYesYesMulti-column table parsingPoorExcellentField-level accuracy60–90%95–99%Running balance vs. amountCannot distinguishCorrectly classifiedMulti-line descriptionsPhantom rowsMerged correctlySection headers excludedNoYesInternational formatsManual post-processNative supportTemplates requiredYes (per format)NoTime per document30–60 min (+ cleanup)Under 1 minOCR sees characters — AI understands meaning, structure, and financial context

উপরের নির্ভুলতার সংখ্যাগুলি গল্পের একটি অংশ বলে। কিন্তু গভীর সমস্যাটি কেবল ওসিআর (OCR) অক্ষরগুলি ভুল পায় তা নয় — এটি হল ওসিআর (OCR) এর কাছে সেই অক্ষরগুলির অর্থ কী তা বোঝার কোনও ধারণা নেই। আর্থিক নথিতে ঐতিহ্যবাহী ওসিআর (OCR) কে ভেঙে দেয় এমন নির্দিষ্ট চ্যালেঞ্জগুলি এখানে রয়েছে।

১. বহু-কলাম লেআউট

ব্যাংক স্টেটমেন্ট প্রায় সবসময়ই বহু-কলামের হয়। একটি সাধারণ স্টেটমেন্টে তারিখ, বিবরণ, উত্তোলন, জমা এবং চলমান ব্যালেন্সের জন্য কলাম থাকে। ওসিআর (OCR) ইঞ্জিনগুলি বাম থেকে ডানে, উপর থেকে নিচে পাঠ্য প্রক্রিয়া করে — যার অর্থ তারা প্রায়শই সংলগ্ন কলাম থেকে ডেটা একক লাইনে একত্রিত করে।

স্টেটমেন্টে যা দেখানো হয়:

12/15/2025  Amazon Purchase    -$45.99              $2,341.67
12/16/2025  Direct Deposit               $3,200.00  $5,541.67

ওসিআর (OCR) প্রায়শই যা আউটপুট দেয়:

12/15/2025 Amazon Purchase -$45.99 $2,341.67
12/16/2025 Direct Deposit $3,200.00 $5,541.67

কলামগুলির মধ্যে ফাঁকা স্থান চলে গেছে। কোন সংখ্যাটি ডেবিট, কোনটি ক্রেডিট এবং কোনটি ব্যালেন্স তা বলার কোনও উপায় নেই। একজন মানুষ প্রসঙ্গ থেকে এটি বের করতে পারে। ওসিআর (OCR) পারে না।

২. চলমান মোট বনাম লেনদেনের পরিমাণ

প্রতিটি ব্যাংক স্টেটমেন্টে লেনদেনের পরিমাণ এবং চলমান ব্যালেন্স উভয়ই থাকে। এগুলি এমন সংখ্যা যা ফরম্যাটে একই রকম দেখায় তবে সম্পূর্ণ ভিন্ন অর্থ বহন করে। ওসিআর (OCR) পৃষ্ঠায় "$2,341.67" দুবার দেখে এবং উভয় উদাহরণকে একই ভাবে বিবেচনা করে। "এই সংখ্যাটি একটি ব্যালেন্স" বনাম "এই সংখ্যাটি একটি পেমেন্ট" এর মধ্যে এর কোনও ধারণা নেই।

যদি আপনার এক্সট্রাকশন প্রক্রিয়া লেনদেনের কলামের পরিবর্তে ব্যালেন্স কলামটি নেয় — বা আরও খারাপ, উভয়কে একত্রিত করে — আপনার পুনর্মিলন অবিলম্বে ভুল হবে।

৩. বহু-লাইন বিবরণ

লেনদেনের বিবরণ প্রায়শই একাধিক লাইন জুড়ে থাকে:

12/15/2025  AMAZON.COM*RT4K2
            AMZN.COM/BILL WA
            Card ending in 4521       -$45.99    $2,341.67

ওসিআর (OCR) প্রতিটি শারীরিক লাইনকে একটি পৃথক সত্তা হিসাবে বিবেচনা করে। এটি জানার কোনও উপায় নেই যে লাইন ১-৩ সবই একই লেনদেনের বিবরণের অংশ। ফলাফল হল ফ্যান্টম সারি — যেখানে একটি হওয়া উচিত সেখানে তিনটি "লেনদেন", শুধুমাত্র তৃতীয় লাইনে পরিমাণ দেখা যাচ্ছে।

৪. বিভাগ শিরোনাম বনাম ডেটা সারি

আর্থিক নথি বিভাগ শিরোনাম, উপমোট এবং সারাংশ সারি দিয়ে পূর্ণ:

CHECKING ACCOUNT - ACCOUNT ENDING IN 7234
Statement Period: 12/01/2025 - 12/31/2025

Beginning Balance                              $1,234.56
  12/01  Transfer from Savings      $500.00    $1,734.56
  12/03  Electric Company          -$142.30    $1,592.26
Ending Balance                                 $1,592.26

ওসিআর (OCR) "Beginning Balance $1,234.56" এবং "Ending Balance $1,592.26" কে আসল লেনদেনের মতোই পড়ে। এটি জানে না যে এগুলি সারাংশ সারি যা লেনদেনের তালিকা থেকে বাদ দেওয়া উচিত। শব্দার্থিক বোঝাপড়া ছাড়া, এই ফ্যান্টম এন্ট্রিগুলি আপনার ডেটা দূষিত করে।

৫. মুদ্রা প্রতীক এবং আন্তর্জাতিক সংখ্যা বিন্যাস

দেশের উপর নির্ভর করে আর্থিক নথিতে বিভিন্ন সংখ্যা বিন্যাস ব্যবহার করা হয়:

বিন্যাস ব্যবহৃত হয় উদাহরণ
1,234.56 মার্কিন যুক্তরাষ্ট্র, যুক্তরাজ্য, অস্ট্রেলিয়া, জাপান $1,234.56
1.234,56 জার্মানি, ফ্রান্স, ব্রাজিল, স্পেন 1.234,56 EUR
1 234,56 সুইডেন, নরওয়ে, পোল্যান্ড 1 234,56 kr
12,34,567.89 ভারত Rs 12,34,567.89

ওসিআর (OCR) কাঁচা অক্ষরগুলি ফেরত দেয় — "1.234,56" — এবং এটি আপনার উপর ছেড়ে দেয় যে পিরিয়ডটি হাজার হাজার বিভাজক নাকি দশমিক বিন্দু তা খুঁজে বের করতে। এটি ভুল করলে আপনার পরিমাণ ১,০০০ গুণ বেশি হবে।

৬. ঋণাত্মক সংখ্যা এবং ডেবিট সূচক

আর্থিক নথিতে কমপক্ষে ছয়টি ভিন্ন উপায়ে ঋণাত্মক পরিমাণ উপস্থাপন করা হয়:

  • বিয়োগ চিহ্ন: -$45.99
  • বন্ধনী: ($45.99)
  • "DR" প্রত্যয়: $45.99 DR
  • লাল লেখা (ওসিআর (OCR) এ হারিয়ে যায়)
  • পৃথক ডেবিট কলাম
  • বিপরীত দিকে "CR": $45.99 CR মানে ক্রেডিট, অনুপস্থিতি মানে ডেবিট

ওসিআর (OCR) অক্ষরগুলি ক্যাপচার করে তবে অ্যাকাউন্টিং কনভেনশন ব্যাখ্যা করে না। এটি আপনাকে বলতে পারে না যে "$45.99" টাকা আসছে নাকি যাচ্ছে তা নথির বিন্যাস এবং কনভেনশনগুলি না বুঝে।

ওসিআর (OCR) এর উপরে এআই (AI) কী যুক্ত করে

এআই (AI)-চালিত নথি এক্সট্রাকশন ওসিআর (OCR) কে প্রতিস্থাপন করে না — এটি এর উপর ভিত্তি করে তৈরি হয়। পৃষ্ঠা থেকে পাঠ্য এখনও পড়ার প্রয়োজন। পার্থক্য হল অক্ষরগুলি স্বীকৃত হওয়ার পরে কী ঘটে।

যেখানে ওসিআর (OCR) "এখানে আমি যে অক্ষরগুলি পেয়েছি" তে থামে, এআই (AI) চালিয়ে যায়:

শব্দার্থিক বোঝাপড়া

এআই (AI) মডেলগুলি বোঝে যে "12/15/2025" একটি তারিখ, "$4,521.30" একটি আর্থিক পরিমাণ এবং "Amazon Purchase" একটি লেনদেনের বিবরণ। এটি কেবল ফরম্যাটের উপর প্যাটার্ন ম্যাচিং নয় — মডেলটি প্রসঙ্গ থেকে অর্থ বোঝে।

যদি "12/15" একটি তারিখ কলামে প্রদর্শিত হয়, তবে এটি একটি তারিখ। যদি এটি একটি বিবরণ ক্ষেত্রে প্রদর্শিত হয়, তবে এটি একটি রেফারেন্স নম্বর হতে পারে। এআই (AI) এই পার্থক্য তৈরি করে; ওসিআর (OCR) পারে না।

নথির প্রকারের শ্রেণিবিন্যাস

একটি একক ফিল্ড এক্সট্রাক্ট করার আগে, এআই (AI) দেখে এটি কোন ধরণের নথি দেখছে: ব্যাংক স্টেটমেন্ট, চালান, রসিদ, ট্যাক্স ফর্ম বা আর্থিক প্রতিবেদন। এটি গুরুত্বপূর্ণ কারণ প্রতিটি ধরণের জন্য এক্সট্রাকশন নিয়ম সম্পূর্ণ ভিন্ন। একটি চালানে বিক্রেতার তথ্য, লাইন আইটেম, উপমোট, ট্যাক্স এবং একটি মোট থাকে। একটি ব্যাংক স্টেটমেন্টে তারিখ, বিবরণ, ডেবিট, ক্রেডিট এবং চলমান ব্যালেন্স সহ লেনদেন থাকে। এআই (AI) সঠিক নথির প্রকারের জন্য সঠিক এক্সট্রাকশন মডেল প্রয়োগ করে।

অর্থ অনুসারে ফিল্ডের শ্রেণিবিন্যাস

এআই (AI) কেবল একটি কলাম থেকে পাঠ্য বের করে না — এটি কী উপস্থাপন করে তা শ্রেণিবদ্ধ করে। একটি চালানে, "Acme Corp" তিনটি জায়গায় প্রদর্শিত হতে পারে: বিলিং কোম্পানি হিসাবে, শিপিং ঠিকানা হিসাবে বা একটি লাইন আইটেম বিবরণ হিসাবে। এআই (AI) অবস্থান, প্রসঙ্গ এবং নথির কাঠামোর উপর ভিত্তি করে কোনটি কোনটি তা বোঝে।

ব্যাংক স্টেটমেন্টের জন্য, এআই (AI) এর মধ্যে পার্থক্য করে:

  • লেনদেনের তারিখ বনাম পোস্টিং তারিখ
  • লেনদেনের পরিমাণ বনাম চলমান ব্যালেন্স
  • প্রাথমিক বিবরণ বনাম ধারাবাহিকতা লাইন
  • বিভাগ শিরোনাম বনাম ডেটা সারি
  • খোলার ব্যালেন্স বনাম বন্ধের ব্যালেন্স

টেবিল কাঠামোর স্বীকৃতি

এখানে ওসিআর (OCR) এবং এআই (AI) এর মধ্যে ব্যবধান সবচেয়ে নাটকীয়। ওসিআর (OCR) অক্ষরগুলির একটি গ্রিড দেখে। এআই (AI) হেডার, সারি, কলাম এবং সেলগুলির মধ্যে সম্পর্ক সহ একটি টেবিল দেখে। এটি বোঝে যে প্রথম সারি কলামের অর্থ সংজ্ঞায়িত করে, যে একটি খালি তারিখ সেল "উপরের একই তারিখ" বোঝায়, যে ইন্ডেন্ট করা পাঠ্য পূর্ববর্তী বিবরণের একটি ধারাবাহিকতা, এবং যে সমস্ত কলাম জুড়ে বিস্তৃত গাঢ় লেখা একটি বিভাগ শিরোনাম — ডেটা সারি নয়।

সম্পর্ক এক্সট্রাকশন

আর্থিক নথি গাণিতিক সম্পর্ক দিয়ে পূর্ণ। একটি চালানে, লাইন আইটেমগুলির মোট উপমোটের যোগফল হওয়া উচিত। উপমোটের সাথে ট্যাক্স যোগ করলে মোট সমান হওয়া উচিত। এআই (AI) এক্সট্রাকশনের সময় এই সম্পর্কগুলি যাচাই করে, এমন ত্রুটিগুলি ধরে ফেলে যা কেবল ওসিআর (OCR) সম্পূর্ণভাবে মিস করবে।

ব্যাংক স্টেটমেন্টে, এআই (AI) যাচাই করে যে প্রতিটি লেনদেনের পরিমাণ, পূর্ববর্তী ব্যালেন্সে প্রয়োগ করা হলে, পরবর্তী ব্যালেন্স তৈরি করে। এই চলমান বৈধতা এক্সট্রাকশন ত্রুটিগুলি রিয়েল-টাইমে ধরে ফেলে, সিস্টেমটিকে স্ব-সংশোধন করার অনুমতি দেয়।

টেমপ্লেট ছাড়াই লেআউট অভিযোজন

ঐতিহ্যবাহী ওসিআর (OCR)-ভিত্তিক এক্সট্রাকশন সিস্টেমগুলি টেমপ্লেটগুলির উপর নির্ভর করে — পূর্ব-সংজ্ঞায়িত নিয়ম যা নির্দিষ্ট পৃষ্ঠা অঞ্চলগুলিকে নির্দিষ্ট ক্ষেত্রগুলিতে ম্যাপ করে। এটি কাজ করে যতক্ষণ না ব্যাংক তার স্টেটমেন্ট ফরম্যাট পরিবর্তন করে, বা আপনি এমন একটি ব্যাংক থেকে একটি স্টেটমেন্ট পান যা আপনি আগে কখনও দেখেননি।

এআই (AI) শব্দার্থিকভাবে নথির বিন্যাস বোঝে। এটি স্বীকার করে যে MM/DD/YYYY হিসাবে ফরম্যাট করা মানের একটি কলাম, একটি বিবরণ কলামের বাম দিকে অবস্থিত, পিক্সেলের সঠিক অবস্থান নির্বিশেষে লেনদেনের তারিখগুলি উপস্থাপন করে। এর মানে হল এআই (AI) কাস্টম টেমপ্লেট ছাড়াই হাজার হাজার বিভিন্ন ব্যাংক স্টেটমেন্ট ফরম্যাটে কাজ করে।

বাস্তবে নির্ভুলতার ব্যবধান

ওসিআর (OCR)-মাত্র এক্সট্রাকশন এবং এআই (AI)-চালিত এক্সট্রাকশনের মধ্যে পার্থক্য কয়েক শতাংশ পয়েন্ট নয়। এটি এমন ডেটার পার্থক্য যা ব্যাপক ম্যানুয়াল পরিচ্ছন্নতার প্রয়োজন এবং ব্যবহারযোগ্য ডেটার মধ্যে।

ওসিআর (OCR) + ম্যানুয়াল ক্লিনিং ওয়ার্কফ্লো

  1. নথি স্ক্যান বা আপলোড করুন
  2. ওসিআর (OCR) ইঞ্জিন কাঁচা পাঠ্য বের করে (প্রতি পৃষ্ঠায় ২–৫ মিনিট)
  3. অক্ষর ত্রুটিগুলি ঠিক করার জন্য ম্যানুয়াল পর্যালোচনা (প্রতি পৃষ্ঠায় ৫–১০ মিনিট)
  4. ম্যানুয়াল কলাম অ্যালাইনমেন্ট — পরিমাণগুলি ব্যালেন্স থেকে আলাদা করুন (প্রতি স্টেটমেন্টে ১০–১৫ মিনিট)
  5. হেডার, ফুটার, সারাংশ সারিগুলির ম্যানুয়াল সনাক্তকরণ এবং অপসারণ (৫–১০ মিনিট)
  6. ম্যানুয়াল সাইন অ্যাসাইনমেন্ট — কোন পরিমাণগুলি ডেবিট বনাম ক্রেডিট তা নির্ধারণ করুন (৫–১০ মিনিট)
  7. চূড়ান্ত পুনর্মিলন পরীক্ষা (৫–১০ মিনিট)

প্রতি স্টেটমেন্টে মোট সময়: ৩০–৬০ মিনিট দক্ষ মানব শ্রম।

এআই (AI)-চালিত এক্সট্রাকশন ওয়ার্কফ্লো

  1. নথি আপলোড করুন
  2. এআই (AI) কাঠামোগত, শ্রেণিবদ্ধ ডেটা বের করে (সেকেন্ড থেকে মিনিট)
  3. ফ্ল্যাগ করা আইটেমগুলির দ্রুত পর্যালোচনা (২–৫ মিনিট)
  4. পছন্দসই ফরম্যাটে এক্সপোর্ট করুন

প্রতি স্টেটমেন্টে মোট সময়: ৩–১০ মিনিট, যার বেশিরভাগই ঐচ্ছিক পর্যালোচনা।

নির্ভুলতার তুলনা

মেট্রিক কেবল ওসিআর (OCR) ওসিআর (OCR) + ম্যানুয়াল ক্লিনিং এআই (AI)-চালিত এক্সট্রাকশন
ক্যারেক্টার নির্ভুলতা ৮৫–৯৮% ৯৯%+ (মানব পর্যালোচনার পরে) ৯৭–৯৯%+
ফিল্ড-লেভেল নির্ভুলতা ৬০–৯০% ৯৫%+ (মানব পর্যালোচনার পরে) ৯৫–৯৯%
টেবিল কাঠামো সঠিক ৪০–৬০% ৯০%+ (ম্যানুয়াল অ্যালাইনমেন্টের পরে) ৯২–৯৮%
প্রতি নথিতে সময় ২–৫ মিনিট (কেবল ওসিআর) ৩০–৬০ মিনিট (ক্লিনিং সহ) ১ মিনিটের কম
টেমপ্লেট প্রয়োজন হ্যাঁ (কাঠামোগত এক্সট্রাকশনের জন্য) হ্যাঁ না
নতুন ফরম্যাট পরিচালনা করে না (নতুন টেমপ্লেট প্রয়োজন) আংশিকভাবে (ম্যানুয়াল কাজের সাথে) হ্যাঁ

মূল অন্তর্দৃষ্টি: কেবল ওসিআর (OCR) আপনাকে কাঁচা পাঠ্য দেয় যা ফিল্ড স্তরে ৬০–৯০% সঠিক। ৯৫%+ নির্ভুলতায় পৌঁছানোর জন্য, আপনার ব্যাপক ম্যানুয়াল ক্লিনিং বা এআই (AI)-চালিত এক্সট্রাকশন প্রয়োজন। একটিতে প্রতি নথিতে ৩০–৬০ মিনিট মানব সময় লাগে। অন্যটিতে সেকেন্ড লাগে।

PDFSub এর পদ্ধতি: যখন সম্ভব ওসিআর (OCR) এড়িয়ে যান, যখন প্রয়োজন তখন এআই (AI) ব্যবহার করুন

অ্যাকাউন্ট্যান্ট এবং বুককিপাররা যে বেশিরভাগ ব্যাংক স্টেটমেন্ট, চালান এবং রসিদ নিয়ে কাজ করেন তা হল ডিজিটাল পিডিএফ — অনলাইন ব্যাংকিং পোর্টাল থেকে ডাউনলোড করা, বিক্রেতাদের দ্বারা ইমেল করা বা আর্থিক সিস্টেম থেকে এক্সপোর্ট করা। ডিজিটাল পিডিএফগুলিতে ইতিমধ্যে ফাইলের মধ্যে সরাসরি মেশিন-পাঠযোগ্য পাঠ্য থাকে। একটি ডিজিটাল পিডিএফ-এ ওসিআর (OCR) চালানো কেবল অপ্রয়োজনীয় নয় — এটি যেখানে কোনও ত্রুটি ছিল না সেখানে অক্ষর শনাক্তকরণ ত্রুটি তৈরি করতে পারে।

PDFSub এই বাস্তবতার উপর ভিত্তি করে একটি মৌলিকভাবে ভিন্ন পদ্ধতি গ্রহণ করে।

ডিজিটাল পিডিএফগুলির জন্য: সরাসরি পাঠ্য এক্সট্রাকশন

যখন আপনি PDFSub এর ব্যাংক স্টেটমেন্ট কনভার্টার, ইনভয়েস এক্সট্রাক্টর, বা রসিদ স্ক্যানার এ একটি ডিজিটাল পিডিএফ আপলোড করেন, তখন সিস্টেমের প্রথম কাজটি হল পিডিএফটিতে এমবেডেড পাঠ্য আছে কিনা তা পরীক্ষা করা।

যদি থাকে — এবং বেশিরভাগ আধুনিক আর্থিক নথিতে থাকে — PDFSub সরাসরি পিডিএফ কাঠামো থেকে পাঠ্য বের করে। কোনও ওসিআর (OCR) নেই। কোনও চিত্র প্রক্রিয়াকরণ নেই। কোনও অক্ষর শনাক্তকরণ ত্রুটি নেই। পাঠ্যটি ঠিক সেভাবেই বেরিয়ে আসে যেভাবে এটি ফাইলে এনকোড করা হয়েছিল, সঠিক অবস্থান স্থানাঙ্ক সহ যা নির্ভুল টেবিল সনাক্তকরণ এবং কলাম অ্যালাইনমেন্ট সক্ষম করে।

এই সরাসরি এক্সট্রাকশন সম্পূর্ণভাবে আপনার ব্রাউজারে ঘটে। পিডিএফটি আপনার ডিভাইস ছেড়ে যায় না। কোনও আপলোড নেই, কোনও সার্ভার প্রক্রিয়াকরণ নেই, কোনও ডেটা ধারণ নেই।

স্ক্যান করা নথির জন্য: এআই (AI)-চালিত এক্সট্রাকশন

যখন পিডিএফটি একটি স্ক্যান করা চিত্র হয় — বা যখন এমবেডেড পাঠ্য এক্সট্রাকশন পরিষ্কার ফলাফল দেয় না — PDFSub এআই (AI)-চালিত সার্ভার-সাইড প্রক্রিয়াকরণে ফিরে আসে। এআই (AI) মডেলটি একই সাথে পুরো পৃষ্ঠার বিন্যাস বিশ্লেষণ করে: কলামগুলি সনাক্ত করা, টেবিলের কাঠামো চেনা, ফিল্ডগুলি শ্রেণিবদ্ধ করা এবং প্রসঙ্গ সহ ডেটা বের করা। এটি কেবল অক্ষরগুলি রূপান্তর করার পরিবর্তে এবং পরে কাঠামো চাপানোর চেষ্টা করার পরিবর্তে পুরো নথিটিকে একটি সামগ্রিক হিসাবে বোঝে।

বহু-স্তরীয় এক্সট্রাকশন

PDFSub একটি স্তরযুক্ত পদ্ধতি ব্যবহার করে যা প্রতিটি নথির জন্য সর্বোত্তম এক্সট্রাকশন পদ্ধতি নির্বাচন করে:

  1. ব্রাউজার-সাইড সরাসরি এক্সট্রাকশন — ভাল এমবেডেড পাঠ্য সহ ডিজিটাল পিডিএফগুলির জন্য। দ্রুততম, সবচেয়ে ব্যক্তিগত, সবচেয়ে নির্ভুল (কোনও অক্ষর শনাক্তকরণের প্রয়োজন নেই)।
  2. সার্ভার-সাইড কাঠামোগত এক্সট্রাকশন — যে পিডিএফগুলির জন্য ব্রাউজার-সাইড পার্সিংকে শক্তিশালীকরণ প্রয়োজন। জটিল টেবিল কাঠামো পরিচালনা করতে লেআউট বিশ্লেষণ ব্যবহার করে।
  3. এআই (AI)-চালিত এক্সট্রাকশন — স্ক্যান করা নথি বা জটিল লেআউটগুলির জন্য যা নিয়ম-ভিত্তিক পার্সিং প্রতিরোধ করে। শব্দার্থিক বোঝাপড়া নিয়ে আসে।

প্রতিটি স্তর ফলাফল ফেরত দেওয়ার আগে বৈধতা পরীক্ষা পাস করে। যদি কোনও স্তর পরিষ্কার, পুনর্মিলিত ডেটা তৈরি করতে না পারে, তবে সিস্টেমটি স্বয়ংক্রিয়ভাবে পরবর্তী স্তরে উন্নীত হয়।

ফলাফল

এই পদ্ধতি সরবরাহ করে:

  • ডিজিটাল পিডিএফগুলিতে ৯৯%+ নির্ভুলতা — কারণ কোনও ওসিআর (OCR) ত্রুটি নেই
  • স্ক্যান করা নথিতে ৯৫–৯৯% নির্ভুলতা — কারণ এআই (AI) কেবল অক্ষর নয়, কাঠামো বোঝে
  • বিশ্বব্যাপী ২০,০০০+ ব্যাংক সমর্থন — কারণ কোনও প্রতি-ব্যাংক টেমপ্লেট রক্ষণাবেক্ষণ করতে হয় না
  • ১৩০+ ভাষা — কারণ সিস্টেমটি আন্তর্জাতিক তারিখ বিন্যাস, সংখ্যা বিন্যাস এবং অক্ষর এনকোডিংগুলি স্থানীয়ভাবে পরিচালনা করে
  • ব্রাউজার-প্রথম গোপনীয়তা — কারণ বেশিরভাগ নথির আপনার ডিভাইস ছেড়ে যাওয়ার প্রয়োজন হয় না

খরচের তুলনা: আসল অর্থনীতি

ওসিআর (OCR) + ম্যানুয়াল সংশোধন এবং এআই (AI)-চালিত এক্সট্রাকশনের মধ্যে খরচের পার্থক্য যথেষ্ট, বিশেষ করে বড় আকারে।

প্রতি নথিতে খরচ ব্রেকডাউন

খরচের কারণ ওসিআর (OCR) + ম্যানুয়াল ক্লিনিং এআই (AI)-চালিত এক্সট্রাকশন
সফ্টওয়্যার খরচ $০.০১–$০.১০/পৃষ্ঠা (ওসিআর (OCR) এপিআই) $০.০৫–$০.৫০/পৃষ্ঠা (এআই (AI) প্রক্রিয়াকরণ)
শ্রম খরচ $৮–$২৫/নথি (৩০–৬০ মিনিট @ $১৫–$২৫/ঘন্টা) $১–$৪/নথি (৩–১০ মিনিট পর্যালোচনা)
ত্রুটি সংশোধন $৫–$১৫/নথি (ত্রুটি খুঁজে বের করা এবং ঠিক করা) $০–$২/নথি (ন্যূনতম ত্রুটি)
প্রতি নথিতে মোট $১৩–$৪০ $১–$৭

এআই (AI) এর জন্য সফ্টওয়্যার খরচ কাঁচা ওসিআর (OCR) এর চেয়ে বেশি। কিন্তু শ্রম সাশ্রয় ক্ষতিপূরণ দেওয়ার চেয়ে বেশি। যখন আপনি ত্রুটি সংশোধনের হিসাব করেন — ভুল পরিমাণ খুঁজে বের করা, ভুলভাবে সারিবদ্ধ কলামগুলি ঠিক করা, ফ্যান্টম সারিগুলি সরানো — ওসিআর (OCR)-ভিত্তিক ওয়ার্কফ্লো এআই (AI)-চালিত এক্সট্রাকশনের চেয়ে ৩ থেকে ১০ গুণ বেশি ব্যয়বহুল।

বড় আকারে

একটি বুককিপিং ফার্মের জন্য প্রতি মাসে ৫০০ ব্যাংক স্টেটমেন্ট প্রক্রিয়া করা:

  • ওসিআর (OCR) + ম্যানুয়াল ক্লিনিং: ৫০০ x $২৫ গড় = $১২,৫০০/মাস
  • এআই (AI)-চালিত এক্সট্রাকশন: ৫০০ x $৪ গড় = $২,০০০/মাস

এটি বছরে $১২৫,০০০ এর বেশি সাশ্রয়। শিল্প ডেটা এটি সমর্থন করে — বুদ্ধিমান নথি প্রক্রিয়াকরণ গ্রহণকারী সংস্থাগুলি ৪০%+ খরচ হ্রাস রিপোর্ট করে, ৩–৬ মাসের পরিশোধের সময়কাল এবং ২০০–৪০০% প্রথম বছরের আর.ও.আই (ROI) সহ।

কখন ঐতিহ্যবাহী ওসিআর (OCR) এখনও যথেষ্ট

এআই (AI)-চালিত এক্সট্রাকশন সবসময় প্রয়োজনীয় নয়। এমন পরিস্থিতি রয়েছে যেখানে ঐতিহ্যবাহী ওসিআর (OCR) ভালভাবে কাজ করে:

সাধারণ, একক-পৃষ্ঠার নথি। একটি মার্চেন্ট নাম, কয়েকটি লাইন আইটেম এবং একটি মোট সহ একটি রসিদ। ন্যূনতম কাঠামো সহ নথি যেখানে লক্ষ্য কেবল পাঠ্য পাওয়া — জটিল টেবিল থেকে কাঠামোগত ডেটা বের করা নয়।

ধারাবাহিক, পরিচিত বিন্যাস। যদি আপনি প্রতিবার একই নথির বিন্যাস প্রক্রিয়া করেন — যেমন, একটি একক বিক্রেতার কাছ থেকে একটি নির্দিষ্ট ফর্ম — টেমপ্লেট-ভিত্তিক ওসিআর (OCR) এক্সট্রাকশন উচ্চ নির্ভুলতা অর্জন করতে পারে। আপনি একবার ফিল্ডগুলি ম্যাপ করেন এবং টেমপ্লেট বাকিগুলি পরিচালনা করে। বিন্যাস পরিবর্তিত হলে বা আপনি একটি নতুন বিক্রেতা যুক্ত করলে এটি ভেঙে যায়।

কেবলমাত্র পাঠ্য পিডিএফ। যদি আপনার লক্ষ্য পূর্ণ-পাঠ্য অনুসন্ধান বা সাধারণ আর্কাইভ করা — কাঠামোগত ডেটা এক্সট্রাকশন নয় — ওসিআর (OCR) যথেষ্ট। আপনার কেবল অক্ষরগুলির প্রয়োজন, অর্থ নয়।

কম-ভলিউম, উচ্চ-তত্ত্বাবধান ওয়ার্কফ্লো। যদি আপনি প্রতি সপ্তাহে কয়েকটি নথি প্রক্রিয়া করেন এবং প্রতিটি আউটপুট ম্যানুয়ালি পর্যালোচনা করার সময় থাকে, তবে ম্যানুয়াল সংশোধন সহ ওসিআর (OCR) কার্যকর। অর্থনীতি এআই (AI) এর দিকে পরিবর্তিত হয় যখন ভলিউম বৃদ্ধি পায় বা সময়ের চাপ বাড়ে।

সিদ্ধান্ত ফ্রেমওয়ার্ক

পরিস্থিতি প্রস্তাবিত পদ্ধতি
ডিজিটাল পিডিএফ, কাঠামোগত ডেটা প্রয়োজন সরাসরি পাঠ্য এক্সট্রাকশন (ওসিআর (OCR) প্রয়োজন নেই)
স্ক্যান করা নথি, সাধারণ বিন্যাস ঐতিহ্যবাহী ওসিআর (OCR) যথেষ্ট হতে পারে
স্ক্যান করা নথি, জটিল বিন্যাস এআই (AI)-চালিত এক্সট্রাকশন
বহু-কলাম আর্থিক নথি এআই (AI)-চালিত এক্সট্রাকশন
আন্তর্জাতিক নথি (অ-ইংরেজি) এআই (AI)-চালিত এক্সট্রাকশন
উচ্চ ভলিউম (৫০+ নথি/মাস) এআই (AI)-চালিত এক্সট্রাকশন
কম ভলিউম, একক বিন্যাস টেমপ্লেট-ভিত্তিক ওসিআর (OCR)

মূল কথা

ওসিআর (OCR) যখন প্রথম আবির্ভূত হয়েছিল তখন একটি যুগান্তকারী প্রযুক্তি ছিল। ছবির মতো পাঠ্যকে মেশিন-পাঠযোগ্য অক্ষরে রূপান্তর করার ক্ষমতা ব্যবসার কাগজ নথি পরিচালনার পদ্ধতিকে রূপান্তরিত করেছে। কিন্তু আর্থিক নথির জন্য — তাদের জটিল বিন্যাস, বহু-কলাম টেবিল, চলমান ব্যালেন্স এবং বিন্যাস বৈচিত্র্যের সাথে — অক্ষর শনাক্তকরণ কেবল প্রথম ধাপ।

প্রকৃত চ্যালেঞ্জ অক্ষর পড়া নয়। এটি বোঝা যে তারা কী বোঝায়।

এআই (AI)-চালিত এক্সট্রাকশন অক্ষর শনাক্তকরণের উপরে শব্দার্থিক বোঝাপড়া, ফিল্ড ক্লাসিফিকেশন, টেবিল কাঠামো স্বীকৃতি এবং সম্পর্ক বৈধতা যোগ করে এই ব্যবধান পূরণ করে। ফলাফল হল কাঠামোগত, নির্ভুল, ব্যবহারযোগ্য ডেটা — কেবল একটি পাঠ্য যা ঘন্টার পর ঘন্টা ম্যানুয়াল পরিচ্ছন্নতার প্রয়োজন।

আপনি যদি এখনও ব্যাংক স্টেটমেন্ট, চালান বা রসিদ থেকে ওসিআর (OCR) আউটপুট ম্যানুয়ালি সংশোধন করেন, তবে প্রযুক্তি সেই ওয়ার্কফ্লোকে ছাড়িয়ে গেছে। এআই (AI)-চালিত এক্সট্রাকশন দ্রুততর, আরও নির্ভুল এবং বড় আকারে নাটকীয়ভাবে সস্তা।

পার্থক্য দেখতে প্রস্তুত? ৭ দিনের জন্য PDFSub বিনামূল্যে চেষ্টা করুন এবং আপনার নিজের আর্থিক নথিতে এটি পরীক্ষা করুন। ব্যাংক স্টেটমেন্ট কনভার্টারে একটি ব্যাংক স্টেটমেন্ট আপলোড করুন, ইনভয়েস এক্সট্রাক্টরে একটি চালান চালান, বা রসিদ স্ক্যানার দিয়ে একটি রসিদ স্ক্যান করুন। আপনার বর্তমান ওসিআর (OCR) ওয়ার্কফ্লো যা তৈরি করে তার সাথে ফলাফলগুলি তুলনা করুন।

অক্ষরগুলি একই। বোঝাপড়া তা নয়।

ব্লগে ফিরে যান

কোনো প্রশ্ন আছে? আমাদের সাথে যোগাযোগ করুন

PDFSub

আপনার প্রয়োজনীয় সব PDF এবং ডকুমেন্ট টুলস এক জায়গায়। দ্রুত, নিরাপদ এবং ব্যক্তিগত।

GDPR কমপ্লায়েন্টCCPA কমপ্লায়েন্টSOC 2 Ready
Powered by PDFSub Engine

PDF টুলস

  • PDF মার্জ করুন
  • PDF স্প্লিট করুন
  • পেজ রিঅর্ডার করুন
  • PDF রোটেট করুন
  • পেজ ডিলিট করুন
  • পেজ এক্সট্র্যাক্ট করুন
  • ওয়াটারমার্ক যোগ করুন
  • PDF এডিট করুন
  • PDF স্ট্যাম্প করুন
  • PDF ফর্ম ফিলার
  • পেজ ক্রপ করুন
  • পেজ সাইজ পরিবর্তন করুন
  • পেজ নম্বর যোগ করুন
  • হেডার এবং ফুটার
  • PDF কম্প্রেস করুন
  • সার্চযোগ্য করুন
  • Clean Scanned PDF
  • Photo to Document
  • Auto-Crop PDF
  • PDF রিপেয়ার করুন
  • মেটাডেটা এডিট করুন
  • মেটাডেটা রিমুভ করুন
  • PDF থেকে Word
  • Word থেকে PDF
  • Excel থেকে PDF
  • PDF থেকে PowerPoint
  • PDF থেকে ইমেজ
  • ইমেজ থেকে PDF
  • HTML থেকে PDF
  • HEIC থেকে ইমেজ
  • WEBP থেকে JPG
  • WEBP থেকে PNG
  • PowerPoint থেকে PDF
  • PDF থেকে HTML
  • EPUB থেকে PDF
  • TIFF থেকে PDF
  • PNG থেকে PDF
  • PDF থেকে PNG
  • টেক্সট থেকে PDF
  • SVG থেকে PDF
  • WEBP থেকে PDF
  • PDF থেকে EPUB
  • RTF থেকে PDF
  • ODT থেকে PDF
  • ODS থেকে PDF
  • PDF থেকে ODT
  • PDF থেকে ODS
  • PDF থেকে SVG
  • PDF থেকে RTF
  • PDF থেকে টেক্সট
  • ODP থেকে PDF
  • PDF থেকে ODP
  • ODG থেকে PDF
  • PDF ভিউয়ার
  • PDF/A কনভার্সন
  • PDF তৈরি করুন
  • ব্যাচ কনভার্ট
  • প্রতি শিটে পেজ সংখ্যা
  • পাসওয়ার্ড সুরক্ষা
  • PDF আনলক করুন
  • PDF রিড্যাক্ট করুন
  • PDF ই-সাইন করুন
  • PDF তুলনা করুন
  • টেবিল এক্সট্র্যাক্ট করুন
  • PDF to Excel
  • ব্যাংক স্টেটমেন্ট কনভার্টার
  • ইনভয়েস এক্সট্র্যাক্টর
  • রসিদ স্ক্যানার
  • ফাইন্যান্সিয়াল রিপোর্ট
  • OCR - টেক্সট এক্সট্র্যাক্ট করুন
  • হস্তাক্ষর কনভার্সন
  • PDF সারসংক্ষেপ করুন
  • PDF অনুবাদ করুন
  • PDF-এর সাথে চ্যাট করুন
  • ডেটা এক্সট্র্যাক্ট করুন
  • ডিজাইন স্টুডিও

প্রোডাক্ট

  • Privacy & Security
  • সব টুলস
  • বৈশিষ্ট্যসমূহ
  • ব্যাংক স্টেটমেন্ট
  • মূল্য নির্ধারণ
  • FAQ
  • ব্লগ

সহায়তা

  • হেল্প সেন্টার
  • যোগাযোগ
  • FAQ

আইনি

  • গোপনীয়তা নীতি
  • পরিষেবার শর্তাবলী
  • কুকি নীতি

© 2026 PDFSub. সর্বস্বত্ব সংরক্ষিত।

সারা বিশ্বের মানুষের জন্য দিয়ে আমেরিকায় তৈরি