আপনি নথিগুলির একটি স্ট্যাক PDF হিসাবে স্ক্যান করেছেন। এগুলি স্ক্রিনে ঠিক দেখাচ্ছে - স্পষ্ট, পাঠযোগ্য, পেশাদার। কিন্তু একটি শব্দের জন্য অনুসন্ধান করার চেষ্টা করুন, একটি অনুচ্ছেদ কপি করুন, বা একটি ফোন নম্বর নির্বাচন করুন, এবং কিছুই হয় না। আপনার কার্সার কেবল পৃষ্ঠার উপর একটি নীল আয়তক্ষেত্র টেনে আনে যেন আপনি একটি ছবি নির্বাচন করছেন। কারণ এটাই আপনি করছেন।

স্ক্যান করা PDF গুলি হল ফটোগ্রাফ। প্রতিটি পৃষ্ঠা একটি একক চিত্র - অক্ষর, শব্দ বা বাক্য সম্পর্কে কোনও ধারণা ছাড়াই পিক্সেলের একটি ফ্ল্যাট গ্রিড। আপনার কম্পিউটার একটি সূর্যাস্তের JPEG ছবিতে যে পরিমাণ টেক্সট দেখে, একটি স্ক্যান করা PDF-এও ঠিক ততটাই টেক্সট দেখে: কিছুই না।

OCR (অপটিক্যাল ক্যারেক্টার রিকগনিশন) এটি সমাধান করে। এটি প্রতিটি পৃষ্ঠার চিত্র বিশ্লেষণ করে, অক্ষরগুলি সনাক্ত করে এবং মূল স্ক্যানের উপরে একটি অদৃশ্য টেক্সট স্তর যুক্ত করে। দৃশ্যমান চেহারা অভিন্ন থাকে, কিন্তু এখন আপনি টেক্সট অনুসন্ধান, কপি, নির্বাচন করতে পারেন এবং স্ক্রিন রিডারগুলি এটি অ্যাক্সেস করতে পারে।

এই গাইডটি OCR কী, এটি কীভাবে কাজ করে, আপনার স্ক্যান করা PDF গুলি OCR করার তিনটি পদ্ধতি এবং সেরা ফলাফল কীভাবে পাবেন তা আলোচনা করে।

How to OCR a scanned PDF - converting image-only pages into searchable, selectable text

কিভাবে বুঝবেন আপনার PDF-এর OCR প্রয়োজন কিনা

OCR-এ সময় বিনিয়োগ করার আগে, আপনার PDF-এর আসলে এটি প্রয়োজন কিনা তা পরীক্ষা করুন। অনেক PDF "ডিজিটালভাবে তৈরি" - ওয়ার্ড ডকুমেন্ট, এক্সেল স্প্রেডশীট বা ওয়েব পৃষ্ঠা থেকে তৈরি - এবং ইতিমধ্যে একটি আসল টেক্সট স্তর রয়েছে।

৫-সেকেন্ডের পরীক্ষা

১. আপনার PDF যেকোনো ভিউয়ারে খুলুন (Adobe Reader, Preview, Chrome, Edge) ২. Ctrl+F (Windows/Linux) বা Cmd+F (Mac) চাপুন ৩. পৃষ্ঠায় দৃশ্যমান একটি শব্দ টাইপ করুন ৪. যদি ভিউয়ার শব্দটি হাইলাইট করে: আপনার PDF-এ ইতিমধ্যে অনুসন্ধানযোগ্য টেক্সট রয়েছে। OCR-এর প্রয়োজন নেই। ৫. যদি কিছুই খুঁজে না পাওয়া যায়: আপনার PDF কেবল চিত্র-ভিত্তিক। এটির OCR প্রয়োজন।

নির্বাচন পরীক্ষা

পৃষ্ঠায় টেক্সট নির্বাচন করতে ক্লিক করে টেনে দেখুন:

যদি আপনি পৃথক শব্দ নির্বাচন করতে পারেন এবং সেগুলি নীল রঙে হাইলাইট হয়: PDF-এ একটি টেক্সট স্তর রয়েছে।
যদি পুরো পৃষ্ঠাটি একটি ব্লক হিসাবে নির্বাচিত হয় (একটি চিত্র নির্বাচন করার মতো): PDF টি কোনও টেক্সট স্তর ছাড়াই একটি স্ক্যান।
যদি আপনি কিছু টেক্সট নির্বাচন করতে পারেন কিন্তু অন্য টেক্সট নির্বাচন করতে না পারেন: PDF-এ আংশিক OCR বা মিশ্র সামগ্রী রয়েছে - কিছু পৃষ্ঠা ডিজিটাল, অন্যগুলি স্ক্যান করা।

OCR-এর প্রয়োজন হতে পারে এমন সাধারণ PDF প্রকারভেদ

ডকুমেন্টের প্রকার	সাধারণত OCR প্রয়োজন?	কারণ
স্ক্যান করা কাগজের নথি	হ্যাঁ	কেবল চিত্র, কোনও টেক্সট ডেটা নেই
ফ্যক্স করা নথি PDF হিসাবে সংরক্ষিত	হ্যাঁ	ফ্যক্স আউটপুট হল রাস্টার চিত্র
নথির ছবি (মোবাইল ক্যামেরা)	হ্যাঁ	ক্যামেরা ক্যাপচার = চিত্র
কপির "ইমেইলে স্ক্যান" থেকে PDF	হ্যাঁ	বেশিরভাগ কপিয়ার চিত্র PDF তৈরি করে
Word/Excel থেকে এক্সপোর্ট করা PDF	না	ডিজিটালভাবে তৈরি, টেক্সট স্তর অন্তর্ভুক্ত
ওয়েব ব্রাউজার থেকে PDF (প্রিন্ট টু PDF)	না	টেক্সট সংরক্ষিত থাকে
অনলাইনে ডাউনলোড করা সরকারি ফর্ম	সাধারণত না	বেশিরভাগই ডিজিটালভাবে তৈরি
PDF সংযুক্তি হিসাবে ইমেল করা রসিদ	সাধারণত না	POS সিস্টেম থেকে টেক্সট সহ তৈরি

OCR কী? সহজ ভাষায় ব্যাখ্যা

OCR এর পূর্ণরূপ হল অপটিক্যাল ক্যারেক্টার রিকগনিশন। এটি এমন একটি প্রযুক্তি যা চিত্র থেকে টেক্সট পড়ে - অক্ষরের প্যাটার্ন বিশ্লেষণ করে অক্ষর, সংখ্যা এবং প্রতীক সনাক্ত করে, অনেকটা আপনার চোখের মতো পৃষ্ঠার শব্দ পড়ার মতো।

যখন আপনি একটি নথি স্ক্যান করেন, স্ক্যানার একটি ফটোগ্রাফ তৈরি করে। সেই ফটোগ্রাফে পিক্সেল থাকে - যেখানে কালি ছিল সেখানে গাঢ়, যেখানে কাগজ ছিল সেখানে হালকা - কিন্তু কোনও আসল টেক্সট ডেটা থাকে না। স্ক্যানার জানে না যে পিক্সেলের একটি বিন্যাস "Invoice" শব্দ তৈরি করে। এটি কেবল চিত্রটি রেকর্ড করে।

OCR সেই চিত্রটি নেয়, আকারগুলি বিশ্লেষণ করে, পরিচিত অক্ষর প্যাটার্নের সাথে তুলনা করে এবং সেই আকারগুলি যে টেক্সট উপস্থাপন করে তা আউটপুট করে। ফলাফল হল একটি PDF যা মূল স্ক্যানের মতোই দেখায় তবে একটি অদৃশ্য টেক্সট স্তর ধারণ করে। যখন আপনি Ctrl+F চাপেন এবং "December" অনুসন্ধান করেন, তখন PDF ভিউয়ার টেক্সট স্তরটি পরীক্ষা করে, মিল খুঁজে পায় এবং সেই শব্দটি যেখানে উপস্থিত রয়েছে সেই চিত্রের অঞ্চলটি হাইলাইট করে।

OCR কতটা উন্নত হয়েছে

OCR ১৯৫০ এর দশক থেকে বিদ্যমান, যখন প্রাথমিক সিস্টেমগুলি কেবল নিয়ন্ত্রিত পরিবেশে নির্দিষ্ট ফন্ট পরিচালনা করতে পারত। প্রযুক্তি টেমপ্লেট ম্যাচিং (১৯৭০-৮০ দশক), ফিচার এক্সট্রাকশন (১৯৯০-২০০০ দশক), এবং মেশিন লার্নিং (২০১০ দশক) এর মাধ্যমে বিকশিত হয়েছে। আজকের OCR অক্ষর সনাক্তকরণের জন্য ডিপ নিউরাল নেটওয়ার্ক এবং অস্পষ্টতা সমাধানের জন্য প্রসঙ্গ ব্যবহারকারী ভাষা মডেলগুলিকে একত্রিত করে - যদি সিস্টেমটি নিশ্চিত না হয় যে একটি অক্ষর "l" নাকি "1", তবে চারপাশের শব্দগুলি এটিকে সিদ্ধান্ত নিতে সহায়তা করে।

আধুনিক OCR ইঞ্জিনগুলি পরিষ্কার, ভালভাবে স্ক্যান করা মুদ্রিত নথিগুলিতে ৯৯% এর বেশি অক্ষরের নির্ভুলতা অর্জন করে।

OCR কিভাবে কাজ করে: প্রযুক্তিগত প্রক্রিয়া

OCR একটি একক অ্যালগরিদম নয়। এটি ধাপগুলির একটি পাইপলাইন, প্রতিটি পূর্ববর্তীটির উপর ভিত্তি করে তৈরি হয়।

ধাপ ১: চিত্র প্রিপ্রসেসিং

কোনও অক্ষর সনাক্তকরণ হওয়ার আগে, OCR ইঞ্জিন চিত্রটি পরিষ্কার করে। এর মধ্যে রয়েছে বাইনারাইজেশন (সর্বোচ্চ বৈসাদৃশ্যের জন্য কালো এবং সাদা রূপান্তর), ডেস্কিউইং (পৃষ্ঠার সামান্য ঘূর্ণন সংশোধন করা - ১-২ ডিগ্রি কাত নির্ভুলতা উল্লেখযোগ্যভাবে হ্রাস করতে পারে), নয়েজ অপসারণ (স্ক্যানার আর্টিফ্যাক্ট এবং দাগ দূর করা), এবং বর্ডার অপসারণ (কালো প্রান্ত এবং বাইন্ডিং ছায়াগুলি সরানো)।

ধাপ ২: লেআউট বিশ্লেষণ

ইঞ্জিন পৃষ্ঠার কাঠামো সনাক্ত করে - টেক্সট ব্লক, কলাম, চিত্র, হেডার, ফুটার, টেবিল এবং পড়ার ক্রম। এই ধাপ ছাড়া, একটি দ্বি-কলামের নথি এমন জগাখিচুড়ি আউটপুট তৈরি করতে পারে যা উভয় কলাম জুড়ে একই সাথে পড়ে।

ধাপ ৩: অক্ষর বিভাজন

প্রতিটি টেক্সট ব্লকের মধ্যে, পৃথক অক্ষরগুলি বিচ্ছিন্ন করা হয়। লাইনগুলি উল্লম্ব ব্যবধান দ্বারা, শব্দগুলি অনুভূমিক ফাঁক দ্বারা এবং শব্দগুলির মধ্যে অক্ষরগুলি তাদের সীমানা দ্বারা পৃথক করা হয়। এটি যতটা সহজ মনে হয় তার চেয়ে কঠিন - অনেক ফন্টের অক্ষরগুলি ওভারল্যাপ করে বা স্পর্শ করে এবং আরবি এবং দেবনাগরীর মতো স্ক্রিপ্টগুলিতে, অক্ষরগুলি জটিল উপায়ে সংযুক্ত হয়।

ধাপ ৪: অক্ষর সনাক্তকরণ

প্রতিটি সেগমেন্টেড অক্ষরের চিত্র লক্ষ লক্ষ লেবেলযুক্ত অক্ষরের চিত্রগুলিতে প্রশিক্ষিত ডিপ নিউরাল নেটওয়ার্ক ব্যবহার করে শ্রেণিবদ্ধ করা হয়। নেটওয়ার্ক একটি একক উত্তরের পরিবর্তে প্রার্থীদের একটি কনফিডেন্স-র্যাঙ্কড তালিকা আউটপুট করে। একটি পরিষ্কার "A" ৯৯.৮% কনফিডেন্স পেতে পারে। একটি ক্ষতিগ্রস্ত অক্ষর অনেক সমতল বিতরণ তৈরি করতে পারে।

ধাপ ৫: ভাষা মডেলিং

কাঁচা অক্ষর সনাক্তকরণ ত্রুটিপূর্ণ। প্রসঙ্গ অস্পষ্টতা সমাধান করে। "lnvoice" কি একটি শব্দ? না - "l" আসলে "I" ছিল, যা এটিকে "Invoice" বানিয়েছে। পরিসংখ্যানগত ভাষা মডেলগুলি সম্ভাব্য অক্ষর ক্রমগুলির পূর্বাভাস দেয় এবং ফর্ম্যাট বৈধতা তারিখ এবং সংখ্যার মতো প্যাটার্নগুলিতে নিয়ম প্রয়োগ করে।

ধাপ ৬: আউটপুট তৈরি

শনাক্ত করা টেক্সট মূল চিত্রের স্থানাঙ্কের সাথে ম্যাপ করা হয় এবং একটি অদৃশ্য টেক্সট স্তর হিসাবে PDF-এ লেখা হয়। প্রতিটি শব্দ তার দৃশ্যমান প্রতিরূপের সাথে সঠিকভাবে সারিবদ্ধ থাকে, অনুসন্ধান-এবং-হাইলাইট কার্যকারিতা সক্ষম করে।

পদ্ধতি ১: PDFSub OCR টুল (প্রস্তাবিত)

How OCR converts a scanned PDF to searchable text - Upload Scan, OCR Analysis, Extract Text, Searchable PDF

PDFSub এর OCR টুল স্ক্যান করা PDF গুলি প্রক্রিয়া করে এবং প্রতিটি পৃষ্ঠার মূল দৃশ্যমান চেহারা সংরক্ষণ করার সময় একটি অনুসন্ধানযোগ্য টেক্সট স্তর যুক্ত করে।

ধাপে ধাপে নির্দেশাবলী

১. OCR টুলে যান - pdfsub.com/tools/ocr এ নেভিগেট করুন ২. আপনার স্ক্যান করা PDF আপলোড করুন - আপনার ফাইলটি টেনে আনুন বা ব্রাউজ করতে ক্লিক করুন। বড় নথিগুলি বিভক্ত করার প্রয়োজন নেই - বহু-পৃষ্ঠার PDF গুলি স্বয়ংক্রিয়ভাবে পরিচালনা করা হয়। ৩. OCR আপনার নথি প্রক্রিয়া করে - টুলটি প্রতিটি পৃষ্ঠা বিশ্লেষণ করে, টেক্সট সনাক্ত করে এবং অদৃশ্য টেক্সট স্তর তৈরি করে। প্রক্রিয়াকরণের সময় পৃষ্ঠার সংখ্যা এবং জটিলতার উপর নির্ভর করে, তবে বেশিরভাগ নথি কয়েক সেকেন্ডে সম্পন্ন হয়। ৪. আপনার অনুসন্ধানযোগ্য PDF ডাউনলোড করুন - আউটপুট ফাইলটি আপনার মূল স্ক্যানের মতোই দেখায় তবে এখন টেক্সট অনুসন্ধান, টেক্সট নির্বাচন এবং কপি-পেস্ট সমর্থন করে।

কেন PDFSub

১৩০+ ভাষার সমর্থন। OCR ইংরেজি, স্প্যানিশ, ফরাসি, জার্মান, চীনা, জাপানি, কোরিয়ান, আরবি, হিন্দি, রাশিয়ান, পর্তুগিজ এবং ১২০টিরও বেশি অতিরিক্ত ভাষায় নথিগুলির সাথে কাজ করে। বহু-ভাষার নথিগুলি স্বয়ংক্রিয়ভাবে পরিচালনা করা হয় - আপনাকে আগে থেকে ভাষা নির্দিষ্ট করার প্রয়োজন নেই।

মূল চেহারা সংরক্ষিত। OCR প্রক্রিয়াটি দৃশ্যমান বিষয়বস্তু পরিবর্তন না করে টেক্সট ডেটা যুক্ত করে। আপনার স্ক্যান করা পৃষ্ঠাগুলি ঠিক একই রকম দেখায়। ফন্ট, লেআউট, স্ট্যাম্প, স্বাক্ষর এবং হাতে লেখা টীকাগুলি অপরিবর্তিত থাকে।

কোনও সফ্টওয়্যার ইনস্টল করার প্রয়োজন নেই। সবকিছু আপনার ব্রাউজারে বা সুরক্ষিত সার্ভারে চলে। ডাউনলোড করার মতো কিছুই নেই, সিস্টেমের প্রয়োজনীয়তা পরীক্ষা করার প্রয়োজন নেই এবং কোনও সামঞ্জস্যের সমস্যা নেই।

গোপনীয়তা-সচেতন নকশা। আপলোড করা নথিগুলি প্রক্রিয়া করা হয় এবং তারপরে মুছে ফেলা হয়। PDFSub আপনার ফাইলগুলি সংরক্ষণ করে না বা প্রশিক্ষণের জন্য ব্যবহার করে না।

বিনামূল্যে চেষ্টা করুন। PDFSub একটি ৭-দিনের বিনামূল্যে ট্রায়াল অফার করে যাতে আপনি প্রতিশ্রুতিবদ্ধ হওয়ার আগে আপনার নিজের নথিগুলিতে OCR পরীক্ষা করতে পারেন।

পদ্ধতি ২: Adobe Acrobat Pro

Adobe Acrobat Pro-তে "Scan & OCR" টুলসেটের মধ্যে "Recognize Text" নামে একটি বিল্ট-ইন OCR বৈশিষ্ট্য রয়েছে।

ধাপে ধাপে নির্দেশাবলী

১. Adobe Acrobat Pro-তে আপনার স্ক্যান করা PDF খুলুন ২. Tools এ যান এবং Scan & OCR নির্বাচন করুন ৩. Recognize Text ক্লিক করুন এবং In This File বা In Multiple Files নির্বাচন করুন ৪. Settings এর অধীনে, Searchable Image নির্বাচন করুন (অদৃশ্য টেক্সট স্তর যুক্ত করে - প্রস্তাবিত) ৫. প্রক্রিয়া শুরু করতে Recognize Text ক্লিক করুন ৬. ফাইলটি সংরক্ষণ করুন

সুবিধা এবং সীমাবদ্ধতা

Adobe পরিষ্কার ইংরেজি স্ক্যানগুলিতে উচ্চ নির্ভুলতা সরবরাহ করে, ব্যাচ প্রক্রিয়াকরণ সমর্থন করে এবং আপনাকে সরাসরি OCR ত্রুটিগুলি সংশোধন করতে দেয়। তবে, Acrobat Pro-এর জন্য বার্ষিক প্ল্যানে $১৯.৯৯/মাস ($২৩৯.৮৮/বছর) খরচ হয়, ডেস্কটপ ইনস্টলেশন প্রয়োজন (কোনও ব্রাউজার-ভিত্তিক OCR নেই), প্রায় ২০টি ভাষা সমর্থন করে এবং ৫০ পৃষ্ঠার বেশি নথিতে ধীর হতে পারে।

পদ্ধতি ৩: Google Drive (বিনামূল্যে, কিন্তু তথ্য হারায়)

Google Drive-এ একটি মৌলিক OCR বৈশিষ্ট্য রয়েছে যা স্ক্যান করা PDF থেকে টেক্সট বের করে - তবে একটি উল্লেখযোগ্য আপসের সাথে।

ধাপে ধাপে নির্দেশাবলী

১. আপনার স্ক্যান করা PDF Google Drive-এ আপলোড করুন ২. ফাইলটিতে ডান-ক্লিক করুন এবং Open with তারপর Google Docs নির্বাচন করুন ৩. Google PDF প্রক্রিয়া করে এবং নিষ্কাশিত টেক্সট সহ একটি Google Doc তৈরি করে ৪. টেক্সট এখন অনুসন্ধানযোগ্য, নির্বাচনযোগ্য এবং সম্পাদনাযোগ্য

সুবিধা এবং সীমাবদ্ধতা

Google Drive OCR সম্পূর্ণ বিনামূল্যে, পরিষ্কার টাইপ করা নথিগুলিতে ভাল নির্ভুলতা সরবরাহ করে এবং স্বয়ংক্রিয়ভাবে ভাষা সনাক্ত করে। তবে, একটি গুরুতর আপস রয়েছে: এটি ফর্ম্যাটিং নষ্ট করে দেয়। Google আপনার PDF-এ একটি টেক্সট স্তর যুক্ত করে না - এটি একটি Google Doc-এ টেক্সট বের করে। টেবিলগুলি সাধারণ টেক্সটে পরিণত হয়, কলামগুলি ভেঙে পড়ে এবং মূল লেআউট হারিয়ে যায়। আপনি একটি অনুসন্ধানযোগ্য PDF এর পরিবর্তে একটি Google Doc পান।

এটি ১০ পৃষ্ঠার কম নথির জন্য সবচেয়ে ভাল কাজ করে। দীর্ঘ নথিগুলি সংক্ষিপ্ত করা হতে পারে।

এর জন্য সেরা: যখন আপনি মূল লেআউট চান না তখন টেক্সট সামগ্রী বের করা। যদি আপনার একটি অনুসন্ধানযোগ্য PDF প্রয়োজন হয় যা চেহারা সংরক্ষণ করে, পদ্ধতি ১ বা পদ্ধতি ২ ব্যবহার করুন।

OCR নির্ভুলতা: ডকুমেন্টের প্রকারভেদে কী আশা করবেন

OCR কোনও জাদু নয়। নির্ভুলতা নথির গুণমান, বিষয়বস্তুর প্রকার এবং স্ক্যানিং অবস্থার উপর নির্ভর করে ব্যাপকভাবে পরিবর্তিত হয়। এখানে বাস্তব-বিশ্বের পরীক্ষাগুলি কী দেখায় তা দেওয়া হল।

টাইপ করা নথি (আধুনিক ফন্ট): ৯৫-৯৯%

আধুনিক মুদ্রিত নথি - চালান, চুক্তি, লেজার প্রিন্টারে মুদ্রিত প্রতিবেদন - সেরা পরিস্থিতি। স্ট্যান্ডার্ড ফন্টগুলি OCR প্রশিক্ষণ ডেটাতে ভালভাবে উপস্থাপিত হয় এবং সাদা কাগজে পরিষ্কার প্রিন্টগুলি উচ্চ-বৈসাদৃশ্য চিত্র তৈরি করে। ২৫০-শব্দের পৃষ্ঠায় ৯৯% নির্ভুলতায় (প্রায় ১,৫০০ অক্ষর) আপনি প্রায় ১৫টি অক্ষর ত্রুটির আশা করতে পারেন - বেশিরভাগই গুরুত্বহীন, যেমন একটি পিরিয়ডকে কমা হিসাবে ভুল পড়া বা একটি ছোট হাতের "l" কে "1" হিসাবে বিভ্রান্ত করা।

পুরানো টাইপরাইটার নথি: ৮৫-৯৫%

মেকানিক্যাল টাইপরাইটারগুলি চ্যালেঞ্জ উপস্থাপন করে: অসঙ্গত অক্ষর বিন্যাস, রিবন ক্ষয়ের কারণে বিভিন্ন কালি ঘনত্ব এবং অভিন্ন অক্ষর প্রস্থ বিভাজন বিভ্রান্তি সৃষ্টি করে। তবুও, টাইপরাইটার টেক্সট স্বতন্ত্রভাবে গঠিত এবং অনুভূমিকভাবে সারিবদ্ধ থাকে, তাই বেশিরভাগ OCR ইঞ্জিনগুলি অনুসন্ধানের উদ্দেশ্যে এটি ভালভাবে পরিচালনা করে।

হাতে লেখা টেক্সট: ৬০-৮০%

হাতে লেখা OCR-এর সবচেয়ে কঠিন চ্যালেঞ্জ রয়ে গেছে। পরিবর্তনশীলতা বিশাল - কেবল মানুষের মধ্যে নয়, একটি পৃষ্ঠায় একজন ব্যক্তির লেখার মধ্যেও। পরিপাটি ব্লক প্রিন্টিং ৮০-৮৫% পর্যন্ত পৌঁছাতে পারে। রেখাযুক্ত কাগজে পেন্সিলে লেখা কursive ৬০% এর নিচে নেমে যেতে পারে। সর্বদা হাতে লেখা নথি থেকে গুরুত্বপূর্ণ ডেটা ম্যানুয়ালি যাচাই করুন।

মিশ্র সামগ্রী (টেক্সট + টেবিল): ৯০-৯৭%

টেক্সট এবং সারণী ডেটা একত্রিত করা নথিগুলি লেআউট বিশ্লেষণের চ্যালেঞ্জ যোগ করে। সেলগুলির মধ্যে অক্ষর সনাক্তকরণ সাধারণত নির্ভুল হয়, তবে কাঠামোগত ত্রুটি - ভুলভাবে চিহ্নিত সেল সীমানা, ভুলভাবে নির্ধারিত কলাম, বহু-লাইনের সেল সারিগুলিতে বিভক্ত হওয়া - পৃথক অক্ষরের ভুলের চেয়ে ডেটা সম্পর্কগুলিকে নষ্ট করে।

নির্ভুলতা সারাংশ টেবিল

ডকুমেন্টের প্রকার	অক্ষরের নির্ভুলতা	অনুসন্ধানযোগ্য?	ডেটা নিষ্কাশন নির্ভরযোগ্য?
আধুনিক মুদ্রিত (লেজার)	৯৫-৯৯%	চমৎকার	হ্যাঁ
আধুনিক মুদ্রিত (ইঙ্কজেট)	৯৩-৯৮%	চমৎকার	সাধারণত
পুরানো টাইপরাইটার	৮৫-৯৫%	ভাল	যাচাই সহ
পরিষ্কার হাতে লেখা (ব্লক)	৭০-৮০%	আংশিক	না - সবকিছু যাচাই করুন
কursive হাতে লেখা	৬০-৭০%	দুর্বল	না
মিশ্র টেক্সট + টেবিল	৯০-৯৭%	ভাল	কাঠামোগত পর্যালোচনার সাথে
ক্ষতিগ্রস্ত/ক্ষতিগ্রস্ত কাগজ	৭০-৯০%	পরিবর্তিত হয়	ভারী যাচাই সহ

OCR এর আগে স্ক্যান করার জন্য সেরা অনুশীলন

OCR নির্ভুলতার সবচেয়ে বড় কারণ OCR সফ্টওয়্যার নয় - এটি স্ক্যানের গুণমান। একটি ভাল স্ক্যানে কাজ করা একটি দুর্দান্ত OCR ইঞ্জিন একটি মাঝারি ইঞ্জিনের চেয়ে খারাপ ফলাফল তৈরি করবে যা একটি দুর্দান্ত স্ক্যানে কাজ করছে।

রেজোলিউশন: ৩০০ DPI ন্যূনতম

DPI (ডটস প্রতি ইঞ্চি) নির্ধারণ করে স্ক্যানার কতটা বিশদ ক্যাপচার করে।

৩০০ DPI: বেশিরভাগ নথির জন্য স্ট্যান্ডার্ড। সাধারণ ফন্টগুলির নির্ভরযোগ্য সনাক্তকরণের জন্য যথেষ্ট (১০-১২pt)।
৬০০ DPI: ছোট টেক্সট (ফুটার, সূক্ষ্ম প্রিন্ট) বা যখন আপনার সর্বোচ্চ নির্ভুলতা প্রয়োজন তখন প্রস্তাবিত।
১৫০ DPI বা কম: প্রস্তাবিত নয়। অক্ষরগুলি নির্ভরযোগ্য সনাক্তকরণের জন্য খুব ছোট। নির্ভুলতা উল্লেখযোগ্যভাবে হ্রাস পায়।
১২০০ DPI: OCR এর জন্য অতিরিক্ত। কোনও নির্ভুলতা উন্নতি নেই এবং ফাইলের আকার বিশাল হয়ে যায়।

রঙ মোড: গ্রেস্কেল সাধারণত সেরা

গ্রেস্কেল: বেশিরভাগ নথির জন্য সেরা। ভাল বাইনারাইজেশনের জন্য পর্যাপ্ত বৈসাদৃশ্য সংরক্ষণ করে যখন ফাইলের আকার পরিচালনাযোগ্য রাখে।
কালো এবং সাদা: পরিষ্কার, উচ্চ-বৈসাদৃশ্য নথির জন্য কাজ করতে পারে তবে প্রান্তিক অঞ্চলগুলিতে বিশদ নষ্ট করতে পারে।
রঙ: কেবল তখনই প্রয়োজন যদি নথিতে রঙিন-কোডেড তথ্য থাকে যা আপনি সংরক্ষণ করতে চান। OCR উদ্দেশ্যে, রঙ গ্রেস্কেলের চেয়ে কোনও সুবিধা যোগ করে না।

অ্যালাইনমেন্ট এবং ওরিয়েন্টেশন

পৃষ্ঠাগুলি সোজা রাখুন। এমনকি ২-৩ ডিগ্রি কোণও OCR নির্ভুলতা ৫-১০% কমাতে পারে। পৃষ্ঠাগুলি সারিবদ্ধ রাখতে স্ক্যানারের কাগজের গাইড ব্যবহার করুন।
একপাশে স্ক্যান করা পৃষ্ঠাগুলি মুখ নিচে রাখুন। পিছনের দিক থেকে আসা ব্লিড-থ্রু OCR ইঞ্জিনকে বিভ্রান্ত করে এমন ছায়া টেক্সট তৈরি করা এড়িয়ে চলুন।
বাঁধাই করা নথির জন্য ফ্ল্যাটবেড স্ক্যানার ব্যবহার করুন। শীট-ফিড স্ক্যানারগুলি বই বা বাঁধাই করা প্রতিবেদন থেকে পৃষ্ঠাগুলি বাঁকিয়ে দিতে পারে। ফ্ল্যাটবেড স্ক্যানিং পৃষ্ঠাটিকে সমতল এবং সঠিকভাবে সারিবদ্ধ রাখে।

স্ক্যানার রক্ষণাবেক্ষণ এবং নথি প্রস্তুতি

ব্যাচ স্ক্যান করার আগে কাঁচ পরিষ্কার করুন - দাগ প্রতিটি পৃষ্ঠায় আর্টিফ্যাক্ট তৈরি করে
একটি খালি পৃষ্ঠা স্ক্যান করে স্ট্রাইকের জন্য পরীক্ষা করুন - উল্লম্ব রেখাগুলি নোংরা রোলার নির্দেশ করে
জ্যাম এবং স্ক্র্যাচ প্রতিরোধ করতে স্ট্যাপল এবং পেপার ক্লিপগুলি সরান
ভাঁজ করা পৃষ্ঠাগুলি সমতল করুন - গভীর ভাঁজগুলি ছায়া তৈরি করে যা OCR ইঞ্জিন ভুল পড়তে পারে
পিছনের দিকে টেপ দিয়ে ছেঁড়া মেরামত করুন - সামনের দিকে টেপ প্রতিফলন তৈরি করে

OCR এর পরে: পরবর্তী কী করবেন

OCR চালানো কেবল প্রথম ধাপ। আপনার নতুন অনুসন্ধানযোগ্য নথিগুলি থেকে সর্বাধিক সুবিধা পেতে এখানে কিছু উপায় রয়েছে।

ফলাফল যাচাই করুন

বিশেষ করে গুরুত্বপূর্ণ নথিগুলির জন্য সর্বদা OCR আউটপুট স্পট-চেক করুন:

মূল পদগুলির জন্য অনুসন্ধান করুন যা আপনি জানেন নথিতে উপস্থিত রয়েছে। যদি Ctrl+F সেগুলিকে ধারাবাহিকভাবে খুঁজে পায়, তবে OCR কাজ করছে।
একটি অনুচ্ছেদ কপি করুন এবং একটি টেক্সট এডিটরে পেস্ট করুন। স্পষ্ট ত্রুটিগুলির জন্য পড়ুন - বিকৃত শব্দ, অনুপস্থিত অক্ষর, অর্থহীন প্রতিস্থাপন।
সংখ্যাগুলি সাবধানে পরীক্ষা করুন। আর্থিক পরিমাণ, তারিখ, ফোন নম্বর এবং অ্যাকাউন্ট নম্বরগুলি উচ্চ-ঝুঁকির ডেটা। লেনদেনের পরিমাণে "6" কে "8" হিসাবে ভুল পড়া একটি বাস্তব সমস্যা। OCR ইঞ্জিনগুলি মাঝে মাঝে অনুরূপ অঙ্কগুলিকে বিভ্রান্ত করে (0/O, 1/l, 5/S, 6/8)।

ত্রুটি সংশোধন এবং সংগঠিত করুন

যদি আপনি গুরুত্বপূর্ণ নথিগুলিতে ত্রুটি খুঁজে পান, Adobe Acrobat Pro আপনাকে সরাসরি টেক্সট স্তর সম্পাদনা করার অনুমতি দেয়, অথবা আপনি সমস্যাযুক্ত পৃষ্ঠাগুলি ৬০০ DPI তে পুনরায় স্ক্যান করে OCR পুনরায় চালাতে পারেন। হাতে লেখা বিভাগগুলির জন্য, ম্যানুয়াল ট্রান্সক্রিপশন প্রায়শই খারাপ OCR সংশোধনের চেয়ে দ্রুত হয়।

একবার অনুসন্ধানযোগ্য হয়ে গেলে, আপনার PDF গুলি বিদ্যমান কর্মপ্রবাহে একীভূত হয়। ডেস্কটপ অনুসন্ধান (Windows Search, Mac-এ Spotlight) স্বয়ংক্রিয়ভাবে সেগুলি সূচী করে। ডকুমেন্ট ম্যানেজমেন্ট সিস্টেমগুলি (SharePoint, Google Drive, Dropbox) আপনার লাইব্রেরি জুড়ে পূর্ণ-টেক্সট অনুসন্ধানের অনুমতি দেয়। ভাল ফাইলের নাম এবং অনুসন্ধানযোগ্য বিষয়বস্তু হল আদর্শ সমন্বয়।

OCR এর বাস্তব-বিশ্বের ব্যবহারিক উদাহরণ

কাগজের আর্কাইভ ডিজিটাইজ করা

ব্যবসা, আইন সংস্থা এবং সরকারি সংস্থাগুলির প্রায়শই কয়েক দশকের কাগজের নথি থাকে। কেবল PDF-এ স্ক্যান করলে চিত্র ফাইল তৈরি হয় যা কেবল ফাইলের নাম দ্বারা অনুসন্ধানযোগ্য। OCR যোগ করা একটি নিষ্ক্রিয় আর্কাইভকে একটি জিজ্ঞাসাযোগ্য ডেটাবেসে পরিণত করে। সাধারণ কর্মপ্রবাহ: ৩০০ DPI গ্রেস্কেলে স্ক্যান করুন, OCR চালান, নামকরণের নিয়ম প্রয়োগ করুন এবং একটি ডকুমেন্ট ম্যানেজমেন্ট সিস্টেমে আপলোড করুন।

আইনি নথি অনুসন্ধানযোগ্য করা

আইনি পেশাদাররা আবিষ্কার এবং যথাযথ অধ্যবসায়ের সময় বিপুল পরিমাণ নথির সাথে ডিল করেন। বিরোধী আইনজীবী স্ক্যান করা নথির হাজার হাজার পৃষ্ঠা তৈরি করতে পারেন। OCR ছাড়া, পর্যালোচনা মানে ম্যানুয়ালি প্রতিটি পৃষ্ঠা পড়া। OCR এর সাথে, আইনজীবীরা পুরো সেট জুড়ে মূল পদ, নাম, তারিখ এবং পরিমাণের জন্য অনুসন্ধান করতে পারেন - পর্যালোচনাকে বাস্তবসম্মত সময়সীমার মধ্যে সম্ভব করে তোলে।

অ্যাক্সেসিবিলিটি সম্মতি

আমেরিকানস উইথ ডিসএবিলিটিস অ্যাক্ট (ADA) এবং সেকশন ৫০৮ এর অধীনে, সরকারি সংস্থা এবং ফেডারেল-অর্থায়িত সংস্থাগুলির ডিজিটাল নথিগুলি অ্যাক্সেসযোগ্য হতে হবে। স্ক্রিন রিডারগুলি কেবল চিত্র-ভিত্তিক PDF গুলি ব্যাখ্যা করতে পারে না - তাদের একটি টেক্সট স্তর প্রয়োজন। OCR সম্মতির দিকে প্রথম পদক্ষেপ। অতিরিক্ত কাজ (হেডিং কাঠামো, বিকল্প টেক্সট, পড়ার ক্রম ট্যাগ) অনুসরণ করতে পারে, তবে টেক্সট স্তর ছাড়া অ্যাক্সেসিবিলিটি অসম্ভব।

বীমা এবং আর্থিক প্রক্রিয়াকরণ

বীমা সংস্থা এবং ব্যাংকগুলি লক্ষ লক্ষ স্ক্যান করা দাবির ফর্ম, মেডিকেল রেকর্ড, চেক এবং ঋণ আবেদন গ্রহণ করে। OCR স্বয়ংক্রিয় ডেটা নিষ্কাশন সক্ষম করে - স্ক্যান করা নথি থেকে পলিসি নম্বর, দাবির পরিমাণ, পরিষেবার তারিখ এবং অ্যাকাউন্ট বিবরণ প্রক্রিয়াকরণ সিস্টেমে নিয়ে আসে।

একাডেমিক এবং গবেষণা আর্কাইভ

বিশ্ববিদ্যালয়, লাইব্রেরি এবং আর্কাইভগুলি ঐতিহাসিক নথি, সংবাদপত্র এবং পাণ্ডুলিপি ডিজিটাইজ করছে। OCR শতাব্দীর জ্ঞানকে অনুসন্ধানযোগ্য করে তোলে। Google Books এবং Internet Archive এর মতো প্রকল্পগুলি বিলিয়ন বিলিয়ন পৃষ্ঠা OCR করেছে, যা ম্যানুয়ালি পড়তে জীবনকাল সময় লাগবে এমন সংগ্রহ জুড়ে পূর্ণ-টেক্সট অনুসন্ধান সক্ষম করে।

প্রায়শই জিজ্ঞাসিত প্রশ্নাবলী

আমি কি একবারে একাধিক PDF OCR করতে পারি (ব্যাচ প্রক্রিয়াকরণ)?

হ্যাঁ। PDFSub একক অপারেশনে বহু-পৃষ্ঠার নথি প্রক্রিয়াকরণ সমর্থন করে। বড় ব্যাচ কাজের জন্য - শত শত বা হাজার হাজার ফাইল - আপনি টুলটির মাধ্যমে সেগুলি ক্রমানুসারে প্রক্রিয়া করবেন। Adobe Acrobat Pro স্বয়ংক্রিয়ভাবে সম্পূর্ণ ফোল্ডারগুলি প্রক্রিয়া করতে পারে এমন Action Wizard বৈশিষ্ট্যটির মাধ্যমে ব্যাচ OCR-ও সরবরাহ করে।

OCR করার পরে কি আমার PDF এর চেহারা পরিবর্তন হয়?

না। সঠিক OCR দৃশ্যমান পৃষ্ঠার চিত্রের পিছনে একটি অদৃশ্য টেক্সট স্তর যুক্ত করে। আপনার স্ক্যান করা PDF এর দৃশ্যমান চেহারা অপরিবর্তিত থাকে - একই পৃষ্ঠা, একই লেআউট, একই রেজোলিউশন। টেক্সট স্তরটি কেবল অনুসন্ধান ফাংশন, টেক্সট নির্বাচন, কপি-পেস্ট এবং স্ক্রিন রিডারগুলির জন্য "দৃশ্যমান"।

যদি আমি ইতিমধ্যে অনুসন্ধানযোগ্য টেক্সট সহ একটি PDF-এ OCR চালাই তবে কী হবে?

বেশিরভাগ OCR টুল বিদ্যমান টেক্সট স্তরগুলি সনাক্ত করে এবং হয় সেই পৃষ্ঠাগুলি এড়িয়ে যায় বা আপনাকে সেগুলি পুনরায় প্রক্রিয়া করার বিকল্প দেয়। ইতিমধ্যে অনুসন্ধানযোগ্য একটি PDF-এ OCR চালানো সাধারণত ক্ষতিকারক কিন্তু অপ্রয়োজনীয় - এটি বিদ্যমান টেক্সট স্তর উন্নত করবে না এবং অপ্রয়োজনীয় ডেটার কারণে ফাইলের আকার সামান্য বাড়িয়ে দিতে পারে।

OCR করার পরে কি আমার ফাইলের আকার বাড়বে?

সামান্য। একটি সাধারণ স্ক্যান করা নথির জন্য ৫-১৫% বৃদ্ধির আশা করুন। টেক্সট স্তরটি নিজেই ছোট (অক্ষর এবং অবস্থান ডেটা), এবং স্ক্যান করা PDF এর বেশিরভাগ অংশ গঠনকারী চিত্র ডেটার তুলনায় বৃদ্ধি নগণ্য।

OCR কি স্ক্যান করা এবং ডিজিটাল পৃষ্ঠাগুলির মিশ্রণ সহ PDF-এ কাজ করে?

হ্যাঁ। ভাল OCR টুলগুলি প্রতিটি পৃষ্ঠা স্বাধীনভাবে প্রক্রিয়া করে। যে পৃষ্ঠাগুলিতে ইতিমধ্যে একটি টেক্সট স্তর রয়েছে সেগুলি সনাক্ত করা হয় এবং এড়িয়ে যাওয়া যেতে পারে। যে পৃষ্ঠাগুলি কেবল চিত্র-ভিত্তিক সেগুলি প্রক্রিয়া করা হয়। ফলাফল হল একটি সম্পূর্ণ অনুসন্ধানযোগ্য PDF, মূলটি কীভাবে একত্রিত হয়েছিল তা নির্বিশেষে।

OCR কোন ভাষা সমর্থন করে?

ভাষা সমর্থন সরঞ্জাম অনুসারে পরিবর্তিত হয়। PDFSub এর OCR ল্যাটিন-স্ক্রিপ্ট (ইংরেজি, স্প্যানিশ, ফরাসি, জার্মান), CJK (চীনা, জাপানি, কোরিয়ান), সিরিলিক (রাশিয়ান, ইউক্রেনীয়), আরবি-স্ক্রিপ্ট (আরবি, ফার্সি, উর্দু), দেবনাগরী (হিন্দি, মারাঠি) এবং আরও অনেক সহ ১৩০ টিরও বেশি ভাষা সমর্থন করে।

OCR কি হাতে লেখা পড়তে পারে?

আংশিকভাবে। পরিপাটি ব্লক প্রিন্টিং ৭০-৮০% নির্ভুলতায় পৌঁছায়। কursive উল্লেখযোগ্যভাবে কঠিন (৬০-৭০% বা তার কম)। হাতে লেখা নথি থেকে গুরুত্বপূর্ণ ডেটার জন্য, সর্বদা ম্যানুয়ালি ফলাফল যাচাই করুন।

OCR কি PDF টেক্সট নিষ্কাশনের মতোই?

না। OCR টেক্সটের চিত্রগুলিকে আসল অক্ষরে রূপান্তর করে - যখন কোনও টেক্সট ডেটা থাকে না, কেবল পিক্সেল থাকে তখন এটি প্রয়োজন। PDF টেক্সট নিষ্কাশন একটি ডিজিটাল PDF এর কন্টেন্ট স্ট্রিমের মধ্যে ইতিমধ্যে বিদ্যমান টেক্সট পড়ে - যখন টেক্সট এমন একটি ফর্ম্যাটে আটকে থাকে যা আপনি সহজে কাজ করতে পারেন না তখন এটি প্রয়োজন। যদি আপনার PDF ডিজিটালভাবে তৈরি হয়, আপনার নিষ্কাশন প্রয়োজন। যদি এটি স্ক্যান করা হয়, আপনার প্রথমে OCR প্রয়োজন।

OCR কি ফোন ক্যামেরা দিয়ে তোলা ছবিতে কাজ করে?

হ্যাঁ, তবে নির্ভুলতা ছবির মানের উপর নির্ভর করে। সেরা ফলাফলের জন্য: ফোনটি নথির সমান্তরালে ধরুন, সমান আলো নিশ্চিত করুন (কোনও ছায়া নেই), ফ্রেমটি পূরণ করুন, স্থির রাখুন এবং উপলব্ধ থাকলে আপনার ফোনের ডকুমেন্ট স্ক্যানিং মোড ব্যবহার করুন। ফোন ফটোগুলি সাধারণত পরিষ্কার মুদ্রিত টেক্সটের জন্য ৮৫-৯৫% নির্ভুলতা তৈরি করে - ফ্ল্যাটবেড স্ক্যানের চেয়ে কম তবে অনুসন্ধানের জন্য প্রায়শই যথেষ্ট।

OCR করার পরে কি আমি টেক্সট সম্পাদনা করতে পারি?

OCR টেক্সট স্তরটি অদৃশ্য এবং স্ক্যান চিত্রের উপরে অবস্থিত। আপনি যেকোনো সম্পাদকে টেক্সট কপি এবং পেস্ট করতে পারেন, সরাসরি টেক্সট স্তর সম্পাদনা করতে Adobe Acrobat Pro ব্যবহার করতে পারেন, বা সম্পাদনার জন্য Word বা প্লেইন টেক্সটে এক্সপোর্ট করতে পারেন। একটি স্ক্যান করা নথির দৃশ্যমান বিষয়বস্তু পরিবর্তন করতে, আপনাকে পুনরায় স্ক্যান করতে হবে বা চিত্রের উপরে টীকা যুক্ত করতে একটি PDF সম্পাদক ব্যবহার করতে হবে।

OCR দিয়ে শুরু করা

যদি আপনার স্ক্যান করা PDF থাকে যা অনুসন্ধানযোগ্য হওয়া দরকার, তবে দ্রুততম পথটি সহজ:

১. আপনার PDF পরীক্ষা করুন - তারা OCR প্রয়োজন কিনা তা নিশ্চিত করতে Ctrl+F পরীক্ষা ব্যবহার করুন ২. PDFSub এর OCR টুলটি চেষ্টা করুন - pdfsub.com/tools/ocr এ একটি স্ক্যান করা PDF আপলোড করুন এবং ফলাফল দেখুন ৩. আউটপুট যাচাই করুন - নির্ভুলতা আপনার চাহিদা পূরণ করে কিনা তা নিশ্চিত করতে কয়েকটি পৃষ্ঠা স্পট-চেক করুন ৪. আপনার অবশিষ্ট নথিগুলি প্রক্রিয়া করুন - একবার আপনি ফলাফলে আত্মবিশ্বাসী হলে, আপনার ব্যাকলগটি কাজ করুন।

PDFSub একটি ৭-দিনের বিনামূল্যে ট্রায়াল অফার করে যাতে প্ল্যাটফর্মের OCR টুল এবং অন্যান্য সমস্ত PDF টুলে অ্যাক্সেস অন্তর্ভুক্ত থাকে। একটি স্ক্যান করা নথি আপলোড করুন এবং অনুসন্ধানযোগ্য টেক্সট যে পার্থক্য তৈরি করে তা দেখুন। যেকোনো সময় বাতিল করুন।

How to OCR a scanned PDF - converting image-only pages into searchable, selectable text

কিভাবে বুঝবেন আপনার PDF-এর OCR প্রয়োজন কিনা

৫-সেকেন্ডের পরীক্ষা

নির্বাচন পরীক্ষা

পৃষ্ঠায় টেক্সট নির্বাচন করতে ক্লিক করে টেনে দেখুন:

যদি আপনি পৃথক শব্দ নির্বাচন করতে পারেন এবং সেগুলি নীল রঙে হাইলাইট হয়: PDF-এ একটি টেক্সট স্তর রয়েছে।
যদি পুরো পৃষ্ঠাটি একটি ব্লক হিসাবে নির্বাচিত হয় (একটি চিত্র নির্বাচন করার মতো): PDF টি কোনও টেক্সট স্তর ছাড়াই একটি স্ক্যান।
যদি আপনি কিছু টেক্সট নির্বাচন করতে পারেন কিন্তু অন্য টেক্সট নির্বাচন করতে না পারেন: PDF-এ আংশিক OCR বা মিশ্র সামগ্রী রয়েছে - কিছু পৃষ্ঠা ডিজিটাল, অন্যগুলি স্ক্যান করা।

OCR-এর প্রয়োজন হতে পারে এমন সাধারণ PDF প্রকারভেদ

ডকুমেন্টের প্রকার	সাধারণত OCR প্রয়োজন?	কারণ
স্ক্যান করা কাগজের নথি	হ্যাঁ	কেবল চিত্র, কোনও টেক্সট ডেটা নেই
ফ্যক্স করা নথি PDF হিসাবে সংরক্ষিত	হ্যাঁ	ফ্যক্স আউটপুট হল রাস্টার চিত্র
নথির ছবি (মোবাইল ক্যামেরা)	হ্যাঁ	ক্যামেরা ক্যাপচার = চিত্র
কপির "ইমেইলে স্ক্যান" থেকে PDF	হ্যাঁ	বেশিরভাগ কপিয়ার চিত্র PDF তৈরি করে
Word/Excel থেকে এক্সপোর্ট করা PDF	না	ডিজিটালভাবে তৈরি, টেক্সট স্তর অন্তর্ভুক্ত
ওয়েব ব্রাউজার থেকে PDF (প্রিন্ট টু PDF)	না	টেক্সট সংরক্ষিত থাকে
অনলাইনে ডাউনলোড করা সরকারি ফর্ম	সাধারণত না	বেশিরভাগই ডিজিটালভাবে তৈরি
PDF সংযুক্তি হিসাবে ইমেল করা রসিদ	সাধারণত না	POS সিস্টেম থেকে টেক্সট সহ তৈরি

ডকুমেন্টের প্রকার	অক্ষরের নির্ভুলতা	অনুসন্ধানযোগ্য?	ডেটা নিষ্কাশন নির্ভরযোগ্য?
আধুনিক মুদ্রিত (লেজার)	৯৫-৯৯%	চমৎকার	হ্যাঁ
আধুনিক মুদ্রিত (ইঙ্কজেট)	৯৩-৯৮%	চমৎকার	সাধারণত
পুরানো টাইপরাইটার	৮৫-৯৫%	ভাল	যাচাই সহ
পরিষ্কার হাতে লেখা (ব্লক)	৭০-৮০%	আংশিক	না - সবকিছু যাচাই করুন
কursive হাতে লেখা	৬০-৭০%	দুর্বল	না
মিশ্র টেক্সট + টেবিল	৯০-৯৭%	ভাল	কাঠামোগত পর্যালোচনার সাথে
ক্ষতিগ্রস্ত/ক্ষতিগ্রস্ত কাগজ	৭০-৯০%	পরিবর্তিত হয়	ভারী যাচাই সহ

OCR এর আগে স্ক্যান করার জন্য সেরা অনুশীলন

রেজোলিউশন: ৩০০ DPI ন্যূনতম

DPI (ডটস প্রতি ইঞ্চি) নির্ধারণ করে স্ক্যানার কতটা বিশদ ক্যাপচার করে।

৩০০ DPI: বেশিরভাগ নথির জন্য স্ট্যান্ডার্ড। সাধারণ ফন্টগুলির নির্ভরযোগ্য সনাক্তকরণের জন্য যথেষ্ট (১০-১২pt)।
৬০০ DPI: ছোট টেক্সট (ফুটার, সূক্ষ্ম প্রিন্ট) বা যখন আপনার সর্বোচ্চ নির্ভুলতা প্রয়োজন তখন প্রস্তাবিত।
১৫০ DPI বা কম: প্রস্তাবিত নয়। অক্ষরগুলি নির্ভরযোগ্য সনাক্তকরণের জন্য খুব ছোট। নির্ভুলতা উল্লেখযোগ্যভাবে হ্রাস পায়।
১২০০ DPI: OCR এর জন্য অতিরিক্ত। কোনও নির্ভুলতা উন্নতি নেই এবং ফাইলের আকার বিশাল হয়ে যায়।

রঙ মোড: গ্রেস্কেল সাধারণত সেরা

গ্রেস্কেল: বেশিরভাগ নথির জন্য সেরা। ভাল বাইনারাইজেশনের জন্য পর্যাপ্ত বৈসাদৃশ্য সংরক্ষণ করে যখন ফাইলের আকার পরিচালনাযোগ্য রাখে।
কালো এবং সাদা: পরিষ্কার, উচ্চ-বৈসাদৃশ্য নথির জন্য কাজ করতে পারে তবে প্রান্তিক অঞ্চলগুলিতে বিশদ নষ্ট করতে পারে।
রঙ: কেবল তখনই প্রয়োজন যদি নথিতে রঙিন-কোডেড তথ্য থাকে যা আপনি সংরক্ষণ করতে চান। OCR উদ্দেশ্যে, রঙ গ্রেস্কেলের চেয়ে কোনও সুবিধা যোগ করে না।

অ্যালাইনমেন্ট এবং ওরিয়েন্টেশন

পৃষ্ঠাগুলি সোজা রাখুন। এমনকি ২-৩ ডিগ্রি কোণও OCR নির্ভুলতা ৫-১০% কমাতে পারে। পৃষ্ঠাগুলি সারিবদ্ধ রাখতে স্ক্যানারের কাগজের গাইড ব্যবহার করুন।
একপাশে স্ক্যান করা পৃষ্ঠাগুলি মুখ নিচে রাখুন। পিছনের দিক থেকে আসা ব্লিড-থ্রু OCR ইঞ্জিনকে বিভ্রান্ত করে এমন ছায়া টেক্সট তৈরি করা এড়িয়ে চলুন।
বাঁধাই করা নথির জন্য ফ্ল্যাটবেড স্ক্যানার ব্যবহার করুন। শীট-ফিড স্ক্যানারগুলি বই বা বাঁধাই করা প্রতিবেদন থেকে পৃষ্ঠাগুলি বাঁকিয়ে দিতে পারে। ফ্ল্যাটবেড স্ক্যানিং পৃষ্ঠাটিকে সমতল এবং সঠিকভাবে সারিবদ্ধ রাখে।

স্ক্যানার রক্ষণাবেক্ষণ এবং নথি প্রস্তুতি

ব্যাচ স্ক্যান করার আগে কাঁচ পরিষ্কার করুন - দাগ প্রতিটি পৃষ্ঠায় আর্টিফ্যাক্ট তৈরি করে
একটি খালি পৃষ্ঠা স্ক্যান করে স্ট্রাইকের জন্য পরীক্ষা করুন - উল্লম্ব রেখাগুলি নোংরা রোলার নির্দেশ করে
জ্যাম এবং স্ক্র্যাচ প্রতিরোধ করতে স্ট্যাপল এবং পেপার ক্লিপগুলি সরান
ভাঁজ করা পৃষ্ঠাগুলি সমতল করুন - গভীর ভাঁজগুলি ছায়া তৈরি করে যা OCR ইঞ্জিন ভুল পড়তে পারে
পিছনের দিকে টেপ দিয়ে ছেঁড়া মেরামত করুন - সামনের দিকে টেপ প্রতিফলন তৈরি করে

OCR এর পরে: পরবর্তী কী করবেন

ফলাফল যাচাই করুন

বিশেষ করে গুরুত্বপূর্ণ নথিগুলির জন্য সর্বদা OCR আউটপুট স্পট-চেক করুন:

মূল পদগুলির জন্য অনুসন্ধান করুন যা আপনি জানেন নথিতে উপস্থিত রয়েছে। যদি Ctrl+F সেগুলিকে ধারাবাহিকভাবে খুঁজে পায়, তবে OCR কাজ করছে।
একটি অনুচ্ছেদ কপি করুন এবং একটি টেক্সট এডিটরে পেস্ট করুন। স্পষ্ট ত্রুটিগুলির জন্য পড়ুন - বিকৃত শব্দ, অনুপস্থিত অক্ষর, অর্থহীন প্রতিস্থাপন।
সংখ্যাগুলি সাবধানে পরীক্ষা করুন। আর্থিক পরিমাণ, তারিখ, ফোন নম্বর এবং অ্যাকাউন্ট নম্বরগুলি উচ্চ-ঝুঁকির ডেটা। লেনদেনের পরিমাণে "6" কে "8" হিসাবে ভুল পড়া একটি বাস্তব সমস্যা। OCR ইঞ্জিনগুলি মাঝে মাঝে অনুরূপ অঙ্কগুলিকে বিভ্রান্ত করে (0/O, 1/l, 5/S, 6/8)।