স্ক্যান করা PDF কীভাবে পরিষ্কার করবেন (নয়েজ দূর করা, পাতা সোজা করা)
স্ক্যান করা PDF দেখতে অগোছালো লাগে — বাঁকা পাতা, দাগযুক্ত ব্যাকগ্রাউন্ড, আবছা টেক্সট। পেশাদার এবং পাঠযোগ্য ফলাফলের জন্য এগুলো কীভাবে পরিষ্কার করবেন তা এখানে দেওয়া হলো।
আপনি একগুচ্ছ ডকুমেন্ট স্ক্যান করেছেন এবং ফলাফলটি... বেশ অগোছালো। পাতাগুলো কিছুটা বাঁকা। সাদা ব্যাকগ্রাউন্ডে হলদেটে আভা এবং ছোট ছোট দাগ দেখা যাচ্ছে। কাগজে যে টেক্সট একদম স্পষ্ট ছিল, স্ক্রিনে তা আবছা এবং অস্পষ্ট লাগছে। স্ক্যানার গ্লাসে পাতাটি ঠিকমতো না বসার কারণে কিনারা বরাবর কালো ছায়া দেখা যাচ্ছে।
স্ক্যান করার ক্ষেত্রে এটিই বাস্তবতা। এমনকি দক্ষ অপারেটর এবং ভালো স্ক্যানার ব্যবহার করলেও অনেক সময় ফলাফল নিখুঁত হয় না। ফিডিংয়ের সময় কাগজ সরে যেতে পারে। ফ্ল্যাটবেড স্ক্যানার ধুলিকণার প্রতিটি কণা ধরে ফেলে। পুরনো ডকুমেন্টের কাগজ হলদে হয়ে যায়, কালি ফিকে হয়ে যায় এবং কাগজের ক্ষতি হয়, যা স্ক্যানার হুবহু তুলে ধরে। এর ফলে এমন একটি PDF তৈরি হয় যা কার্যকর হলেও দেখতে অপেশাদার এবং পড়তে অসুবিধা হতে পারে।
স্ক্যান করা PDF পরিষ্কার করলে এই অগোছালো স্ক্যানগুলো পরিষ্কার, পেশাদার ডকুমেন্টে রূপান্তরিত হয় — যেখানে পাতাগুলো সোজা থাকে, ব্যাকগ্রাউন্ড সাদা হয়, টেক্সট স্পষ্ট হয় এবং কোনো বর্ডার আর্টফ্যাক্ট থাকে না। আরও ভালো বিষয় হলো, আপনি যদি পরে টেক্সট সার্চযোগ্য এবং সিলেক্টযোগ্য করার জন্য OCR ব্যবহার করেন, তবে পরিষ্কার স্ক্যান থেকে অনেক ভালো ফলাফল পাওয়া যায়।
আপনার স্ক্যান করা PDF কীভাবে পরিষ্কার করবেন, প্রতিটি ক্লিনআপ ধাপ কী কাজ করে এবং কখন ক্লিনআপের সাথে OCR ব্যবহার করবেন তা এখানে দেওয়া হলো।
কেন স্ক্যান করা PDF পরিষ্কার করা প্রয়োজন
কী কারণে স্ক্যান অগোছালো হয় তা বুঝতে পারলে আপনি জানতে পারবেন আপনার ডকুমেন্টের জন্য কোন ক্লিনআপ ধাপগুলো সবচেয়ে গুরুত্বপূর্ণ।
স্কিউ (বাঁকা পাতা)
যখন কাগজ ডকুমেন্ট স্ক্যানারের মধ্য দিয়ে সামান্য কোণেও যায় — এমনকি আধা ডিগ্রি কোণও চোখে পড়ার মতো — তখন ফলাফলটি বাঁকা হয়। এটি প্রতিটি অটোমেটিক ডকুমেন্ট ফিডার (ADF)-এ কিছুটা হলেও ঘটে। মানুষের চোখ স্কিউ বা বাঁকা হওয়ার প্রতি আশ্চর্যজনকভাবে সংবেদনশীল — মাত্র এক ডিগ্রি বাঁকা পাতাও স্পষ্টত আঁকাবাঁকা দেখায়, যা ডকুমেন্টটিকে অপেশাদার করে তোলে।
স্কিউ OCR-এর নির্ভুলতাকেও নষ্ট করে। OCR ইঞ্জিনগুলো টেক্সটকে অনুভূমিক লাইনে আশা করে। যখন পুরো পাতাটি ঘোরানো থাকে, তখন টেক্সট ডিটেকশন অ্যালগরিদমগুলো লাইনের সীমানা শনাক্ত করতে হিমশিম খায়, যার ফলে শব্দগুলো এলোমেলো হয়ে যায়, অক্ষর বাদ পড়ে এবং প্যারাগ্রাফ ভেঙে যায়।
নয়েজ (ছোপ ছোপ দাগ এবং বিন্দু)
স্ক্যানার নয়েজ বিভিন্ন উৎস থেকে আসে: স্ক্যানার গ্লাসের ধুলো, উচ্চ রেজোলিউশনে ধরা পড়া কাগজের টেক্সচার, স্ক্যানার সেন্সরের ইলেকট্রনিক নয়েজ এবং স্ক্যানিং অপটিক্স থেকে আসা আর্টফ্যাক্ট। এর ফলে পুরো পাতায় এলোমেলো বিন্দু এবং দাগ ছড়িয়ে থাকে — যা সাদা ব্যাকগ্রাউন্ডে সবচেয়ে বেশি দৃশ্যমান হয়।
সাদা মার্জিন এবং টেক্সট লাইনের মাঝখানে নয়েজ বিশেষ করে সমস্যাযুক্ত, কারণ এটি দৃশ্যমান বিশৃঙ্খলা তৈরি করে। OCR-এর জন্য, নয়েজ বিন্দুগুলোকে বিরামচিহ্ন বা অক্ষরের অংশ হিসেবে ভুলভাবে ব্যাখ্যা করা হতে পারে — যা OCR ত্রুটির একটি সাধারণ কারণ।
আবছা টেক্সট
সময়ের সাথে সাথে কালি ফিকে হয়ে যায়। লেজার প্রিন্টগুলো দীর্ঘস্থায়ী হলেও ইনকজেট প্রিন্ট, ফটোকপি এবং কার্বন কপিগুলো উল্লেখযোগ্যভাবে ফিকে হয়ে যায়। এমনকি সাম্প্রতিক ডকুমেন্টের প্রিন্ট ঘনত্বও অসমান হতে পারে — যেখানে টোনার নতুন ছিল সেখানে গাঢ় এবং যেখানে টোনার কম ছিল সেখানে হালকা।
আবছা টেক্সট স্ক্রিনে পড়া কঠিন এবং প্রিন্ট করলে খারাপ দেখায়। এটি OCR-এর নির্ভুলতাও কমিয়ে দেয় কারণ অ্যালগরিদমগুলোর অক্ষর সঠিকভাবে শনাক্ত করার জন্য টেক্সট এবং ব্যাকগ্রাউন্ডের মধ্যে স্পষ্ট কন্ট্রাস্ট প্রয়োজন।
কালো বর্ডার এবং ছায়া
যখন একটি পাতা পুরো স্ক্যানার পৃষ্ঠকে ঢেকে রাখে না — অথবা যখন কোনো বইয়ের স্পাইন বা বাঁধাইয়ের অংশ ছায়া তৈরি করে — তখন স্ক্যানে কালো বর্ডার এবং ছায়া দেখা যায়। এগুলো নিছক স্ক্যানিং প্রক্রিয়ার ত্রুটি এবং ডকুমেন্টে এগুলোর কোনো প্রয়োজন নেই। প্রিন্ট করার সময় এগুলো টোনার নষ্ট করে এবং ডকুমেন্টটিকে ফটোকপির ফটোকপির মতো দেখায়।
অসমান ব্যাকগ্রাউন্ড
কাগজ পুরোপুরি সাদা হয় না। পুরনো ডকুমেন্ট হলদে হয়ে যায়। রিসাইকেল করা কাগজে ধূসর আভা থাকে। কিছু ডকুমেন্টে রঙিন কাগজ থাকে। স্ক্যান করার সময় এই ব্যাকগ্রাউন্ডের ভিন্নতাগুলো পিক্সেল ডেটা হিসেবে ধরা পড়ে — যা পড়ার ক্ষেত্রে কোনো অবদান না রেখেই ফাইলের আকার বাড়িয়ে দেয়।
ক্লিনআপের চারটি ধাপ
PDFSub-এর Clean Scanned PDF tool চারটি ক্লিনআপ পর্যায়ের মাধ্যমে ডকুমেন্ট প্রসেস করে, যার প্রতিটি নির্দিষ্ট ধরণের স্ক্যানিং ত্রুটিকে লক্ষ্য করে।
ধাপ ১: ডিস্কিউ (পাতা সোজা করা)
ডিস্কিউ প্রতিটি পাতার প্রধান টেক্সট অ্যাঙ্গেল শনাক্ত করে এবং টেক্সটকে পুরোপুরি অনুভূমিক করার জন্য ইমেজটিকে ঘুরিয়ে দেয়। অ্যালগরিদমটি পুরো পাতায় ডার্ক পিক্সেলের (টেক্সট) বিন্যাস বিশ্লেষণ করে, প্রয়োজনীয় রোটেশন অ্যাঙ্গেল নির্ধারণ করে এবং নিখুঁতভাবে তা প্রয়োগ করে।
বেশিরভাগ পাতার ০.৩ থেকে ২ ডিগ্রি সংশোধনের প্রয়োজন হয়। এই প্রক্রিয়াটি স্বয়ংক্রিয় — আপনাকে কোণ নির্দিষ্ট করতে হবে না। প্রতিটি পাতা আলাদাভাবে বিশ্লেষণ এবং সংশোধন করা হয়, তাই কোনো ডকুমেন্টের ৩ নম্বর পাতা বাম দিকে এবং ৭ নম্বর পাতা ডান দিকে বাঁকা থাকলেও উভয়ই সঠিকভাবে সংশোধিত হয়।
আপনি যা লক্ষ্য করবেন: টেক্সট লাইনগুলো যা আগে কিছুটা বাঁকা ছিল, তা পুরোপুরি সোজা হয়ে যাবে। এই উন্নতি তাৎক্ষণিকভাবে দৃশ্যমান হয় এবং ডকুমেন্টটিকে অনেক বেশি পেশাদার দেখায়।
ধাপ ২: ডিনয়েজ (দাগ দূর করা)
ডিনয়েজিং ছোট ছোট বিচ্ছিন্ন দাগগুলো শনাক্ত করে এবং সরিয়ে ফেলে যা ডকুমেন্টের মূল কন্টেন্টের অংশ নয়। অ্যালগরিদমটি আকার, আকৃতি এবং প্রসঙ্গের ওপর ভিত্তি করে নয়েজ (এলোমেলো ছোট বিন্দু) এবং প্রকৃত কন্টেন্টের (টেক্সট, লাইন, ইমেজ) মধ্যে পার্থক্য করতে পারে।
এর প্রধান চ্যালেঞ্জ হলো দাড়ি, কমা, ডেসিমাল পয়েন্টের মতো সূক্ষ্ম ডিটেইলগুলো নষ্ট না করে নয়েজ দূর করা। PDFSub-এর ক্লিনআপ ইঞ্জিন অ্যাডাপ্টিভ থ্রেশহোল্ডিং ব্যবহার করে যা চারপাশের প্রসঙ্গ বিবেচনা করে — সাদা মার্জিনের মাঝখানে একটি ছোট বিন্দু হলো নয়েজ, কিন্তু বাক্যের শেষে একটি ছোট বিন্দু হলো ফুলস্টপ।
আপনি যা লক্ষ্য করবেন: ব্যাকগ্রাউন্ড আরও পরিষ্কার হবে, মার্জিনগুলো আরও শার্প দেখাবে এবং পুরো ডকুমেন্টটি কম "দানাদার" মনে হবে। অতিরিক্ত নয়েজ থাকা স্ক্যানের ক্ষেত্রে এই উন্নতি নাটকীয় হয়।
ধাপ ৩: কন্ট্রাস্ট বৃদ্ধি করা
কন্ট্রাস্ট এনহান্সমেন্ট টেক্সট (গাঢ়) এবং ব্যাকগ্রাউন্ডের (হালকা) মধ্যে পার্থক্য বাড়িয়ে দেয়। এটি আবছা টেক্সটকে আরও পাঠযোগ্য করে তোলে এবং কন্টেন্ট ও ব্যাকগ্রাউন্ডের মধ্যে একটি পরিষ্কার দৃশ্যমান বিভাজন তৈরি করে।
এই এনহান্সমেন্টটি অ্যাডাপ্টিভ — এটি ইমেজের বৈশিষ্ট্যের ওপর ভিত্তি করে তীব্রতা সমন্বয় করে। বোল্ড টেক্সট থাকা অংশে হালকা টেক্সট থাকা অংশের চেয়ে কম এনহান্সমেন্ট প্রয়োগ করা হয়। এটি ইতিমধ্যে গাঢ় থাকা টেক্সটকে অতিরিক্ত মোটা হওয়া থেকে রক্ষা করে এবং আবছা টেক্সটকে পাঠযোগ্য কন্ট্রাস্টে নিয়ে আসে।
আপনি যা লক্ষ্য করবেন: টেক্সট আরও শার্প এবং কালো দেখাবে। আবছা অংশগুলো পাঠযোগ্য হয়ে উঠবে। ব্যাকগ্রাউন্ড আরও উজ্জ্বল এবং অভিন্ন দেখাবে।
ধাপ ৪: বর্ডার পরিষ্কার করা (কালো কিনারা দূর করা)
বর্ডার ক্লিনিং স্ক্যান করা পাতার কিনারার চারপাশের কালো অংশগুলো শনাক্ত করে এবং সরিয়ে দেয় — যেমন স্ক্যানার লিডের ছায়া, স্ক্যান এরিয়ার চেয়ে ছোট পাতার কালো বার এবং বইয়ের স্পাইন থেকে আসা ছায়া।
অ্যালগরিদমটি পাতার কন্টেন্টের সীমানা শনাক্ত করে এবং এর বাইরের সবকিছু পরিষ্কার সাদা জায়গা দিয়ে প্রতিস্থাপন করে। এটি কন্টেন্ট (যেমন হেডার, ফুটার বা মার্জিন নোট) অক্ষুণ্ণ রেখে বর্ডার আর্টফ্যাক্টগুলো সরিয়ে ফেলে।
আপনি যা লক্ষ্য করবেন: কালো কিনারাগুলো অদৃশ্য হয়ে যাবে। পাতায় পরিষ্কার এবং অভিন্ন মার্জিন থাকবে। প্রিন্ট করার সময় আর বিরক্তিকর বর্ডার থাকবে না।
PDFSub দিয়ে কীভাবে স্ক্যান করা PDF পরিষ্কার করবেন
ধাপে ধাপে নির্দেশাবলী
ধাপ ১: টুলটি ওপেন করুন। pdfsub.com/tools/clean-scan-এ যান।
ধাপ ২: আপনার স্ক্যান করা PDF আপলোড করুন। ফাইলটি ড্র্যাগ অ্যান্ড ড্রপ করুন অথবা ব্রাউজ করতে ক্লিক করুন। PDF-টি PDFSub-এর সুরক্ষিত প্রসেসিং সার্ভারে আপলোড হবে।
ধাপ ৩: ক্লিনআপ অপশনগুলো নির্বাচন করুন। কোন ক্লিনআপ ধাপগুলো প্রয়োগ করবেন তা বেছে নিন। ডিফল্টভাবে চারটি ধাপই চালু থাকে, তবে প্রয়োজনে আপনি যেকোনো ধাপ বন্ধ করতে পারেন। বেশিরভাগ স্ক্যান করা ডকুমেন্টের জন্য চারটি ধাপই সেরা ফলাফল দেয়।
ধাপ ৪: প্রসেস করুন। ক্লিনআপ বাটনে ক্লিক করুন। PDFSub Engine প্রতিটি পাতাকে নির্বাচিত ধাপগুলোর মাধ্যমে প্রসেস করবে। প্রসেসিংয়ের সময় পাতার সংখ্যা এবং রেজোলিউশনের ওপর নির্ভর করে — সাধারণত প্রতি পাতায় ২-৩ সেকেন্ড সময় লাগে।
ধাপ ৫: রিভিউ এবং ডাউনলোড করুন। ফলাফল যাচাই করতে পরিষ্কার করা পাতাগুলো প্রিভিউ করুন। এরপর পরিষ্কার PDF-টি ডাউনলোড করুন।
কখন ক্লিনআপ ধাপগুলো কাস্টমাইজ করবেন
ডিস্কিউ বন্ধ করুন যদি আপনার স্ক্যানগুলো আগে থেকেই পুরোপুরি সোজা থাকে (যেমন পেশাদার ডকুমেন্ট স্ক্যানার থেকে পাওয়া) অথবা যদি ডকুমেন্টে এমন কোনো বাঁকা কন্টেন্ট থাকে যা বাঁকাই থাকা উচিত (যেমন কোনাকুনি ওয়াটারমার্ক)।
ডিনয়েজিং বন্ধ করুন যদি ডকুমেন্টে খুব সূক্ষ্ম ডিটেইল থাকে যা ভুলবশত নয়েজ হিসেবে গণ্য হতে পারে — যেমন স্টিপলড আর্টওয়ার্ক, হাফটোন ফটোগ্রাফ বা ইচ্ছাকৃতভাবে টেক্সচারযুক্ত ব্যাকগ্রাউন্ড থাকা ডকুমেন্ট।
কন্ট্রাস্ট এনহান্সমেন্ট কমিয়ে দিন যদি মূল স্ক্যানে ইতিমধ্যে ভালো কন্ট্রাস্ট থাকে। অতিরিক্ত এনহান্সমেন্ট টেক্সটকে প্রয়োজনের চেয়ে বেশি মোটা করে তুলতে পারে।
বর্ডার ক্লিনিং বন্ধ করুন যদি ডকুমেন্টের কন্টেন্ট পাতার একদম কিনারা পর্যন্ত বিস্তৃত থাকে, অথবা যদি কালো বর্ডারে কোনো প্রয়োজনীয় তথ্য ( যেমন ক্রপ মার্ক বা রেজিস্ট্রেশন মার্ক) থাকে।
ক্লিনআপের সাথে OCR-এর সমন্বয়
স্ক্যান করা PDF পরিষ্কার করার অন্যতম প্রধান কারণ হলো OCR-এর নির্ভুলতায় নাটকীয় উন্নতি। OCR ইঞ্জিনগুলো পরিচিত অক্ষরের একটি ডেটাবেসের সাথে অক্ষরের আকৃতি বিশ্লেষণ করে কাজ করে। অক্ষরের আকৃতি নষ্ট করে এমন যেকোনো কিছু — নয়েজ, স্কিউ, কম কন্ট্রাস্ট বা বর্ডার আর্টফ্যাক্ট — OCR-এর নির্ভুলতা কমিয়ে দেয়।
নির্ভুলতার উন্নতি
OCR চালানোর আগে স্ক্যান করা PDF পরিষ্কার করলে সাধারণত অক্ষর শনাক্তকরণের নির্ভুলতা ৫-১৫ শতাংশ বৃদ্ধি পায়। অতিরিক্ত নয়েজ বা বাঁকা স্ক্যানের ক্ষেত্রে এই উন্নতি আরও বেশি হতে পারে।
- শুধুমাত্র স্কিউ সংশোধন OCR-এর নির্ভুলতা ৩-৮% পর্যন্ত বাড়াতে পারে। OCR ইঞ্জিনগুলো অনুভূমিক টেক্সট লাইন আশা করে — সামান্য বাঁকা হলেও শব্দ বিভাজনে ত্রুটি দেখা দেয়।
- নয়েজ দূর করা ভুল অক্ষর শনাক্তকরণ রোধ করে। মার্জিনের এলোমেলো বিন্দুগুলো অক্ষর বা বিরামচিহ্ন হিসেবে ভুলভাবে শনাক্ত হয় না।
- কন্ট্রাস্ট এনহান্সমেন্ট OCR ইঞ্জিনকে ব্যাকগ্রাউন্ড থেকে অক্ষর আলাদা করতে সাহায্য করে, বিশেষ করে আবছা বা হালকা টেক্সটের ক্ষেত্রে।
প্রস্তাবিত কাজের ধারা
সেরা ফলাফলের জন্য প্রথমে স্ক্যানটি পরিষ্কার করুন, তারপর OCR চালান:
১. স্ক্যান করা PDF-টি PDFSub-এর Clean Scanned PDF tool-এ আপলোড করুন। ২. পরিষ্কার করা ভার্সনটি ডাউনলোড করুন। ৩. পরিষ্কার করা PDF-টি PDFSub-এর OCR tool-এ আপলোড করুন। ৪. সার্চযোগ্য এবং সিলেক্টযোগ্য PDF-টি ডাউনলোড করুন।
এই দুই ধাপের প্রক্রিয়াটি সরাসরি অগোছালো স্ক্যানে OCR চালানোর চেয়ে অনেক ভালো ফলাফল দেয়।
সাধারণ পরিস্থিতি
অফিসের ডকুমেন্ট স্ক্যান
সবচেয়ে সাধারণ ক্ষেত্র: অফিসের মাল্টিফাংশন প্রিন্টারে স্ক্যান করা চুক্তিপত্র, চিঠি, ফর্ম এবং রিপোর্ট। এগুলোর জন্য সাধারণত চারটি ক্লিনআপ ধাপই প্রয়োজন হয় — ADF স্কিউ তৈরি করে, স্ক্যানার নয়েজ যোগ করে এবং ফ্ল্যাটবেডে স্ক্যান করা ডকুমেন্টে বর্ডার শ্যাডো থাকে।
বই এবং ম্যাগাজিনের পাতা
বাঁধাই করা উপকরণ স্ক্যান করলে অনন্য কিছু ত্রুটি তৈরি হয়: স্পাইনের কাছের বাঁকা পাতা বিকৃতি এবং ছায়া তৈরি করে, বাঁধাইয়ের কোণের কারণে পাতা কিছুটা বাঁকা হতে পারে এবং মোটা স্পাইন এক কিনারা বরাবর কালো ব্যান্ড তৈরি করে। এই স্ক্যানগুলোর জন্য বর্ডার ক্লিনিং এবং ডিস্কিউ বিশেষভাবে গুরুত্বপূর্ণ।
ঐতিহাসিক এবং আর্কাইভাল ডকুমেন্ট
পুরনো ডকুমেন্টের কাগজ হলদে হয়ে যায়, কালি ফিকে হয়ে যায় এবং বয়সের কারণে বাদামী দাগ পড়ে। এই ডকুমেন্টগুলোর জন্য কন্ট্রাস্ট এনহান্সমেন্ট সবচেয়ে কার্যকর ধাপ — এটি আবছা টেক্সটকে পুনরায় পাঠযোগ্য করে তোলে। ঐতিহাসিক ডকুমেন্টে ডিনয়েজ করার সময় সতর্ক থাকুন, কারণ কিছু দৃশ্যমান দাগ ঐতিহাসিকভাবে গুরুত্বপূর্ণ হতে পারে।
রসিদ এবং থার্মাল প্রিন্ট
থার্মাল পেপার (রসিদ প্রিন্টারে ব্যবহৃত) দ্রুত ফিকে হয়ে যায় এবং স্ক্যান করলে খারাপ দেখায়। টেক্সট প্রায়ই কালোর বদলে হালকা ধূসর হয় এবং কাগজে ছোপ ছোপ ভাব তৈরি হয়। থার্মাল প্রিন্টের জন্য শক্তিশালী কন্ট্রাস্ট এনহান্সমেন্ট এবং ডিনয়েজিং ভালো কাজ করে কারণ এতে সংরক্ষণের মতো সূক্ষ্ম ডিটেইল খুব কমই থাকে।
মাল্টি-পেজ ফর্ম
সরকারি ফর্ম, ট্যাক্স ডকুমেন্ট এবং অ্যাপ্লিকেশন প্যাকেটে প্রায়ই প্রি-প্রিন্টেড বক্স, লাইন এবং শেডিং থাকে যা ক্লিনআপকে জটিল করে তোলে। ক্লিনআপ ইঞ্জিন এগুলো ভালোভাবে হ্যান্ডেল করতে পারে — প্রি-প্রিন্টেড উপাদানগুলো ডিনয়েজিংয়ের পরেও টিকে থাকার মতো যথেষ্ট বড় হয় এবং ডিস্কিউ পুরো ফর্মটিকে সঠিকভাবে সোজা করে।
সচরাচর জিজ্ঞাস্য (FAQ)
ক্লিনআপ কি আমার ডকুমেন্টের কন্টেন্ট পরিবর্তন করবে?
না। ক্লিনআপ শুধুমাত্র স্ক্যান করা ইমেজের ভিজ্যুয়াল কোয়ালিটি উন্নত করে — এটি সোজা করে, নয়েজ দূর করে, কন্ট্রাস্ট বাড়ায় এবং বর্ডার পরিষ্কার করে। এটি কোনো টেক্সট বা কন্টেন্ট যোগ, বিয়োগ বা পরিবর্তন করে না। পাতার তথ্য হুবহু একই থাকে।
আমি কি এমন PDF পরিষ্কার করতে পারি যা স্ক্যান করা নয়?
ক্লিনআপ টুলটি স্ক্যান করা PDF-এর জন্য ডিজাইন করা হয়েছে — এমন ডকুমেন্ট যেখানে প্রতিটি পাতা একটি রাস্টার ইমেজ। এটি স্ক্যান করা নয় এমন PDF-এর কোনো ক্ষতি করবে না, তবে ক্লিনআপ ধাপগুলো বিশেষভাবে স্ক্যানিং ত্রুটির জন্য তৈরি করা হয়েছে এবং ডিজিটাল উৎস (যেমন Word এক্সপোর্ট) থেকে তৈরি PDF-এর ক্ষেত্রে তেমন কোনো উন্নতি করবে না।
ক্লিনআপ ফাইলের আকার কতটা কমায়?
এটি ভিন্ন ভিন্ন হতে পারে, তবে ক্লিনআপ সাধারণত ফাইলের আকার ২০-৪০% কমিয়ে দেয়। নয়েজ রিমুভাল প্রতি পাতায় হাজার হাজার অপ্রয়োজনীয় পিক্সেল দূর করে। বর্ডার ক্লিনিং বড় কালো অংশগুলো সরিয়ে দেয়। কন্ট্রাস্ট এনহান্সমেন্ট অভিন্ন ব্যাকগ্রাউন্ড তৈরি করে কম্প্রেশন দক্ষতা বাড়াতে পারে। একটি ৫০ পাতার স্ক্যান করা ডকুমেন্ট যা ৮০ MB ছিল, তা ক্লিনআপের পর ৫০-৬০ MB-তে নেমে আসতে পারে।
ক্লিনআপ কি রঙিন স্ক্যানের ওপর কাজ করে?
হ্যাঁ। চারটি ক্লিনআপ ধাপই রঙিন, গ্রেস্কেল এবং সাদাকালো স্ক্যানের ওপর কাজ করে। রঙিন স্ক্যানগুলো বিশেষ করে ব্যাকগ্রাউন্ড নরমালাইজেশন এবং বর্ডার ক্লিনিং থেকে উপকৃত হয়। কন্ট্রাস্ট এনহান্সমেন্ট এমনভাবে প্রয়োগ করা হয় যা টেক্সটের পাঠযোগ্যতা বাড়ানোর পাশাপাশি রঙের তথ্য বজায় রাখে।
ফলাফল পছন্দ না হলে কি আমি ক্লিনআপ আনডু করতে পারি?
ক্লিনআপ একটি নতুন ফাইল তৈরি করে — আপনার মূল PDF কখনোই পরিবর্তিত হয় না। যদি ক্লিনআপ সন্তোষজনক না হয়, তবে আপনার মূল ফাইলে ফিরে যান। এই কারণে, পরিষ্কার করা ভার্সনের পাশাপাশি সবসময় মূল স্ক্যানটি সংরক্ষণ করুন।
সারসংক্ষেপ
স্ক্যান করা PDF পরিষ্কার করা একটি চার ধাপের প্রক্রিয়া যা অগোছালো স্ক্যানকে পেশাদার ডকুমেন্টে রূপান্তরিত করে:
| ধাপ | যা ঠিক করে | প্রভাব |
|---|---|---|
| ডিস্কিউ | বাঁকা পাতা | সোজা, পেশাদার চেহারা |
| ডিনয়েজ | ছোপ ছোপ দাগ এবং বিন্দু | পরিষ্কার ব্যাকগ্রাউন্ড, স্পষ্ট টেক্সট |
| এনহান্স | আবছা, কম-কন্ট্রাস্ট টেক্সট | পাঠযোগ্য, প্রিন্টযোগ্য আউটপুট |
| বর্ডার ক্লিন | কালো কিনারা এবং ছায়া | অভিন্ন মার্জিন, কোনো ত্রুটি নেই |
প্রতিটি ধাপ স্বতন্ত্র এবং এগুলো চালু বা বন্ধ করা যেতে পারে। বেশিরভাগ স্ক্যান করা ডকুমেন্টের জন্য চারটি ধাপই চালানো সেরা ফলাফল দেয়। পরিষ্কার করা আউটপুট ফাইলের আকারে ছোট হয়, দেখতে আরও পেশাদার হয় এবং পরে যদি আপনার সার্চযোগ্য টেক্সটের প্রয়োজন হয় তবে অনেক ভালো OCR ফলাফল দেয়।
আপনার স্ক্যানগুলো পরিষ্কার করতে প্রস্তুত? PDFSub-এর Clean Scanned PDF tool ব্যবহার করে দেখুন — আপনার স্ক্যান করা PDF আপলোড করুন এবং কয়েক সেকেন্ডের মধ্যে একটি পরিষ্কার, পেশাদার ফলাফল পান।