स्कैन किए गए PDF को कैसे साफ़ करें (नॉइज़ हटाएँ, पेजों को सीधा करें)
स्कैन किए गए PDF अव्यवस्थित दिखते हैं — टेढ़े पेज, धब्बेदार बैकग्राउंड, धुंधला टेक्स्ट। पेशेवर और पठनीय परिणाम के लिए उन्हें साफ़ करने का तरीका यहाँ दिया गया है।
आपने दस्तावेज़ों का एक ढेर स्कैन किया, और परिणाम... काफी खराब दिख रहा है। पेज थोड़े टेढ़े हैं। सफेद बैकग्राउंड में धब्बे और स्पॉट के साथ पीलापन है। जो टेक्स्ट कागज पर बिल्कुल साफ था, वह स्क्रीन पर धुंधला और अस्पष्ट दिख रहा है। किनारों पर गहरी परछाइयाँ बन गई हैं जहाँ पेज स्कैनर के शीशे पर सपाट नहीं बैठा था।
स्कैनिंग की यही वास्तविकता है। सावधान ऑपरेटरों के साथ अच्छे स्कैनर भी अपूर्ण परिणाम देते हैं। फीडिंग के दौरान कागज हिल जाता है। फ्लैटबेड स्कैनर धूल के हर कण को पकड़ लेते हैं। पुराने दस्तावेज़ों में पीला कागज, फीकी स्याही और भौतिक क्षति होती है जिसे स्कैनर हूबहू उतार देता है। परिणाम एक ऐसा PDF होता है जो तकनीकी रूप से तो काम करता है लेकिन पेशेवर नहीं दिखता और उसे पढ़ना मुश्किल हो सकता है।
स्कैन किए गए PDF को साफ़ करना इन अव्यवस्थित स्कैन को साफ, पेशेवर दस्तावेज़ों में बदल देता है — सीधे पेज, सफेद बैकग्राउंड, स्पष्ट टेक्स्ट और बिना किसी बॉर्डर आर्टिफैक्ट के। इससे भी बेहतर, यदि आप बाद में टेक्स्ट को खोजने योग्य और चयन योग्य बनाने के लिए OCR चलाते हैं, तो साफ स्कैन नाटकीय रूप से बेहतर परिणाम देते हैं।
यहाँ बताया गया है कि अपने स्कैन किए गए PDF को कैसे साफ़ करें, प्रत्येक क्लीनअप चरण क्या करता है, और क्लीनअप को OCR के साथ कब जोड़ना चाहिए।
स्कैन किए गए PDF को क्लीनअप की आवश्यकता क्यों होती है
यह समझना कि गड़बड़ी किस वजह से होती है, आपको यह जानने में मदद करता है कि आपके दस्तावेज़ों के लिए कौन से क्लीनअप चरण सबसे अधिक मायने रखते हैं।
स्क्यू (टेढ़े पेज)
जब कागज दस्तावेज़ स्कैनर के माध्यम से थोड़े से कोण पर भी जाता है — आधा डिग्री भी ध्यान देने योग्य होता है — तो परिणामी इमेज टेढ़ी हो जाती है। यह हर ऑटोमैटिक डॉक्यूमेंट फीडर (ADF) के साथ कुछ हद तक होता है। मानवीय आँख स्क्यू के प्रति आश्चर्यजनक रूप से संवेदनशील होती है — सिर्फ एक डिग्री झुका हुआ पेज भी स्पष्ट रूप से टेढ़ा दिखता है, जिससे दस्तावेज़ अधूरा और गैर-पेशेवर लगता है।
स्क्यू OCR की सटीकता को भी खराब करता है। OCR इंजन उम्मीद करते हैं कि टेक्स्ट क्षैतिज (horizontal) लाइनों में चले। जब पूरा पेज घुमा हुआ होता है, तो टेक्स्ट डिटेक्शन एल्गोरिदम लाइन की सीमाओं की पहचान करने के लिए संघर्ष करते हैं, जिससे शब्द आपस में मिल जाते हैं, अक्षर छूट जाते हैं और पैराग्राफ टूट जाते हैं।
नॉइज़ (धब्बे और बिंदु)
स्कैनर नॉइज़ कई स्रोतों से आता है: स्कैनर के शीशे पर धूल, उच्च रिज़ॉल्यूशन पर कैप्चर की गई कागज की बनावट, स्कैनर के सेंसर में इलेक्ट्रिकल नॉइज़ और स्कैनिंग ऑप्टिक्स से आने वाले आर्टिफैक्ट। इसका परिणाम पूरे पेज पर बिखरे हुए रैंडम डॉट्स और धब्बों के रूप में होता है — जो सफेद बैकग्राउंड पर सबसे अधिक दिखाई देते हैं लेकिन पूरी इमेज में मौजूद होते हैं।
नॉइज़ विशेष रूप से सफेद मार्जिन और टेक्स्ट लाइनों के बीच समस्याग्रस्त होता है, जहाँ यह विज़ुअल क्लटर पैदा करता है। OCR के लिए, नॉइज़ डॉट्स को विराम चिह्न, विशेष चिह्न या अक्षरों के हिस्से के रूप में गलत समझा जा सकता है — जो OCR त्रुटियों का एक सामान्य स्रोत है।
धुंधला टेक्स्ट
समय के साथ स्याही फीकी पड़ जाती है। लेज़र प्रिंट लंबे समय तक चलते हैं, लेकिन इंकजेट प्रिंट, फोटोकॉपी और कार्बन कॉपी काफी फीकी पड़ जाती हैं। यहाँ तक कि अपेक्षाकृत हाल के दस्तावेज़ों में भी असमान प्रिंट घनत्व हो सकता है — जहाँ टोनर नया था वहाँ गहरा, और जहाँ यह कम हो रहा था वहाँ हल्का।
धुंधले टेक्स्ट को स्क्रीन पर पढ़ना मुश्किल होता है और यह खराब प्रिंट होता है। यह OCR सटीकता को भी कम करता है क्योंकि एल्गोरिदम को अक्षरों की विश्वसनीय पहचान करने के लिए टेक्स्ट और बैकग्राउंड के बीच स्पष्ट कंट्रास्ट की आवश्यकता होती है।
डार्क बॉर्डर और परछाइयाँ
जब कोई पेज पूरी स्कैनर सतह को कवर नहीं करता है — या जब किसी किताब की बाइंडिंग परछाई बनाती है — तो स्कैन डार्क बॉर्डर और शैडो क्षेत्रों को कैप्चर कर लेता है। ये विशुद्ध रूप से स्कैनिंग प्रक्रिया के आर्टिफैक्ट हैं और दस्तावेज़ में इनका कोई उद्देश्य नहीं है। प्रिंट होने पर ये टोनर बर्बाद करते हैं और दस्तावेज़ को फोटोकॉपी की फोटोकॉपी जैसा दिखाते हैं।
असमान बैकग्राउंड
कागज पूरी तरह से सफेद नहीं होता है। पुराने दस्तावेज़ पीले हो गए हैं। रीसायकल किए गए कागज में ग्रे रंग की झलक होती है। कुछ दस्तावेज़ों में रंगीन कागज होता है। स्कैन किए जाने पर, इन बैकग्राउंड विविधताओं को पिक्सेल डेटा के रूप में कैप्चर किया जाता है — जो पठनीयता में कुछ भी योगदान दिए बिना फ़ाइल के आकार में मेगाबाइट जोड़ते हैं।
चार क्लीनअप चरण
PDFSub का Clean Scanned PDF टूल दस्तावेज़ों को चार क्लीनअप चरणों के माध्यम से प्रोसेस करता है, जिनमें से प्रत्येक एक विशिष्ट प्रकार के स्कैनिंग आर्टिफैक्ट को लक्षित करता है।
चरण 1: डिस्स्क्यू (पेजों को सीधा करना)
डिस्स्क्यूइंग प्रत्येक पेज पर मुख्य टेक्स्ट एंगल का पता लगाता है और टेक्स्ट को पूरी तरह से क्षैतिज बनाने के लिए इमेज को घुमाता है। एल्गोरिदम पेज पर डार्क पिक्सेल (टेक्स्ट) के वितरण का विश्लेषण करता है, आवश्यक रोटेशन के कोण को निर्धारित करता है, और इसे सब-डिग्री सटीकता के साथ लागू करता है।
अधिकांश पेजों को 0.3 से 2 डिग्री के सुधार की आवश्यकता होती है। यह प्रक्रिया स्वचालित है — आपको कोण निर्दिष्ट करने की आवश्यकता नहीं है। प्रत्येक पेज का स्वतंत्र रूप से विश्लेषण और सुधार किया जाता है, इसलिए यदि किसी दस्तावेज़ में पेज 3 बाईं ओर झुका है और पेज 7 दाईं ओर, तो दोनों सुधार सही ढंग से लागू होते हैं।
आप क्या नोटिस करेंगे: टेक्स्ट लाइनें जो थोड़ी तिरछी दिखती थीं, वे पूरी तरह से क्षैतिज हो जाती हैं। सुधार तुरंत दिखाई देता है और दस्तावेज़ को काफी अधिक पेशेवर बनाता है।
चरण 2: डिनॉइज़ (धब्बे हटाना)
डिनॉइज़िंग उन छोटे अलग-थलग निशानों की पहचान करता है और उन्हें हटाता है जो दस्तावेज़ की सामग्री का हिस्सा नहीं हैं। एल्गोरिदम आकार, आकृति और संदर्भ के आधार पर नॉइज़ (रैंडम छोटे डॉट्स) और वास्तविक सामग्री (टेक्स्ट, लाइनें, इमेज) के बीच अंतर करता है।
मुख्य चुनौती पूर्ण विराम, अल्पविराम, दशमलव बिंदु और विशेष चिह्नों जैसे बारीक विवरणों को नुकसान पहुँचाए बिना नॉइज़ को हटाना है। PDFSub का क्लीनअप इंजन एडेप्टिव थ्रेशोल्डिंग का उपयोग करता है जो आसपास के संदर्भ पर विचार करता है — सफेद मार्जिन के बीच में एक छोटा बिंदु नॉइज़ है, जबकि वाक्य के अंत में एक छोटा बिंदु पूर्ण विराम है।
आप क्या नोटिस करेंगे: बैकग्राउंड साफ हो जाता है, मार्जिन स्पष्ट दिखते हैं, और पूरा दस्तावेज़ कम "दानेदार" दिखाई देता है। भारी नॉइज़ वाले स्कैन पर, सुधार नाटकीय होता है।
चरण 3: कंट्रास्ट बढ़ाना (Enhance Contrast)
कंट्रास्ट एन्हांसमेंट टेक्स्ट (गहरा) और बैकग्राउंड (हल्का) के बीच के अंतर को बढ़ाता है। यह धुंधले टेक्स्ट को अधिक पठनीय बनाता है और सामग्री और बैकग्राउंड के बीच एक स्पष्ट विज़ुअल अलगाव बनाता है।
यह एन्हांसमेंट एडेप्टिव है — यह स्थानीय इमेज विशेषताओं के आधार पर तीव्रता को समायोजित करता है। बोल्ड टेक्स्ट वाले पेज सेक्शन को हल्के, धुंधले टेक्स्ट वाले सेक्शन की तुलना में कम एन्हांसमेंट मिलता है। यह पहले से ही गहरे टेक्स्ट को धुंधला होने से रोकता है और धुंधले टेक्स्ट को पठनीय कंट्रास्ट तक लाता है।
आप क्या नोटिस करेंगे: टेक्स्ट अधिक स्पष्ट और काला दिखाई देता है। धुंधले हिस्से पठनीय हो जाते हैं। बैकग्राउंड अधिक चमकदार और एकसमान दिखाई देता है।
चरण 4: बॉर्डर साफ़ करना (डार्क किनारों को हटाना)
बॉर्डर क्लीनिंग स्कैन किए गए पेजों के किनारों के आसपास के डार्क क्षेत्रों का पता लगाती है और उन्हें हटाती है — जैसे स्कैनर के ढक्कन से परछाइयाँ, स्कैन क्षेत्र से छोटे पेजों से काली पट्टियाँ, और किताबों की बाइंडिंग से शैडो आर्टिफैक्ट।
एल्गोरिदम पेज की सामग्री की सीमा की पहचान करता है और उसके बाहर की हर चीज़ को साफ सफेद स्थान से बदल देता है। यह बॉर्डर आर्टिफैक्ट को हटा देता है जबकि उस सामग्री को सुरक्षित रखता है जो पेज के किनारे तक फैली हुई है (जैसे हेडर, फुटर या मार्जिन नोट्स)।
आप क्या नोटिस करेंगे: डार्क किनारे गायब हो जाते हैं। पेज में साफ, एकसमान मार्जिन होते हैं। प्रिंट किए गए आउटपुट में अब विचलित करने वाले बॉर्डर नहीं होते हैं।
PDFSub के साथ स्कैन किए गए PDF को कैसे साफ़ करें
चरण-दर-चरण निर्देश
चरण 1: टूल खोलें। pdfsub.com/tools/clean-scan पर जाएँ।
चरण 2: अपना स्कैन किया हुआ PDF अपलोड करें। फ़ाइल को ड्रैग और ड्रॉप करें या ब्राउज़ करने के लिए क्लिक करें। PDF, PDFSub के सुरक्षित प्रोसेसिंग सर्वर पर अपलोड हो जाता है।
चरण 3: क्लीनअप विकल्प चुनें। चुनें कि कौन से क्लीनअप चरणों को लागू करना है। डिफ़ॉल्ट रूप से चारों सक्षम हैं, लेकिन यदि आवश्यक हो तो आप किसी भी चरण को अक्षम कर सकते हैं। अधिकांश स्कैन किए गए दस्तावेज़ों के लिए, चारों चरण सर्वोत्तम परिणाम देते हैं।
चरण 4: प्रोसेस करें। क्लीनअप बटन पर क्लिक करें। PDFSub Engine चयनित चरणों के माध्यम से प्रत्येक पेज को प्रोसेस करता है। प्रोसेसिंग का समय पेजों की संख्या और उनके रिज़ॉल्यूशन पर निर्भर करता है — प्रति पेज लगभग 2-3 सेकंड की उम्मीद करें।
चरण 5: समीक्षा करें और डाउनलोड करें। परिणामों को सत्यापित करने के लिए साफ किए गए पेजों का पूर्वावलोकन करें। साफ PDF डाउनलोड करें।
क्लीनअप चरणों को कब कस्टमाइज़ करें
डिस्स्क्यू को अक्षम करें यदि आपके स्कैन पहले से ही पूरी तरह से संरेखित हैं (उदाहरण के लिए, अच्छे संरेखण वाले पेशेवर दस्तावेज़ स्कैनर से) या यदि दस्तावेज़ में तिरछी सामग्री है जिसे तिरछा ही रहना चाहिए (जैसे तिरछे वॉटरमार्क)।
डिनॉइज़िंग को अक्षम करें यदि दस्तावेज़ में बहुत बारीक विवरण हैं जिन्हें गलती से नॉइज़ समझा जा सकता है — जैसे स्टिपल्ड आर्टवर्क, हाफ़टोन फोटोग्राफ, या जानबूझकर बनावट वाले बैकग्राउंड वाले दस्तावेज़।
कंट्रास्ट एन्हांसमेंट कम करें यदि मूल स्कैन में पहले से ही अच्छा कंट्रास्ट है। अधिक एन्हांसमेंट टेक्स्ट को इच्छित से अधिक मोटा दिखा सकता है।
बॉर्डर क्लीनिंग को अक्षम करें यदि दस्तावेज़ में ऐसी सामग्री है जो पेज के बिल्कुल किनारे तक फैली हुई है, या यदि डार्क बॉर्डर में उपयोगी जानकारी (जैसे क्रॉप मार्क्स या रजिस्ट्रेशन मार्क्स) है।
क्लीनअप को OCR के साथ जोड़ना
स्कैन किए गए PDF को साफ़ करने के सबसे सम्मोहक कारणों में से एक OCR सटीकता में नाटकीय सुधार है। OCR इंजन ज्ञात अक्षर रूपों के डेटाबेस के विरुद्ध अक्षरों के आकार का विश्लेषण करके काम करते हैं। कोई भी चीज़ जो अक्षरों के आकार को खराब करती है — नॉइज़, स्क्यू, कम कंट्रास्ट, या बॉर्डर आर्टिफैक्ट — OCR सटीकता को कम कर देती है।
सटीकता में सुधार
OCR चलाने से पहले स्कैन किए गए PDF को साफ़ करने से आमतौर पर अक्षर पहचान की सटीकता में 5-15 प्रतिशत अंकों का सुधार होता है। भारी नॉइज़ या स्क्यू वाले स्कैन पर, सुधार और भी अधिक नाटकीय हो सकता है।
- अकेले स्क्यू सुधार से OCR सटीकता में 3-8% का सुधार हो सकता है। OCR इंजन क्षैतिज टेक्स्ट लाइनों की अपेक्षा करते हैं — मामूली स्क्यू भी शब्द विभाजन त्रुटियों का कारण बनता है।
- नॉइज़ हटाना गलत अक्षर पहचान को रोकता है। मार्जिन में रैंडम डॉट्स को अक्षरों या विराम चिह्नों के रूप में गलत नहीं पहचाना जाता है।
- कंट्रास्ट एन्हांसमेंट OCR इंजन को बैकग्राउंड से अक्षरों को अलग करने में मदद करता है, विशेष रूप से फीके या हल्के टेक्स्ट के साथ।
अनुशंसित कार्यप्रवाह (Workflow)
सर्वोत्तम परिणामों के लिए, पहले स्कैन को साफ़ करें, फिर OCR चलाएँ:
- स्कैन किए गए PDF को PDFSub के Clean Scanned PDF टूल पर अपलोड करें
- साफ किया गया वर्शन डाउनलोड करें
- साफ किए गए PDF को PDFSub के OCR टूल पर अपलोड करें
- खोजने योग्य, चयन योग्य PDF डाउनलोड करें
यह दो-चरणीय प्रक्रिया सीधे अव्यवस्थित स्कैन पर OCR चलाने की तुलना में बेहतर परिणाम देती है।
सामान्य परिदृश्य
ऑफिस दस्तावेज़ स्कैन
सबसे आम मामला: ऑफिस मल्टीफ़ंक्शन प्रिंटर पर स्कैन किए गए अनुबंध, पत्र, फॉर्म और रिपोर्ट। इन्हें आमतौर पर चारों क्लीनअप चरणों की आवश्यकता होती है — ADF स्क्यू पेश करता है, स्कैनर नॉइज़ जोड़ता है, और फ्लैटबेड पर नीचे की ओर स्कैन किए गए दस्तावेज़ों में बॉर्डर शैडो होती है।
किताब और पत्रिका के पेज
बाइंड की गई सामग्री को स्कैन करने से अद्वितीय आर्टिफैक्ट बनते हैं: बाइंडिंग के पास घुमावदार पेज विरूपण और परछाई पैदा करता है, पेज बाइंडिंग कोण से थोड़े टेढ़े हो सकते हैं, और मोटी बाइंडिंग एक किनारे पर एक डार्क बैंड बनाती है। इन स्कैन के लिए बॉर्डर क्लीनिंग और डिस्स्क्यू विशेष रूप से महत्वपूर्ण हैं।
ऐतिहासिक और अभिलेखीय दस्तावेज़
पुराने दस्तावेज़ों में पीला कागज, फीकी स्याही, फॉक्सिंग (उम्र बढ़ने से भूरे धब्बे) और भौतिक क्षति होती है। इन दस्तावेज़ों के लिए कंट्रास्ट एन्हांसमेंट सबसे प्रभावशाली चरण है — यह फीके टेक्स्ट को फिर से पठनीय बनाता है। ऐतिहासिक दस्तावेज़ों पर सावधानी से डिनॉइज़ करें, क्योंकि कुछ विज़ुअल आर्टिफैक्ट ऐतिहासिक रूप से महत्वपूर्ण हो सकते हैं।
रसीदें और थर्मल प्रिंट
थर्मल पेपर (रसीद प्रिंटर में उपयोग किया जाने वाला) तेजी से फीका पड़ता है और खराब स्कैन होता है। टेक्स्ट अक्सर काले रंग के बजाय हल्के भूरे रंग का होता है, और कागज पर धब्बेदार रूप विकसित हो जाता है। थर्मल प्रिंट के लिए आक्रामक कंट्रास्ट एन्हांसमेंट और डिनॉइज़िंग अच्छी तरह से काम करते हैं क्योंकि शायद ही कभी कोई बारीक विवरण सुरक्षित रखना होता है।
मल्टी-पेज फॉर्म
सरकारी फॉर्म, टैक्स दस्तावेज़ और एप्लिकेशन पैकेट में अक्सर पहले से प्रिंट किए गए बॉक्स, लाइनें और शेडिंग होती है जो क्लीनअप को जटिल बनाती है। क्लीनअप इंजन इन्हें अच्छी तरह से संभालता है — पहले से प्रिंट किए गए तत्व डिनॉइज़िंग से बचने के लिए पर्याप्त बड़े होते हैं, और डिस्स्क्यू पूरे फॉर्म को सही ढंग से संरेखित करता है।
अक्सर पूछे जाने वाले प्रश्न
क्या क्लीनअप मेरे दस्तावेज़ की सामग्री को बदल देगा?
नहीं। क्लीनअप केवल स्कैन की गई इमेज की विज़ुअल गुणवत्ता को प्रभावित करता है — यह सीधा करता है, नॉइज़ हटाता है, कंट्रास्ट बढ़ाता है और बॉर्डर साफ़ करता है। यह किसी भी टेक्स्ट या सामग्री को जोड़ता, हटाता या संशोधित नहीं करता है। पेज पर जानकारी बिल्कुल वैसी ही रहती है।
क्या मैं ऐसे PDF को साफ़ कर सकता हूँ जो स्कैन नहीं किया गया है?
क्लीनअप टूल स्कैन किए गए PDF के लिए डिज़ाइन किया गया है — ऐसे दस्तावेज़ जहाँ प्रत्येक पेज एक रास्टर इमेज है। यह गैर-स्कैन किए गए PDF को नुकसान नहीं पहुँचाएगा, लेकिन क्लीनअप चरण विशेष रूप से स्कैनिंग आर्टिफैक्ट के लिए डिज़ाइन किए गए हैं और डिजिटल स्रोतों (जैसे वर्ड एक्सपोर्ट) से बनाए गए PDF में सार्थक सुधार नहीं करेंगे।
क्लीनअप फ़ाइल के आकार को कितना कम करता है?
यह अलग-अलग होता है, लेकिन क्लीनअप आमतौर पर फ़ाइल के आकार को 20-40% तक कम कर देता है। नॉइज़ हटाने से प्रति पेज हजारों अनावश्यक पिक्सेल समाप्त हो जाते हैं। बॉर्डर क्लीनिंग बड़े डार्क क्षेत्रों को हटा देती है। कंट्रास्ट एन्हांसमेंट अधिक एकसमान बैकग्राउंड बनाकर संपीड़न दक्षता (compression efficiency) में सुधार कर सकता है। 50-पेज का स्कैन किया हुआ दस्तावेज़ जो 80 MB का था, क्लीनअप के बाद 50-60 MB तक आ सकता है।
क्या क्लीनअप रंगीन स्कैन पर काम करता है?
हाँ। चारों क्लीनअप चरण रंगीन, ग्रेस्केल और ब्लैक-एंड-व्हाइट स्कैन पर काम करते हैं। रंगीन स्कैन को विशेष रूप से बैकग्राउंड सामान्यीकरण और बॉर्डर क्लीनिंग से लाभ होता है। कंट्रास्ट एन्हांसमेंट को इस तरह से लागू किया जाता है कि टेक्स्ट की पठनीयता में सुधार करते हुए रंग की जानकारी सुरक्षित रहे।
अगर मुझे परिणाम पसंद नहीं आया तो क्या मैं क्लीनअप को अनडू (undo) कर सकता हूँ?
क्लीनअप एक नई फ़ाइल बनाता है — आपका मूल PDF कभी संशोधित नहीं होता है। यदि क्लीनअप संतोषजनक नहीं है, तो बस अपनी मूल फ़ाइल पर वापस जाएँ। इस कारण से, हमेशा मूल स्कैन को साफ किए गए वर्शन के साथ रखें।
सारांश
स्कैन किए गए PDF को साफ़ करना एक चार-चरणीय प्रक्रिया है जो अव्यवस्थित स्कैन को पेशेवर दस्तावेज़ों में बदल देती है:
| चरण | यह क्या ठीक करता है | प्रभाव |
|---|---|---|
| डिस्स्क्यू | टेढ़े पेज | सीधा, पेशेवर रूप |
| डिनॉइज़ | धब्बे और बिंदु | साफ बैकग्राउंड, स्पष्ट टेक्स्ट |
| एन्हांस | फीका, कम कंट्रास्ट वाला टेक्स्ट | पठनीय, प्रिंट करने योग्य आउटपुट |
| बॉर्डर क्लीनिंग | डार्क किनारे और परछाइयाँ | एकसमान मार्जिन, कोई आर्टिफैक्ट नहीं |
प्रत्येक चरण स्वतंत्र है और इसे चालू या बंद किया जा सकता है। अधिकांश स्कैन किए गए दस्तावेज़ों के लिए, चारों चरणों को चलाना सबसे अच्छा परिणाम देता है। साफ किया गया आउटपुट फ़ाइल आकार में छोटा, दिखने में अधिक पेशेवर होता है, और यदि आपको बाद में खोजने योग्य टेक्स्ट की आवश्यकता होती है, तो यह नाटकीय रूप से बेहतर OCR परिणाम देता है।
अपने स्कैन को साफ़ करने के लिए तैयार हैं? PDFSub का Clean Scanned PDF टूल आज़माएँ — अपना स्कैन किया हुआ PDF अपलोड करें और सेकंडों में एक साफ, पेशेवर परिणाम प्राप्त करें।