PDF तः Excel प्रति परिवर्तनम्: प्रभाविन्यः रीतयः
दत्तांशं प्रारूपं च सुरक्षितं स्थापयित्वा PDF सञ्चिकाः Excel कोष्ठकेषु परिवर्तयितुं उत्तमाः उपायाः अत्र ज्ञायन्ताम्।
भवतः दत्तांशः PDF मध्ये निरुद्धः अस्ति, तस्य च Excel मध्ये आवश्यकता वर्तते। कदाचित् एषः वित्तीयवृत्तान्तः (financial report), बीजकं (invoice), अथवा उत्पाद-दत्तांशस्य सारणी भवितुं शक्नोति। समस्या का? PDF सञ्चिकाः सम्पादनार्थं न निर्मिताः—ताः सर्वत्र समानाः दृश्येरन् इति धिया निर्मिताः सन्ति।
तस्य दत्तांशस्य उपयोगयोग्य-कोष्ठके (spreadsheet) परिवर्तनस्य वास्तविकाः उपायाः अत्र सन्ति।
PDF तः Excel प्रति परिवर्तनं किमर्थं कठिनम्
PDF तथा Excel कोष्ठकानां प्रयोजनं पूर्णतया भिन्नं भवति। PDF दृश्यविन्यासं (visual layout) सुरक्षितं रक्षति—एतत् मूलतः एकं अङ्कीय-मुद्रणम् (digital printout) अस्ति। Excel तु गणनायै विश्लेषणाय च दत्तांशं पङ्क्तिषु स्तम्भेषु च व्यवस्थितं करोति।
अत्र आह्वानं किम्? HTML सारणीवत् PDF मध्ये संरचनात्मकं सूचनां न भवति। अत्र <table>, <tr>, अथवा <td> सदृशाः ट्याग्-संकेताः न सन्ति ये तन्त्रांशं (software) वदेयुः यत् पङ्क्तयः स्तम्भाः च कुत्र आरभन्ते कुत्र च समाप्यन्ते। परिवर्तकेन दृश्यस्थित्याधारेण अनुमानं कर्तव्यं भवति।
एतस्मात् कारणात् साक्षात् परिवर्तनेन प्रायः अव्यवस्थितः परिणामः प्राप्यते: स्तम्भाः मिलिताः भवन्ति, सङ्ख्याः पाठरूपेण दृश्यन्ते, प्रारूपं (formatting) च विकृतं भवति।
विधिः १: Microsoft Excel इत्यस्य अन्तर्निर्मितम् आयातनम् (Import)
यदि भवतः समीपे Excel 2019 वा ततः परं संस्करणं (Microsoft 365 सहितम्) अस्ति, तर्हि भवन्तः Power Query इत्यस्य उपयोगेन साक्षात् PDF दत्तांशम् आयातयितुं शक्नुवन्ति।
कथं करणीयम्
- Excel उद्घाट्य Data → Get Data → From File → From PDF इत्यत्र गच्छन्तु।
- स्वकीयां PDF सञ्चिकां चिनुतु।
- Power Query उपलब्धसारणीः दर्शयति—यस्याः आवश्यकता अस्ति तां चिनुतु।
- आयातनं स्वच्छं कर्तुं Transform Data नुदन्तु, अथवा साक्षात् कोष्ठके आनेतुं Load नुदन्तु।
गुणाः दोषाः च
एतस्मै उत्तमम्: सरलाः, सुव्यवस्थिताः PDF सञ्चिकाः यत्र सामान्याः सारण्यः सन्ति।
अत्र काठिन्यम्: जटिलाः विन्यासाः, मिलिताः कोष्ठाः (merged cells), बहुपृष्ठीयाः सारण्यः।
सूचना: एषा सुविधा Excel इत्यस्य Mac संस्करणेषु उपलब्धा नास्ति।
विधिः २: Adobe Acrobat
Adobe Acrobat (शुल्कयुक्तं संस्करणं, न तु केवलं Reader) PDF सञ्चिकाः साक्षात् Excel प्रारूपे निर्यातं (export) कर्तुं शक्नोति।
कथं करणीयम्
- Acrobat मध्ये स्वकीयां PDF सञ्चिकाम् उद्घाटयन्तु।
- File → Export To → Spreadsheet → Microsoft Excel Workbook इत्यत्र गच्छन्तु।
- रक्षणस्थानं (save location) चिनुतु।
Adobe एकं निःशुल्कं अन्तर्जाल-परिवर्तकम् अपि ददाति यस्य उपयोगः सीमितः अस्ति।
गुणाः दोषाः च
एतस्मै उत्तमम्: Adobe उपकरणैः निर्मिताः PDF सञ्चिकाः, मूल-दस्तावेजाः (न तु स्कैन् कृताः)।
अत्र काठिन्यम्: स्कैन् कृताः दस्तावेजाः, जटिलं प्रारूपणम्।
विधिः ३: अन्तर्जालस्थाः परिवर्तकाः (Online Converters)
बहूनि निःशुल्कानि अन्तर्जाल-उपकरणानि तन्त्रांश-संस्थापनं (software installation) विना PDF तः Excel मध्ये परिवर्तनं कुर्वन्ति।
प्रसिद्धाः विकल्पाः
| उपकरणम् | उत्तमम् | सीमाः |
|---|---|---|
| Smallpdf | शीघ्रपरिवर्तनाय | निःशुल्कस्तरे दैनन्दिनसीमाः |
| iLovePDF | समूह-प्रक्रियायै (Batch processing) | सञ्चिका-आकारस्य सीमाः |
| PDF2Go | सरलसारणीभ्यः | जटिलविन्यासेषु समस्या भवितुं शक्नोति |
गोपनीयता-विचारः
यदा भवन्तः अन्तर्जाल-परिवर्तकानां उपयोगं कुर्वन्ति, तदा भवतः सञ्चिका तेषां सर्वर्-मध्ये अपलोड् भवति। संवेदनशील-वित्तीय-दत्तांशस्य कृते, अफलाइन-विधीनां वा तादृश-उपकरणानां विचारं कुर्वन्तु ये भवतः ब्राउझर्-मध्ये एव सञ्चिकाः संसाधयन्ति।
विधिः ४: प्रतिलिपिकरणं लेपनं च (हस्तकृतम्)
कदाचित् सरलतमः मार्गः एव कार्यं करोति—विशेषतः अल्पदत्तांशस्य कृते।
कथं करणीयम्
- PDF उद्घाट्य मूषकेन (mouse) सारणीं चिनुतु।
- प्रतिलिपिं कुर्वन्तु (Ctrl+C वा Cmd+C)।
- Excel मध्ये लेपयन्तु (Ctrl+V वा Cmd+V)।
- प्रारूपण-समस्याः निवारयितुं Data → Text to Columns इत्यस्य उपयोगं कुर्वन्तु।
एतत् कदा कार्यं करोति
एषा पद्धतिः सरलासु, एकपृष्ठीयासु सारणीषु उत्तमा अस्ति यत्र केवलं शीघ्रं निष्कर्षणं आवश्यकम्। परिणामान् स्वच्छं कर्तुं समयः व्ययितुं सज्जाः भवन्तु।
सामान्याः समस्याः तासां समाधानं च
सङ्ख्याः पाठरूपेण आयाताः
Excel भवतः सङ्ख्याः पाठरूपेण (text strings) स्वीकर्तुं शक्नोति, येन गणनाः बाधिताः भवन्ति।
समाधानम्: स्तम्भं चिनुतु, Data → Text to Columns इत्यत्र गत्वा Finish नुदन्तु। अथवा कोष्ठकान् 1 इत्यनेन गुणयन्तु येन बलात् परिवर्तनं भवेत्।
स्तम्भाः मिलिताः (Merged)
बहुभ्यः स्तम्भेभ्यः प्राप्तः दत्तांशः एकस्मिन् एव कोष्ठे समाप्तः भवति।
समाधानम्: दत्तांशं पृथक् कर्तुं विभाजकेन (delimiter - यथा रिक्तस्थानं, अल्पविरामः वा) सह Text to Columns इत्यस्य उपयोगं कुर्वन्तु।
लुप्त-दत्तांशः
परिवर्तने काचित् सामग्री न दृश्यते।
समाधानम्: अन्यत् परिवर्तक-उपकरणं प्रयुञ्जताम्—प्रत्येकं विन्यासं भिन्नरूपेण गृह्णाति। स्कैन् कृत-PDF कृते भवतः समीपे OCR (optical character recognition) क्षमता आवश्यकी।
प्रारूपं नष्टम्
वर्णाः, अक्षराणि (fonts), कोष्ठ-सीमाः च नश्यन्ति।
समाधानम्: अधिकांश-परिवर्तकाः दत्तांशे ध्यानं ददति, न तु दृश्य-प्रारूपणे। भवद्भिः Excel मध्ये पुनः हस्तकृतं प्रारूपणं करणीयम् भविष्यति।
उत्तम-परिवर्तन-परिणामानां कृते परामर्शः
यथासम्भवं मूल-PDF (Native PDF) उपयुज्यताम्
अङ्कीयरूपेण निर्मिताः PDF (Word, Excel, वा लेखा-तन्त्रांशात्) स्कैन् कृत-कागज-दस्तावेजानां अपेक्षया बहु सम्यक् परिवर्तन्ते। यदि विकल्पः अस्ति, तर्हि अङ्कीय-संस्करणस्य अनुरोधं कुर्वन्तु।
OCR क्षमतां पश्यन्तु
यदि भवतः PDF एकं स्कैन् कृतं चित्रम् अस्ति, तर्हि OCR युक्तस्य परिवर्तकस्य आवश्यकता अस्ति। विशेषतः एतां सुविधां अन्विष्यन्तु—Smallpdf तथा Adobe Acrobat द्वयमपि एतत् ददाति।
सर्वदा परिणामस्य पुष्टिं कुर्वन्तु
कोऽपि परिवर्तकः पूर्णः नास्ति। परिवर्तनात् परम्:
- पश्यन्तु यत् पङ्क्ति-स्तम्भ-सङ्ख्याः मूलेन सह मिलन्ति वा।
- स्रोतस्य विरुद्धं कासाञ्चित् सङ्ख्यानां पुष्टिं कुर्वन्तु।
- मिलितं वा लुप्तं वा दत्तांशं अन्विष्यन्तु।
एतस्मिन् एकः निमेषः एव भवति किन्तु भविष्ये घण्टापर्यन्तं समस्या-निवारणात् रक्षति।
दस्तावेज-प्रकारं विचारयन्तु
विभिन्न-प्रकारस्य PDF सञ्चिकाभ्यः भिन्नाः उपायाः आवश्यकाः:
| दस्तावेज-प्रकारः | उत्तम-विधिः |
|---|---|
| बैंक-विवरणानि (Bank statements) | विशिष्टाः वित्तीय-परिवर्तकाः |
| बीजकानि (Invoices) | Adobe Acrobat वा अन्तर्जाल-उपकरणानि |
| दत्तांश-वृत्तान्ताः (Data reports) | Power Query (Excel अन्तर्निर्मितम्) |
| स्कैन्-दस्तावेजाः | OCR-क्षमतायुक्तानि उपकरणानि |
यदा परिवर्तनं पर्याप्तं न भवति
कदाचित् कोऽपि परिवर्तकः भवतः दत्तांशं स्वच्छतया निष्कर्षितुं न शक्नोति। एतत् प्रायः एतेषु भवति:
- जटिलविन्यासयुक्ताः अत्यन्तं विन्यासिताः दस्तावेजाः।
- असङ्गततया बहुस्तम्भेषु व्याप्तदत्तांशयुक्ताः PDF सञ्चिकाः।
- न्यून-चित्रगुणवत्तायुक्ताः स्कैन्-दस्तावेजाः।
- कूटशब्द-सुरक्षिताः सञ्चिकाः (प्रथमं सुरक्षां निष्कासयन्तु)।
एतेषु स्थितिषु, हस्तकृत-प्रविष्टिः (manual entry) अथवा भवतः विशिष्ट-दस्तावेज-प्रकाराय निर्मितः विशिष्ट-तन्त्रांशः एव एकमात्रः विश्वसनीयः विकल्पः भवितुं शक्नोति।
प्रायः पृष्टाः प्रश्नाः (FAQ)
किमहं कूटशब्द-सुरक्षितां PDF सञ्चिकाम् Excel मध्ये परिवर्तयितुं शक्नोमि?
भवद्भिः प्रथमं कूटशब्द-सुरक्षा निष्कासनीया भविष्यति। यदि भवन्तः कूटशब्दं जानन्ति, तर्हि Adobe Reader सदृशे दर्शके PDF उद्घाट्य, सुरक्षां विना PDF रूपेण मुद्रयन्तु, ततः परिवर्तयन्तु। यदि कूटशब्दः नास्ति, तर्हि दस्तावेज-निर्मात्रा सह सम्पर्कं कुर्वन्तु।
Excel मध्ये मम सङ्ख्याः पाठरूपेण किमर्थं दृश्यन्ते?
PDF सङ्ख्या-पाठयोः भेदं न करोति—ताः सर्वे पृष्ठे केवलं वर्णाः सन्ति। यदा Excel एतं दत्तांशम् आयातयति, तदा एतत् पूर्वनिर्धारितरूपेण पाठ-प्रारूपं स्वीकर्तुं शक्नोति। परिवर्तयितुं Data → Text to Columns उपयुज्यताम् अथवा 1 इत्यनेन गुणयन्तु।
कया पद्धत्या अत्यन्तं शुद्धः परिणामः प्राप्यते?
एतत् भवतः दस्तावेजे निर्भरं भवति। सरलसारणीयुक्तानां मूल-PDF कृते, Excel इत्यस्य Power Query प्रायः सम्यक् कार्यं करोति। जटिलदस्तावेजानां कृते, Adobe Acrobat वा विशिष्टाः परिवर्तकाः उत्तमं प्रदर्शनं कुर्वन्ति। ज्ञातुं एकमात्रः उपायः अस्ति स्वकीयां सञ्चिकां प्रयोक्तुम्।
किमहं युगपत् बह्वीः PDF सञ्चिकाः परिवर्तयितुं शक्नोमि?
आम्, किन्तु रीतयः भिन्नाः सन्ति। iLovePDF सदृशानि कानिचन अन्तर्जाल-उपकरणानि समूह-परिवर्तनस्य (batch conversion) समर्थनं कुर्वन्ति। Power Query अपि केनचित् विन्यासेन सह बहु-सञ्चिकाः आयातयितुं शक्नोति। नियमित-समूह-प्रक्रियायै, Adobe Acrobat Pro सदृशं डेस्कटॉप्-तन्त्रांशं सर्वाधिकं कुशलं भवति।
PDF तः Excel परिवर्तनं स्वयञ्चालितं कर्तुं कश्चन उपायः अस्ति वा?
यदा मूल-PDF अद्यतनं भवति, तदा Power Query संबन्धाः स्वयमेव नवीकर्तुं शक्यन्ते। अधिक-उन्नत-स्वयञ्चालनाय, Python सदृशाः प्रोग्रामिङ्ग्-भाषाः Tabula वा Camelot सदृशैः पुस्तकालयैः (libraries) सह PDF सञ्चिकाः संसाधयितुं शक्नुवन्ति।
सारांशः
PDF तः Excel प्रति परिवर्तनं सर्वदा सरलं न भवति, किन्तु भवतः समीपे विकल्पाः सन्ति:
- Excel Power Query सरलासु, सुव्यवस्थितासु सारणीषु।
- Adobe Acrobat मूल-PDF सञ्चिकासु विश्वसनीय-परिणामाय।
- अन्तर्जाल-परिवर्तकाः शीघ्रं, कदाचित् आवश्यकतायै।
- हस्तकृत-प्रतिलिपि-लेपनं लघु-सरल-निष्कर्षणाय।
मुख्यं विषयं तु भवतः दस्तावेज-प्रकारानुसारं पद्धतिं मेलयितुं—तथा च परिवर्तित-दत्तांशे विश्वासं कर्तुं पूर्वं सर्वदा परिणामानां पुष्टिं कर्तुम्।