PDFSub আপনার PDF গুলি কীভাবে প্রসেস করে: ব্রাউজার, ইঞ্জিন এবং AI
বেশিরভাগ অনলাইন PDF টুল আপনার ফাইলগুলি একটি রিমোট সার্ভারে আপলোড করে। PDFSub তিনটি প্রসেসিং স্তর ব্যবহার করে — ব্রাউজার-ভিত্তিক এডিটিং, কনভার্সনের জন্য বিচ্ছিন্ন PDFSub Engine, এবং বুদ্ধিমান বিশ্লেষণের জন্য AI — প্রতিটি আপনার ডেটা সুরক্ষিত রাখার জন্য ডিজাইন করা হয়েছে। এটি ঠিক কীভাবে কাজ করে তা এখানে দেওয়া হলো।
আপনার একটি ব্যাংক স্টেটমেন্টকে Excel-এ রূপান্তর করতে হবে। অথবা দুটি চুক্তিকে একটি PDF-এ মার্জ করতে হবে। অথবা ক্লায়েন্টকে ইমেল করার আগে একটি ট্যাক্স রিটার্ন কম্প্রেস করতে হবে।
তাই আপনি "PDF কনভার্টার" লিখে Google করেন, প্রথম ফলাফলটিতে ক্লিক করেন এবং আপনার ফাইলটি আপলোড বক্সে টেনে আনেন। একটি প্রোগ্রেস বার পূর্ণ হয়। একটি স্পিনার ঘোরে। ত্রিশ সেকেন্ড পরে, আপনি ফলাফল ডাউনলোড করেন।
সহজ। দ্রুত। এবং আপনার সংবেদনশীল নথিটি ইন্টারনেটের মধ্য দিয়ে ভ্রমণ করেছে, একটি অপরিচিত সার্ভারে পৌঁছেছে, এমন সফ্টওয়্যার দ্বারা প্রসেস হয়েছে যা আপনি পরিদর্শন করতে পারবেন না, এবং (আশা করি) পরে মুছে ফেলা হয়েছে।
অনলাইন ডকুমেন্ট টুলের এটিই গোপনীয়তার প্যারাডক্স। যে নথিগুলি আপনার সবচেয়ে বেশি প্রসেস করার প্রয়োজন — ব্যাংক স্টেটমেন্ট, ট্যাক্স রিটার্ন, আইনি চুক্তি, চিকিৎসা রেকর্ড, আর্থিক প্রতিবেদন — সেগুলিই সবচেয়ে সতর্কতার সাথে শেয়ার করা উচিত। তবুও প্রতিটি প্রধান PDF টুলের জন্য স্ট্যান্ডার্ড ওয়ার্কফ্লো আপনাকে সেই ফাইলগুলি একটি তৃতীয় পক্ষের কাছে হস্তান্তর করতে বাধ্য করে।
PDFSub এই প্যাটার্ন ভাঙার জন্য তৈরি করা হয়েছে। বেশিরভাগ অপারেশনের জন্য, আপনার ফাইলগুলি আপনার ডিভাইস ছেড়ে যায় না। এই নিবন্ধটি ঠিক কীভাবে এটি কাজ করে, কখন সার্ভার-সাইড প্রসেসিং সত্যিই প্রয়োজনীয়, এবং আপনি কীভাবে প্রতিটি দাবি নিজেই যাচাই করতে পারেন তা ব্যাখ্যা করে।
বেশিরভাগ অনলাইন PDF টুল কীভাবে কাজ করে
PDFSub কী ভিন্নভাবে করে তা ব্যাখ্যা করার আগে, স্ট্যান্ডার্ড পদ্ধতি বোঝা সহায়ক। প্রায় প্রতিটি অনলাইন PDF টুল — বিনামূল্যে বা পেইড — একই প্যাটার্ন অনুসরণ করে:
১. আপনি আপনার ডিভাইস থেকে একটি ফাইল নির্বাচন করেন ২. ফাইলটি ইন্টারনেটের মাধ্যমে প্রদানকারীর সার্ভারে আপলোড করা হয় ৩. সার্ভার ফাইলটি প্রসেস করে (মার্জ, কম্প্রেস, কনভার্ট, ডেটা এক্সট্র্যাক্ট) ৪. ফলাফলটি আপনাকে ডাউনলোড হিসাবে ফেরত পাঠানো হয় ৫. মূল ফাইলটি তাদের সার্ভারে থাকে যতক্ষণ না এটি (সম্ভবত) মুছে ফেলা হয়
প্রদানকারীর দৃষ্টিকোণ থেকে এই আর্কিটেকচারটি অর্থপূর্ণ। সার্ভার-সাইড প্রসেসিং তৈরি করা সহজ, স্কেল করা সহজ, এবং প্রদানকারীকে সম্পূর্ণ নিয়ন্ত্রণ দেয়। কিন্তু আপনার দৃষ্টিকোণ থেকে, এর মানে হল আপনার নথি এমন পরিকাঠামো স্পর্শ করেছে যা আপনি নিয়ন্ত্রণ করেন না।
এমনকি যদি প্রদানকারী HTTPS ব্যবহার করে, এমনকি যদি তারা প্রসেসিংয়ের পরে ফাইলগুলি মুছে ফেলার প্রতিশ্রুতি দেয়, এবং এমনকি যদি তাদের একটি আশ্বাসজনক গোপনীয়তা নীতি থাকে — আপনার ফাইলটি তাদের সার্ভারে ছিল। এটি তাদের মেমরিতে, তাদের ডিস্কে, সম্ভাব্যভাবে তাদের ব্যাকআপ এবং লগগুলিতে বিদ্যমান ছিল। সাপোর্ট স্টাফের অ্যাক্সেস থাকতে পারে। সাবপ্রসেসররা কপি পেতে পারে। এবং যদি তাদের পরিকাঠামো লঙ্ঘিত হয়, তবে আপনার নথি লক্ষ লক্ষ অন্যদের সাথে প্রকাশিত হতে পারে।
আপনি যে প্রায় সমস্ত অনলাইন PDF টুল ব্যবহার করেছেন তার জন্য এটি সত্য। বড় নামগুলি, বিনামূল্যের সরঞ্জামগুলি, "গোপনীয়তা-কেন্দ্রিক" সরঞ্জামগুলি — প্রায় সবই এই আপলোড-প্রসেস-ডাউনলোড মডেল অনুসরণ করে।
"গোপনীয়তা-কেন্দ্রিক" সাধারণত কী বোঝায়
কিছু টুল নিজেদের গোপনীয়তা-সচেতন হিসাবে বাজারজাত করে। কিন্তু মনোযোগ দিয়ে দেখুন যে এটি সাধারণত কী বোঝায়:
- "ফাইলগুলি ট্রানজিটে এনক্রিপ্ট করা হয়" — এটি কেবল HTTPS। প্রতিটি ওয়েবসাইট এটি ব্যবহার করে। এটি ভ্রমণের সময় আপনার ফাইলকে সুরক্ষিত রাখে, তাদের সার্ভারে থাকার সময় নয়।
- "ফাইলগুলি ২ ঘন্টা পরে মুছে ফেলা হয়" — একটি তৃতীয় পক্ষের সার্ভারে সংবেদনশীল নথির জন্য দুই ঘন্টা একটি দীর্ঘ সময়। এবং "মুছে ফেলা" মানে সবসময় ব্যাকআপ থেকে মুছে ফেলা নয়।
- "আমরা আপনার ফাইল পড়ি না" — প্রযুক্তিগতভাবে সত্য — স্বয়ংক্রিয় সফ্টওয়্যার সেগুলি প্রসেস করে। কিন্তু ফাইলটি এখনও তাদের পরিকাঠামোতে রয়েছে, সার্ভার অ্যাক্সেস আছে এমন যে কেউ এটি অ্যাক্সেস করতে পারে।
- "SOC 2 সার্টিফাইড" — এটি প্রত্যয়িত করে যে নিরাপত্তা প্রক্রিয়া বিদ্যমান, এটি নয় যে লঙ্ঘন ঘটতে পারে না। বিগ ফোরের তিনটি অ্যাকাউন্টিং ফার্মের SOC 2 ছিল যখন MOVEit লঙ্ঘনে ৯৩.৩ মিলিয়ন মানুষের ডেটা প্রকাশিত হয়েছিল।
এই ব্যবস্থাগুলির কোনটিই খারাপ নয়। এগুলি কেবল সত্যিকারের সংবেদনশীল নথিগুলির জন্য অপর্যাপ্ত। সবচেয়ে নিরাপদ পদ্ধতি হল উন্নত এনক্রিপশন বা কম রিটেনশন সময় — ফাইলটি প্রথম স্থানে না পাঠানো।
PDFSub কীভাবে ভিন্ন: ব্রাউজার-ভিত্তিক প্রসেসিং
PDFSub একটি মৌলিকভাবে ভিন্ন আর্কিটেকচারাল পদ্ধতি গ্রহণ করে। প্রসেসিংয়ের জন্য আপনার ফাইল একটি সার্ভারে আপলোড করার পরিবর্তে, PDFSub সরাসরি আপনার ওয়েব ব্রাউজারে প্রসেসিং সফ্টওয়্যার চালায়।
যখন আপনি PDFSub খোলেন এবং একটি PDF লোড করেন, তখন ফাইলটি আপনার ডিভাইস থেকে আপনার ব্রাউজারের মেমরিতে পড়া হয়। প্রসেসিং কোড — JavaScript এবং WebAssembly-এ লেখা — আপনার কম্পিউটারে চলে, আপনার প্রসেসর এবং আপনার RAM ব্যবহার করে। ফলাফল স্থানীয়ভাবে তৈরি হয় এবং সরাসরি আপনার ব্রাউজার থেকে আপনার হার্ড ড্রাইভে ডাউনলোড হয়।
ফাইলটি কখনই নেটওয়ার্ক অতিক্রম করে না। এটি কখনই একটি রিমোট সার্ভার স্পর্শ করে না। কোনও আপলোড নেই, কাঁচা ফাইল ডেটার কোনও ডাউনলোড নেই, কোনও সার্ভার-সাইড স্টোরেজ নেই, কোনও রিটেনশন পিরিয়ড নেই, এবং কোনও তৃতীয় পক্ষের অ্যাক্সেস নেই।
এটি কোনও বিপণন দাবি নয় যার জন্য বিশ্বাসের প্রয়োজন। এটি একটি প্রযুক্তিগত আর্কিটেকচার যা আপনি নিজেই যাচাই করতে পারেন (এ বিষয়ে পরে আলোচনা করা হবে)।
ব্রাউজার-ভিত্তিক প্রসেসিং আসলে কীভাবে কাজ করে
এটি বোঝার জন্য আপনার সফ্টওয়্যার প্রকৌশলী হওয়ার দরকার নেই। একটি ঐতিহ্যবাহী PDF টুলকে একটি ফটো প্রিন্টিং কিয়স্কের মতো ভাবুন। আপনি কিয়স্ককে আপনার ছবি দেন, এটি প্রসেস করে এবং প্রিন্ট করে, এবং (আশা করি) আপনার আসলটি ধ্বংস করে দেয়। আপনাকে কিয়স্ক অপারেটরের উপর বিশ্বাস করতে হবে।
ব্রাউজার-ভিত্তিক প্রসেসিং বাড়িতে একটি ফটো প্রিন্টার থাকার মতো। ছবিটি কখনই আপনার বাড়ি ছেড়ে যায় না। প্রসেসিং আপনার সরঞ্জামগুলিতে, আপনার নিয়ন্ত্রণের অধীনে ঘটে।
যখন PDFSub আপনার ব্রাউজারে লোড হয়, তখন এটি আপনার ডিভাইসে প্রসেসিং সফ্টওয়্যার ডাউনলোড করে। সেই সফ্টওয়্যারটি তখন সম্পূর্ণরূপে আপনার মেশিনে চলে। আপনার ব্রাউজার একটি সুরক্ষিত, স্যান্ডবক্সড পরিবেশ সরবরাহ করে যেখানে কোডটি অন্য কোথাও কাঁচা ফাইল ডেটা পাঠানোর কোনও ক্ষমতা ছাড়াই আপনার ফাইল পড়তে এবং প্রসেস করতে পারে।
একটি সাধারণ অপারেশনের জন্য এখানে ধাপে ধাপে ফ্লো রয়েছে:
১. আপনি PDFSub খোলেন — আপনার ব্রাউজার অ্যাপ্লিকেশন কোড (JavaScript, WebAssembly) ডাউনলোড করে। এটি প্রসেসিং ইঞ্জিন। ২. আপনি একটি PDF ফাইল নির্বাচন করেন — আপনার ব্রাউজার আপনার হার্ড ড্রাইভ থেকে স্থানীয় মেমরিতে ফাইলটি পড়ে। কোনও নেটওয়ার্ক অনুরোধ করা হয় না। ৩. প্রসেসিং স্থানীয়ভাবে ঘটে — JavaScript/WebAssembly কোড PDF কাঠামো পার্স করে, টেক্সট এক্সট্র্যাক্ট করে, পৃষ্ঠাগুলি ম্যানিপুলেট করে, বা আপনি যে অপারেশনটি নির্বাচন করেছেন তা সম্পাদন করে। সমস্ত গণনা আপনার ডিভাইসের প্রসেসর ব্যবহার করে। ৪. ফলাফলটি মেমরিতে তৈরি হয় — আউটপুট ফাইল (মার্জ করা PDF, Excel স্প্রেডশীট, কম্প্রেস করা PDF, ইত্যাদি) আপনার ব্রাউজারের মেমরিতে তৈরি হয়। ৫. আপনি ফলাফল ডাউনলোড করেন — ফাইলটি সরাসরি ব্রাউজার মেমরি থেকে আপনার হার্ড ড্রাইভে সেভ হয়। কোনও সার্ভার জড়িত নয়।
কোনও সময়েই মূল ফাইল — বা এর বিষয়বস্তু — আপনার ডিভাইস ছেড়ে যায় না। ব্রাউজারের নিরাপত্তা মডেল এটি প্রয়োগ করে: একটি ওয়েব পৃষ্ঠায় চলমান JavaScript কোনও নেটওয়ার্ক অনুরোধ না করে নীরবে ডেটা প্রেরণ করতে পারে না, এবং আপনি রিয়েল-টাইমে নেটওয়ার্ক অনুরোধগুলি নিরীক্ষণ করতে পারেন।
ব্রাউজার নিরাপত্তা মডেল আপনাকে সুরক্ষিত রাখে
আধুনিক ওয়েব ব্রাউজারগুলি সুরক্ষার বিভিন্ন স্তর সরবরাহ করে যা এই আর্কিটেকচারকে সত্যিকারের সুরক্ষিত করে তোলে:
- একই-উৎস নীতি (Same-origin policy) — একটি ওয়েবসাইট থেকে কোড অন্য ওয়েবসাইট থেকে ডেটা অ্যাক্সেস করতে পারে না। অন্য কোনও ট্যাব বা ওয়েবসাইট PDFSub-এ আপনি যে ফাইলটি প্রসেস করছেন তা পড়তে পারে না।
- প্রসেস আইসোলেশন — প্রতিটি ব্রাউজার ট্যাব একটি পৃথক স্যান্ডবক্সড প্রসেসে চলে। আপনার কম্পিউটারের অন্যান্য অ্যাপ্লিকেশনগুলি প্রসেস করা ডেটা অ্যাক্সেস করতে পারে না।
- কোনও স্থায়ী স্টোরেজ নেই — আপনি যখন ট্যাবটি বন্ধ করেন, মেমরির সমস্ত ডেটা ধ্বংস হয়ে যায়। সার্ভার-সাইড প্রসেসিংয়ের বিপরীতে, ডিস্কে কোনও অবশিষ্ট কপি নেই, কোনও ব্যাকআপ স্ন্যাপশট নেই, আপনার ডেটা সম্বলিত কোনও লগ ফাইল নেই।
- অডিটেবল নেটওয়ার্ক কার্যকলাপ — আপনার ব্রাউজার দ্বারা করা প্রতিটি নেটওয়ার্ক অনুরোধ ডেভেলপার সরঞ্জামগুলিতে দৃশ্যমান। আপনি রিয়েল-টাইমে যাচাই করতে পারেন যে কোনও ফাইল ডেটা প্রেরণ করা হচ্ছে না।
এটি PDFSub দ্বারা নির্মিত কোনও মালিকানাধীন নিরাপত্তা ব্যবস্থা নয়। এটি ওয়েব প্ল্যাটফর্মের নিজস্ব নিরাপত্তা মডেল, Chrome, Firefox, Safari, এবং Edge দ্বারা প্রয়োগ করা হয়েছে — বিলিয়ন ডলারের নিরাপত্তা বিনিয়োগ দ্বারা সমর্থিত ব্রাউজার।
এটি অফলাইনেও কাজ করে
একবার PDFSub-এর পৃষ্ঠা লোড হয়ে গেলে, আপনি ইন্টারনেট থেকে সংযোগ বিচ্ছিন্ন করলেও অনেক অপারেশন কাজ করে। প্রসেসিং কোড ইতিমধ্যে আপনার ব্রাউজারে রয়েছে। ফাইলটি ইতিমধ্যে মেমরিতে রয়েছে। PDF মার্জ করতে, একটি নথি কম্প্রেস করতে, বা টেক্সট এক্সট্র্যাক্ট করতে কোনও নেটওয়ার্ক সংযোগের প্রয়োজন নেই।
PDFSub লোড করুন, এয়ারপ্লেন মোড চালু করুন, এবং একটি ফাইল প্রসেস করুন। এটি কাজ করে — কারণ ফাইলটি কখনই আপলোড হতে যাচ্ছিল না।
কখন সার্ভার-সাইড প্রসেসিং প্রয়োজনীয়
স্বচ্ছতা গুরুত্বপূর্ণ, তাই সরাসরি বলা যাক: প্রতিটি অপারেশন আপনার ব্রাউজারে হতে পারে না। কিছু কাজের জন্য ব্রাউজারের নেই এমন ক্ষমতা প্রয়োজন, এবং সেগুলির জন্য PDFSub সার্ভার-সাইড প্রসেসিং ব্যবহার করে।
এখানে নির্দিষ্ট পরিস্থিতি রয়েছে:
স্ক্যান করা PDF যার জন্য OCR প্রয়োজন
যখন একটি PDF একটি স্ক্যান করা চিত্র — একটি মুদ্রিত নথির ছবি — তখন আপনার ব্রাউজার পিক্সেল দেখতে পারে কিন্তু টেক্সট পড়তে পারে না। চিত্র থেকে টেক্সট এক্সট্র্যাক্ট করার জন্য অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) প্রয়োজন, যার জন্য AI মডেল প্রয়োজন যা ব্রাউজারে চালানোর জন্য খুব বড় এবং কম্পিউটেশনালি নিবিড়।
স্ক্যান করা নথিগুলির জন্য, PDFটি PDFSub-এর সার্ভারে পাঠানো হয়, যেখানে AI-চালিত OCR চিত্র থেকে টেক্সট পড়ে, ডেটা এক্সট্র্যাক্ট করে এবং ফলাফল ফেরত পাঠায়।
AI-চালিত বৈশিষ্ট্য
AI সামারাইজেশন, AI অনুবাদ, AI ডেটা এক্সট্র্যাকশন, এবং নথি সম্পর্কে AI চ্যাটের মতো বৈশিষ্ট্যগুলির জন্য বড় ভাষা মডেলের প্রয়োজন যা বিশেষ হার্ডওয়্যারে চলে। এই বৈশিষ্ট্যগুলি বর্তমানে ব্রাউজারে চলতে পারে না — মডেলগুলির জন্য উল্লেখযোগ্য কম্পিউটেশনাল সংস্থান প্রয়োজন যা গ্রাহক ডিভাইসগুলি সরবরাহ করতে পারে তার চেয়ে বেশি।
যখন আপনি একটি AI বৈশিষ্ট্য ব্যবহার করেন, তখন প্রাসঙ্গিক নথির বিষয়বস্তু প্রসেসিংয়ের জন্য সার্ভারে পাঠানো হয়।
জটিল সার্ভার-সাইড পার্সিং
কিছু PDF নথিতে অস্বাভাবিক এনকোডিং, ক্ষতিগ্রস্ত কাঠামো, বা এজ-কেস ফরম্যাটিং থাকে যা ব্রাউজার-ভিত্তিক পার্সার পরিচালনা করতে পারে না। এই ক্ষেত্রে, PDFSub একটি সার্ভার-সাইড পার্সারে ফলব্যাক করে যার আরও শক্তিশালী পার্সিং সরঞ্জামগুলিতে অ্যাক্সেস রয়েছে।
সার্ভার-সাইড প্রসেসিংয়ের সময় কী ঘটে
যখন সার্ভার-সাইড প্রসেসিংয়ের প্রয়োজন হয়, তখন ঠিক কী ঘটে:
১. এনক্রিপ্টেড ট্রানজিট — আপনার ফাইলটি TLS (অনলাইন ব্যাংকিং দ্বারা ব্যবহৃত একই এনক্রিপশন) এর মাধ্যমে PDFSub-এর সার্ভারে পাঠানো হয়। ২. মেমরিতে প্রসেসিং — ফাইলটি অবিলম্বে প্রসেস করা হয়। এটি প্রসেসিংয়ের সময় সার্ভার মেমরিতে রাখা হয়, স্থায়ী স্টোরেজে লেখা হয় না। ৩. ফলাফল ফেরত পাঠানো হয় — প্রসেস করা ফলাফল আপনার ব্রাউজারে ফেরত পাঠানো হয়। ৪. তাৎক্ষণিক মুছে ফেলা — মূল ফাইল এবং কোনও মধ্যবর্তী ডেটা প্রসেসিং সম্পন্ন হওয়ার সাথে সাথে সার্ভার মেমরি থেকে মুছে ফেলা হয়। ৫. কোনও রিটেনশন নেই — PDFSub আপনার ফাইলগুলি সংরক্ষণ করে না, ফাইলগুলির বিষয়বস্তু লগ করে না, এবং প্রসেসিংয়ের পরে কোনও নথির ডেটা ধরে রাখে না। ৬. কোনও AI প্রশিক্ষণ নেই — আপনার নথিগুলি কখনই AI মডেল প্রশিক্ষণের জন্য ব্যবহৃত হয় না। ফাইলগুলির বিষয়বস্তু প্রসেস করা হয় এবং বাতিল করা হয়।
অন্যান্য সরঞ্জামগুলির থেকে মূল পার্থক্য: PDFSub কেবল তখনই সার্ভার-সাইড প্রসেসিং ব্যবহার করে যখন এটি প্রযুক্তিগতভাবে প্রয়োজনীয় হয়, এবং কেবল সেই নির্দিষ্ট অপারেশনগুলির জন্য যা এটির প্রয়োজন। বেশিরভাগ সরঞ্জাম প্রতিটি ফাইল তাদের সার্ভারে পাঠায়, এটি প্রয়োজনীয় কিনা তা নির্বিশেষে।
আপনার নথিগুলির জন্য এর অর্থ কী
বিভিন্ন নথিপত্রের বিভিন্ন প্রসেসিং পাথ রয়েছে। এখানে একটি ব্যবহারিক ব্রেকডাউন রয়েছে:
ব্যাংক স্টেটমেন্ট (ডিজিটাল PDF)
আপনি যদি আপনার অনলাইন ব্যাংকিং পোর্টাল থেকে একটি ব্যাংক স্টেটমেন্ট ডাউনলোড করেন, তবে এটি একটি ডিজিটাল PDF — টেক্সট হল আসল টেক্সট, স্ক্যান করা চিত্র নয়। এই নথিগুলির জন্য, PDFSub-এর এক্সট্র্যাকশন ইঞ্জিন সম্পূর্ণরূপে আপনার ব্রাউজারে চলে।
লেনদেনের তারিখ, বিবরণ, পরিমাণ এবং ব্যালেন্স স্থানীয়ভাবে পার্স এবং স্ট্রাকচার করা হয়। আউটপুট — এটি Excel, CSV, QBO, OFX, বা অন্য কোনও ফর্ম্যাট হোক — আপনার ডিভাইসে তৈরি হয়। আপনার ব্যাংক স্টেটমেন্ট, এর অ্যাকাউন্ট নম্বর, লেনদেনের ইতিহাস এবং ব্যালেন্স সহ, আপনার কম্পিউটার ছেড়ে যায় না।
ব্যাংক স্টেটমেন্ট রূপান্তরের জন্য এটি সবচেয়ে সাধারণ পরিস্থিতি, কারণ আজকের বেশিরভাগ ব্যাংক স্টেটমেন্ট ডিজিটালভাবে ডাউনলোড করা হয়।
ব্যাংক স্টেটমেন্ট (স্ক্যান করা)
আপনি যদি কোনও ফিজিক্যাল স্টেটমেন্ট নিয়ে কাজ করেন যা ছবি তোলা বা স্ক্যান করা হয়েছে, তবে PDF-এ টেক্সটের পরিবর্তে চিত্র রয়েছে। এগুলির জন্য চিত্র থেকে টেক্সট পড়ার জন্য সার্ভার-সাইড AI প্রয়োজন। ফাইলটি সার্ভারে পাঠানো হয়, প্রসেস করা হয় এবং পরে অবিলম্বে মুছে ফেলা হয়।
চালান এবং রসিদ
ডিজিটাল চালান এবং রসিদ থেকে টেক্সট এক্সট্র্যাকশন আপনার ব্রাউজারে ঘটে। আপনি যদি AI-চালিত বিশ্লেষণ চান — বিক্রেতার নাম, লাইন আইটেম, ট্যাক্স পরিমাণ, এবং মোট স্বয়ংক্রিয়ভাবে সনাক্ত করা — তার জন্য সার্ভার-সাইড AI প্রসেসিং প্রয়োজন।
চুক্তি এবং আইনি নথি
চুক্তি মার্জ করা, আইনি ফাইলিং কম্প্রেস করা, নির্দিষ্ট পৃষ্ঠাগুলি এক্সট্র্যাক্ট করা, ওয়াটারমার্ক যোগ করা, বিষয়বস্তু রেড্যাক্ট করা, এবং বেশিরভাগ অন্যান্য PDF ম্যানিপুলেশন অপারেশন সম্পূর্ণরূপে আপনার ব্রাউজারে ঘটে। পুরো প্রক্রিয়া জুড়ে নথিটি আপনার ডিভাইসে থাকে।
আর্থিক প্রতিবেদন
ডিজিটাল PDF-এর টেবিলগুলিকে Excel-এ রূপান্তর করা ব্রাউজার-সাইডে কাজ করে। AI-চালিত বিশ্লেষণ — সারাংশ তৈরি করা, মূল মেট্রিকগুলি এক্সট্র্যাক্ট করা, বা বিষয়বস্তু সম্পর্কে প্রশ্ন জিজ্ঞাসা করা — সার্ভার-সাইড প্রসেসিংয়ের প্রয়োজন।
সাধারণ নিয়ম
যদি অপারেশনটি কাঠামোগত হয় (মার্জিং, স্প্লিটিং, কম্প্রেসিং, রোটেটিং, পেজ এক্সট্র্যাক্টিং, ফরম্যাট কনভার্টিং, ওয়াটারমার্ক যোগ করা) — এটি আপনার ব্রাউজারে ঘটে।
যদি অপারেশনের জন্য AI বোঝার প্রয়োজন হয় (সারাংশ তৈরি করা, অনুবাদ, জটিল বা স্ক্যান করা নথি থেকে ডেটা এক্সট্র্যাকশন, প্রশ্নোত্তর) — এর জন্য সার্ভার-সাইড প্রসেসিং প্রয়োজন।
PDFSub ৭৭+ টুলস সরবরাহ করে। বেশিরভাগই ব্রাউজার-ভিত্তিক অপারেশন যা সার্ভার স্পর্শ করে না।
নিয়ন্ত্রিত শিল্পের জন্য
আপনি যদি কঠোর ডেটা হ্যান্ডলিং প্রয়োজনীয়তা সহ কোনও ক্ষেত্রে কাজ করেন, তবে ব্রাউজার-ভিত্তিক এবং সার্ভার-ভিত্তিক প্রসেসিংয়ের মধ্যে পার্থক্যটির বাস্তব সম্মতি প্রভাব রয়েছে।
স্বাস্থ্যসেবা (HIPAA)
HIPAA কভার্ড এন্টিটি এবং বিজনেস অ্যাসোসিয়েটদের রোগীর স্বাস্থ্য তথ্য (PHI) রক্ষা করার প্রয়োজন। যখন আপনি PHI ধারণকারী একটি নথি প্রসেস করার জন্য একটি ক্লাউড-ভিত্তিক টুল ব্যবহার করেন, তখন সেই টুলের প্রদানকারী একজন বিজনেস অ্যাসোসিয়েট হয়ে যায় — যার জন্য একটি স্বাক্ষরিত বিজনেস অ্যাসোসিয়েট এগ্রিমেন্ট (BAA), নথিভুক্ত নিরাপত্তা নিয়ন্ত্রণ, এবং লঙ্ঘন বিজ্ঞপ্তি বাধ্যবাধকতা প্রয়োজন।
যখন আপনি PDFSub-এর ব্রাউজার-ভিত্তিক টুল ব্যবহার করে PHI ধারণকারী একটি PDF প্রসেস করেন, তখন নথিটি আপনার ডিভাইস ছেড়ে যায় না। কোনও PHI শেয়ার করা হয় না, তাই সেই অপারেশনগুলির জন্য কোনও BAA প্রয়োজন হয় না। এটি সম্মতি সহজ করে এবং ভেন্ডর ঝুঁকির একটি বিভাগ দূর করে।
সার্ভার-সাইড প্রসেসিংয়ের প্রয়োজন এমন AI-চালিত বৈশিষ্ট্যগুলির জন্য, স্ট্যান্ডার্ড HIPAA ভেন্ডর মূল্যায়ন প্রযোজ্য।
আর্থিক পরিষেবা
ব্যাঙ্ক, বিনিয়োগ সংস্থা, বীমা সংস্থা এবং আর্থিক উপদেষ্টারা Gramm-Leach-Bliley Act, SEC নিয়ম, FINRA প্রয়োজনীয়তা, এবং রাজ্য-নির্দিষ্ট নিয়মাবলী দ্বারা শাসিত ডেটা পরিচালনা করে। এগুলির জন্য নথিভুক্ত ডেটা হ্যান্ডলিং পদ্ধতি, ভেন্ডর ঝুঁকি মূল্যায়ন, এবং তৃতীয় পক্ষের সাথে ক্লায়েন্ট ডেটা শেয়ার করার সীমা প্রয়োজন।
ব্রাউজার-ভিত্তিক প্রসেসিং মানে ক্লায়েন্টের আর্থিক ডেটা AI-এর প্রয়োজন হয় না এমন অপারেশনের জন্য অন-প্রিমিসেস থাকে। এটি আপনার সম্মতি নথিতে তৃতীয় পক্ষের ডেটা প্রসেসরদের সংখ্যা কমিয়ে দেয় এবং ভেন্ডর ঝুঁকি মূল্যায়ন সহজ করে।
আইনি
আইনজীবীরা অ্যাটর্নি-ক্লায়েন্ট প্রিভিলেজ দ্বারা সুরক্ষিত নথিগুলি পরিচালনা করেন। একটি প্রিভিলেজড নথি একটি তৃতীয় পক্ষের সার্ভারে আপলোড করলে প্রিভিলেজ চ্যালেঞ্জ করার ঝুঁকি তৈরি হয় যদি নথিটি অ্যাক্সেস করা হয়, লঙ্ঘিত হয়, বা প্রদানকারীর কাছ থেকে সাবপোনা করা হয়।
প্রিভিলেজড নথিগুলির উপর মৌলিক PDF অপারেশনের জন্য — ডিসকভারি ফাইল মার্জ করা, এক্সিবিট কম্প্রেস করা, পৃষ্ঠাগুলি এক্সট্র্যাক্ট করা — ব্রাউজার-ভিত্তিক প্রসেসিং মানে নথিটি কখনই আইনজীবীর ডিভাইস ছেড়ে যায় না। প্রিভিলেজ প্রশ্ন ছাড়াই বজায় থাকে।
অ্যাকাউন্টিং এবং ট্যাক্স প্রস্তুতি
IRS সমস্ত ট্যাক্স পেশাদারদের একটি লিখিত তথ্য নিরাপত্তা পরিকল্পনা (WISP) বজায় রাখার প্রয়োজন। AICPA গোপনীয় ক্লায়েন্ট তথ্য তৃতীয় পক্ষের কাছে প্রকাশ সীমাবদ্ধ করে। ক্লায়েন্টের আর্থিক নথিগুলির জন্য ক্লাউড-ভিত্তিক সরঞ্জাম ব্যবহার করলে সম্মতি বাধ্যবাধকতা তৈরি হয়।
ব্রাউজার-ভিত্তিক প্রসেসিং সার্ভার-সাইড AI-এর প্রয়োজন হয় না এমন অপারেশনের জন্য এই বাধ্যবাধকতাগুলি দূর করে। আপনার WISP সহজ হয়ে যায়, আপনার ভেন্ডর ঝুঁকি তালিকা ছোট হয়, এবং আপনার সম্মতি অবস্থান শক্তিশালী হয়।
এটি নিজেই যাচাই করুন
আপনাকে PDFSub-এর এই কোনও কথার উপর নির্ভর করতে হবে না। ব্রাউজার-ভিত্তিক আর্কিটেকচারটি আপনার ওয়েব ব্রাউজারে ইতিমধ্যে তৈরি সরঞ্জামগুলি ব্যবহার করে সম্পূর্ণরূপে অডিটযোগ্য।
ধাপ ১: ডেভেলপার টুলস খুলুন
যেকোনো আধুনিক ব্রাউজারে, F12 চাপুন (অথবা পৃষ্ঠার যেকোনো জায়গায় রাইট-ক্লিক করে "Inspect" নির্বাচন করুন)। এটি ডেভেলপার টুলস প্যানেল খুলবে।
ধাপ ২: নেটওয়ার্ক ট্যাবে যান
Network ট্যাবে ক্লিক করুন। এটি আপনার ব্রাউজার দ্বারা করা প্রতিটি নেটওয়ার্ক অনুরোধ দেখায় — প্রতিটি ফাইল ডাউনলোড, প্রতিটি API কল, প্রতিটি ডেটা ট্রান্সমিশন। আপনার ব্রাউজার থেকে কোনও কিছুই এখানে উপস্থিত না হয়ে পাঠানো যায় না।
ধাপ ৩: লগ সাফ করুন
একটি পরিষ্কার স্লেট দিয়ে শুরু করতে ক্লিয়ার বোতামে (একটি বৃত্ত যার মধ্য দিয়ে একটি রেখা গেছে) ক্লিক করুন।
ধাপ ৪: একটি নথি প্রসেস করুন
PDFSub-এ একটি PDF লোড করুন এবং যেকোনো ব্রাউজার-ভিত্তিক অপারেশন চালান — মার্জ করুন, কম্প্রেস করুন, টেক্সট এক্সট্র্যাক্ট করুন, একটি ব্যাংক স্টেটমেন্ট কনভার্ট করুন।
ধাপ ৫: নেটওয়ার্ক লগ পরিদর্শন করুন
প্রসেসিংয়ের সময় উপস্থিত হওয়া অনুরোধগুলি দেখুন। ব্রাউজার-ভিত্তিক অপারেশনের জন্য, আপনি দেখতে পাবেন:
-
কোনও ফাইল আপলোড অনুরোধ নেই — আপনার PDF ডেটা সার্ভারে বহনকারী কোনও POST বা PUT অনুরোধ নেই।
-
কোনও অনুরোধে নথির বিষয়বস্তু নেই — ফাইল বাইটগুলি আপনার ব্রাউজারের মেমরিতে থাকে।
-
কেবল ছোট মেটাডেটা অনুরোধ — ব্যবহারের অ্যানালিটিক্সের মতো জিনিসগুলি (পৃষ্ঠা ভিউ, বৈশিষ্ট্য ব্যবহার) যা কোনও নথির ডেটা ধারণ করে না।
এটি একই কৌশল যা নিরাপত্তা গবেষকরা ওয়েব অ্যাপ্লিকেশনগুলি অডিট করতে ব্যবহার করেন। যদি PDFSub গোপনে আপনার ফাইলগুলি আপলোড করত, তবে এটি অবিলম্বে দৃশ্যমান হত।
AI অপারেশনগুলির কী হবে?
যদি আপনি এমন একটি বৈশিষ্ট্য ব্যবহার করেন যার জন্য সার্ভার-সাইড AI প্রয়োজন, আপনি নেটওয়ার্ক ট্যাবে একটি নেটওয়ার্ক অনুরোধ দেখতে পাবেন। এটি প্রত্যাশিত — AI প্রসেসিংয়ের জন্য বিষয়বস্তু সার্ভারে পৌঁছাতে হবে। পার্থক্য হল যে PDFSub এই অপারেশনগুলি কখন প্রয়োজন তা সম্পর্কে স্বচ্ছ, প্রতিটি ফাইল নীরবে আপলোড করার পরিবর্তে।
PDFSub কী সংগ্রহ করে বনাম কী করে না
সম্পূর্ণ স্বচ্ছতার অর্থ হল PDFSub কী ডেটা পরিচালনা করে এবং কী করে না সে সম্পর্কে নির্দিষ্ট হওয়া।
PDFSub কী সংগ্রহ করে
- অ্যাকাউন্ট তথ্য — আপনার ইমেল ঠিকানা, নাম, এবং সাবস্ক্রিপশন বিবরণ যদি আপনি একটি অ্যাকাউন্ট তৈরি করেন।
- ব্যবহারের অ্যানালিটিক্স — আপনি কোন টুল ব্যবহার করেন, কত ঘন ঘন, পৃষ্ঠা ভিউ, এবং বৈশিষ্ট্য মিথস্ক্রিয়া। এটি স্ট্যান্ডার্ড ওয়েব অ্যানালিটিক্স যা পণ্য উন্নত করতে সহায়তা করে।
- ত্রুটি প্রতিবেদন — যদি কিছু ভুল হয়, বেনামী ত্রুটির তথ্য (আপনার নথির বিষয়বস্তু নয়) সমস্যাগুলি নির্ণয় এবং সমাধানে সহায়তা করে।
- পেমেন্ট তথ্য — পেমেন্ট প্রদানকারী দ্বারা প্রসেস করা হয় (সরাসরি PDFSub দ্বারা সংরক্ষণ করা হয় না)।
ব্রাউজার-ভিত্তিক অপারেশনের জন্য PDFSub কী সংগ্রহ করে না
- আপনার ফাইলের বিষয়বস্তু — ব্রাউজার-ভিত্তিক অপারেশনের জন্য আপনার PDF-এর বাইটগুলি কখনই PDFSub-এর সার্ভারে প্রেরণ করা হয় না।
- এক্সট্র্যাক্ট করা টেক্সট — লেনদেনের বিবরণ, নাম, পরিমাণ, তারিখ — এই ডেটার কোনওটিই স্থানীয় অপারেশনের জন্য আপনার ডিভাইস ছেড়ে যায় না।
- নথির মেটাডেটা — ফাইলের নাম, লেখকের ক্ষেত্র, PDF-এর মধ্যে তৈরির তারিখগুলি আপনার ডিভাইসে থাকে।
- প্রসেস করা আউটপুট — Excel ফাইল, CSV, মার্জ করা PDF, বা কম্প্রেস করা নথি আপনার ব্রাউজারে তৈরি হয় এবং আপনার ডিভাইসে সেভ হয়।
সার্ভার-সাইড অপারেশনের জন্য
যখন কোনও অপারেশনের জন্য সার্ভার-সাইড প্রসেসিংয়ের প্রয়োজন হয় (AI বৈশিষ্ট্য, স্ক্যান করা নথির OCR), তখন প্রসেসিংয়ের জন্য নথির বিষয়বস্তু সার্ভারে পাঠানো হয় এবং পরে অবিলম্বে মুছে ফেলা হয়। এটি সংরক্ষণ করা হয় না, লগ করা হয় না, সূচীভুক্ত করা হয় না, বা আপনার অনুরোধ করা অপারেশনটি সম্পন্ন করা ছাড়া অন্য কোনও উদ্দেশ্যে ব্যবহার করা হয় না।
অন্যান্য পদ্ধতির সাথে তুলনা
PDFSub-এর পদ্ধতিকে প্রেক্ষাপটে রাখার জন্য, এটি সাধারণ বিকল্পগুলির সাথে কীভাবে তুলনা করে তা এখানে:
| পদ্ধতি | প্রসেসিং কোথায় ঘটে | ফাইল আপলোড প্রয়োজন | ডেটা রিটেনশন | গোপনীয়তার স্তর |
|---|---|---|---|---|
| PDFSub (ব্রাউজার-ভিত্তিক টুলস) | আপনার ডিভাইস | না | কিছুই না | সর্বোচ্চ — ফাইল কখনই ছেড়ে যায় না |
| PDFSub (AI বৈশিষ্ট্য) | PDFSub সার্ভার | হ্যাঁ (যখন প্রয়োজন) | কিছুই না — অবিলম্বে মুছে ফেলা হয় | উচ্চ — ন্যূনতম এক্সপোজার |
| সাধারণ ক্লাউড PDF টুল | প্রদানকারীর সার্ভার | হ্যাঁ, সর্বদা | কয়েক ঘন্টা থেকে কয়েক দিন | মাঝারি — প্রদানকারীর উপর নির্ভর করে |
| এন্টারপ্রাইজ ক্লাউড টুল | প্রদানকারীর সার্ভার | হ্যাঁ, সর্বদা | রিটেনশন নীতি অনুযায়ী | মাঝারি — নথিভুক্ত নিয়ন্ত্রণ |
| ডেস্কটপ সফ্টওয়্যার | আপনার ডিভাইস | না | স্থানীয় ফাইল | উচ্চ — তবে ইনস্টলেশন প্রয়োজন |
ডেস্কটপ সফ্টওয়্যার গোপনীয়তার দিক থেকে সবচেয়ে কাছের তুলনা — উভয়ই স্থানীয়ভাবে প্রসেস করে। ব্রাউজার-ভিত্তিক এর সুবিধা: কোনও ইনস্টলেশন নেই, ব্রাউজার সহ যেকোনো ডিভাইসে কাজ করে, সর্বদা আপ-টু-ডেট, এবং Chromebooks এবং ট্যাবলেটগুলি থেকে অ্যাক্সেসযোগ্য যা ডেস্কটপ সফ্টওয়্যার চালাতে পারে না।
সৎ ট্রেড-অফ
কোনও পদ্ধতি নিখুঁত নয়, এবং বিশ্বস্ত হওয়া মানে সীমাবদ্ধতা সম্পর্কে সৎ হওয়া।
খুব বড় ফাইলগুলির জন্য ব্রাউজার-ভিত্তিক প্রসেসিং ধীর হতে পারে। অপ্টিমাইজ করা হার্ডওয়্যার সহ ডেডিকেটেড সার্ভারগুলি অত্যন্ত বড় নথিগুলির (১০০+ পৃষ্ঠা) জন্য দ্রুত হতে পারে। সাধারণ নথিগুলির জন্য, পার্থক্যটি অলক্ষিত।
AI বৈশিষ্ট্যগুলির জন্য সার্ভার-সাইড প্রসেসিং প্রয়োজন। যদি আপনার AI সারাংশ, অনুবাদ, বা স্ক্যান করা নথিগুলির জন্য OCR প্রয়োজন হয়, তবে বিষয়বস্তু সার্ভারে পৌঁছাতে হবে। PDFSub প্রথমে স্থানীয় প্রসেসিং ব্যবহার করে এবং কেবল তখনই প্রয়োজন হলে বাড়িয়ে এই বিষয়টি কমিয়ে আনে।
ব্রাউজার ক্ষমতাগুলির সীমা রয়েছে। এজ কেস — ক্ষতিগ্রস্ত PDF, অস্বাভাবিক এনকোডিং, অত্যন্ত জটিল লেআউট — এর জন্য সার্ভার-সাইড ফলব্যাক প্রয়োজন হতে পারে। PDFSub এটি সুন্দরভাবে পরিচালনা করে, তবে সেই ক্ষেত্রে ফাইলটি আপনার ডিভাইস ছেড়ে যায়।
দর্শন: যখনই সম্ভব স্থানীয়ভাবে প্রসেস করুন, কেবল তখনই সার্ভার-সাইড ব্যবহার করুন যখন এটি সত্যিই প্রয়োজনীয় হয়, কোনটি কোনটি তা সম্পর্কে স্বচ্ছ হন, এবং যখন সার্ভার প্রসেসিংয়ের প্রয়োজন হয় তখন সবকিছু অবিলম্বে মুছে ফেলুন।
কেন এই আর্কিটেকচার গুরুত্বপূর্ণ
সফ্টওয়্যারের প্রবণতা হল আরও বেশি ক্লাউড প্রসেসিং, আরও বেশি ডেটা সংগ্রহ, আরও বেশি সার্ভার-সাইড গণনা। সংবেদনশীল নথিগুলির জন্য — ব্যাংক স্টেটমেন্ট, ট্যাক্স রিটার্ন, আইনি চুক্তি, চিকিৎসা রেকর্ড, এবং আর্থিক প্রতিবেদন — সেই প্রবণতা ঠিক উল্টো।
সবচেয়ে নিরাপদ ফাইল হল সেটি যা আপনার ডিভাইস ছেড়ে যায় না। সবচেয়ে সুরক্ষিত সার্ভার হল সেটি যা আপনার ডেটা কখনই পায় না। সবচেয়ে শক্তিশালী গোপনীয়তা নীতি হল সেটি যার অস্তিত্বের প্রয়োজন নেই কারণ প্রদানকারীর প্রান্তে রক্ষা করার মতো কিছুই নেই।
PDFSub-এর ব্রাউজার-ভিত্তিক আর্কিটেকচার কোনও বিপণন পার্থক্যকারী নয়। এটি একটি মৌলিক নকশা সিদ্ধান্ত যা প্রতিটি টুল কীভাবে তৈরি হয় তা রূপরেখা দেয়। যখন একটি নতুন বৈশিষ্ট্য ক্লায়েন্ট-সাইডে প্রয়োগ করা যেতে পারে, তখন এটি করা হয়। সার্ভার-সাইড প্রসেসিং হল ব্যতিক্রম, ডিফল্ট নয়।
গোপনীয়তা-সচেতন পেশাদার, সম্মতি কর্মকর্তা এবং আইটি পরিচালকদের জন্য — প্রশ্নটি কেবল "এই সরঞ্জামটির কি একটি ভাল গোপনীয়তা নীতি আছে?" নয়। এটি "এই সরঞ্জামটির কি আমার ফাইলগুলিতে অ্যাক্সেস প্রয়োজন?"
PDFSub যা করে তার বেশিরভাগের জন্য, উত্তরটি হল না।
নিজে চেষ্টা করে দেখুন
PDFSub-এর গোপনীয়তা আর্কিটেকচার মূল্যায়ন করার সেরা উপায় হল এটি নিজে অনুভব করা।
আপনার ৭-দিনের বিনামূল্যের ট্রায়াল শুরু করুন — ৭৭+ টুলস ব্রাউজ করুন, নেটওয়ার্ক ট্যাব খোলা রেখে একটি নথি প্রসেস করুন এবং নিজের জন্য দেখুন। কোনও ফাইল আপলোড নেই। কোনও সার্ভার-সাইড প্রসেসিং নেই। আপনার নথি আপনার ডিভাইসে থাকে।
ব্যাংক স্টেটমেন্ট রূপান্তর, PDF মার্জিং, কম্প্রেশন, টেক্সট এক্সট্র্যাকশন, এবং আরও অনেক অপারেশনের জন্য — আপনার ফাইলগুলি আপনার ব্রাউজার ছেড়ে যায় না। এটি কোনও প্রতিশ্রুতি নয়। এটি একটি আর্কিটেকচার যা আপনি যাচাই করতে পারেন।