কিভাবে একটি পিডিএফ থেকে সংবেদনশীল তথ্য সরাবেন
পিডিএফ-এ টেক্সটের উপর একটি কালো বাক্স আঁকলে তা মুছে যায় না। টেক্সট সেখানে থেকেই যায়, নির্বাচনযোগ্য, অনুসন্ধানযোগ্য এবং বের করা যায়। সংবেদনশীল তথ্য স্থায়ীভাবে মুছে ফেলার জন্য কিভাবে একটি পিডিএফ সঠিকভাবে রেড্যাক্ট করবেন তা এখানে দেওয়া হলো।
আপনার একটি পিডিএফ আছে যার ৩ নম্বর পৃষ্ঠায় একটি সোশ্যাল সিকিউরিটি নম্বর, ৭ নম্বর পৃষ্ঠায় একজন ক্লায়েন্টের বাড়ির ঠিকানা এবং ১২ নম্বর পৃষ্ঠায় একটি টেবিলের গভীরে একটি ব্যাংক অ্যাকাউন্ট নম্বর রয়েছে। আপনাকে এই নথিটি শেয়ার করতে হবে — বিরোধী আইনজীবীর সাথে, কোনো নিয়ন্ত্রক সংস্থার সাথে, ব্যবসায়িক অংশীদারের সাথে, অথবা জনসাধারণের সাথে — কিন্তু সেই সংবেদনশীল তথ্য অবশ্যই বাদ দিতে হবে।
তাই আপনি পিডিএফটি খুললেন, এসএসএন-এর উপর একটি কালো আয়তক্ষেত্র আঁকলেন, সেভ করলেন এবং পাঠিয়ে দিলেন।
আপনি বিশ্বজুড়ে সবচেয়ে সাধারণ রেড্যাকশন ভুলটি করেছেন। টেক্সটটি এখনও সেখানে আছে। যে কেউ সেই পিডিএফ পাবে সে "রেড্যাক্ট করা" অংশটি নির্বাচন করতে পারে, লুকানো টেক্সট কপি করতে পারে এবং একটি টেক্সট এডিটরে পেস্ট করতে পারে। আপনার ক্লায়েন্টের এসএসএন এখন কারো ক্লিপবোর্ডে বসে আছে।
এটি কোনো কাল্পনিক ঝুঁকি নয়। এটি মার্কিন বিচার বিভাগ, টিএসএ, ফরচুন ৫০০ কোম্পানি এবং উচ্চ-প্রোফাইল মামলা পরিচালনা করা আইন সংস্থাগুলির সাথে ঘটেছে। আসল রেড্যাকশন — যা আসলে তথ্য স্থায়ীভাবে মুছে ফেলে — তার জন্য একটি নির্দিষ্ট প্রক্রিয়া প্রয়োজন। টেক্সটের উপর আকার আঁকা সেটি নয়।
এই গাইডটি আলোচনা করে যে আসল রেড্যাকশন কী, এটি নকল সংস্করণ থেকে কীভাবে আলাদা, এবং এটি সঠিকভাবে করার তিনটি পদ্ধতি — যার মধ্যে একটি আপনার নথি সম্পূর্ণভাবে আপনার ব্রাউজারে প্রক্রিয়া করে যাতে সংবেদনশীল বিষয়বস্তু কখনও সার্ভারে স্পর্শ না করে।
রেড্যাকশন আসলে কী বোঝায়
রেড্যাকশন হলো একটি নথি থেকে তথ্যের স্থায়ী, অপরিবর্তনীয় অপসারণ। লুকানো নয়। ঢাকা নয়। অপসারণ।
যখন আপনি সঠিকভাবে একটি পিডিএফ রেড্যাক্ট করেন: দৃশ্যমান টেক্সট একটি কালো বাক্স দ্বারা প্রতিস্থাপিত হয়, অন্তর্নিহিত অক্ষর ডেটা পিডিএফ-এর কন্টেন্ট স্ট্রিম থেকে মুছে ফেলা হয়, টেক্সটটি আর অনুসন্ধানযোগ্য থাকে না, কোনো কপি-পেস্ট বা প্রোগ্রাম্যাটিক এক্সট্রাকশন এটি পুনরুদ্ধার করতে পারে না, এবং সম্পর্কিত মেটাডেটা (বুকমার্ক, মন্তব্য, ফর্ম ফিল্ড) পরিষ্কার করা হয়। যদি এই শর্তগুলির কোনোটি পূরণ না হয়, তবে আপনার কাছে একটি ভিজ্যুয়াল ওভারলে আছে — রেড্যাকশন নয়।
পিডিএফ কিভাবে টেক্সট সংরক্ষণ করে (এবং কেন ওভারলে ব্যর্থ হয়)
কালো বাক্স কেন কাজ করে না তা বোঝার জন্য, পিডিএফ কিভাবে টেক্সট সংরক্ষণ করে তা আপনাকে বুঝতে হবে।
একটি পিডিএফ পৃষ্ঠা হলো একটি কন্টেন্ট স্ট্রিম — অপারেটরগুলির একটি ক্রম যা একটি ক্যানভাসে সুনির্দিষ্ট x,y স্থানাঙ্কে পৃথক অক্ষর স্থাপন করে। "SSN: 123-45-6789" টেক্সটটি পজিশনিং কমান্ড হিসাবে সংরক্ষিত হয় যা প্রতিটি অক্ষরকে নির্দিষ্ট অবস্থানে রাখে। সেই টেক্সটের উপরে একটি কালো আয়তক্ষেত্র আঁকলে কন্টেন্ট স্ট্রিমে একটি নতুন গ্রাফিক্যাল উপাদান যুক্ত হয়, কিন্তু মূল টেক্সট অপারেটরগুলি অপরিবর্তিত থাকে। টেক্সটটি এখনও ফাইলে আছে। এটি এখনও নির্বাচনযোগ্য। এটি এখনও বের করা সম্ভব।
একটি মুদ্রিত নথিতে একটি লাইনের উপর কালো কাগজের একটি টুকরো টেপ লাগানোর কথা ভাবুন। কালি এখনও নীচের পৃষ্ঠায় আছে। আসল রেড্যাকশন হলো পৃষ্ঠা থেকে সেই লাইনটি সম্পূর্ণভাবে কেটে ফেলা এবং স্ক্র্যাপগুলি পুড়িয়ে ফেলার ডিজিটাল সমতুল্য।
আসল রেড্যাকশন বনাম নকল রেড্যাকশন
| আসল রেড্যাকশন | নকল রেড্যাকশন | |
|---|---|---|
| দৃশ্যমান চেহারা | কন্টেন্টের উপর কালো বাক্স | কন্টেন্টের উপর কালো বাক্স |
| অন্তর্নিহিত টেক্সট | স্থায়ীভাবে মুছে ফেলা হয়েছে | ফাইলে উপস্থিত আছে |
| নির্বাচন এবং কপি | নির্বাচন করার মতো কিছু নেই | টেক্সট কপি করা যেতে পারে |
| টেক্সট অনুসন্ধান | কোনো মিল নেই | মিল পাওয়া গেছে |
| প্রোগ্রাম্যাটিক এক্সট্রাকশন | কোনো ডেটা ফেরত আসেনি | সম্পূর্ণ টেক্সট বের করা হয়েছে |
| মেটাডেটা | পরিষ্কার করা হয়েছে | অপরিবর্তিত |
| পরিবর্তনযোগ্য? | না — তথ্য ধ্বংস করা হয়েছে | হ্যাঁ — ওভারলে সরান |
বাইরে থেকে, আসল এবং নকল রেড্যাকশন একই রকম দেখায়। উভয় ক্ষেত্রেই কালো বাক্সটি সেখানে থাকে। পার্থক্যটি সম্পূর্ণভাবে পৃষ্ঠের নীচে কী ঘটে তার মধ্যে — এবং এই পার্থক্যটি সাম্প্রতিক ইতিহাসে কিছু সবচেয়ে বিব্রতকর তথ্য ফাঁসের কারণ হয়েছে।
বিখ্যাত রেড্যাকশন ব্যর্থতা
এগুলো কাল্পনিক পরিস্থিতি নয়। নীচের প্রতিটি ক্ষেত্রে বড় সংস্থাগুলির পেশাদাররা জড়িত ছিলেন যারা বিশ্বাস করেছিলেন যে তারা সংবেদনশীল তথ্য রেড্যাক্ট করেছেন। তারা তা করেননি।
মানাফোর্ট মামলা (২০১৯)
পল মানাফোর্টের আইনজীবীরা মার্কিন জেলা আদালতে একটি আদালতের নথি দাখিল করেছিলেন যেখানে তারা তাদের ক্লায়েন্টের রাশিয়ান গোয়েন্দাদের সাথে যোগাযোগের বিবরণ রেড্যাক্ট করার উদ্দেশ্য ছিল। "রেড্যাক্ট করা" অংশগুলি কালো বাক্স ছিল — কিন্তু অন্তর্নিহিত টেক্সট সম্পূর্ণ অক্ষত ছিল। সাংবাদিকরা কেবল লুকানো টেক্সট কপি এবং পেস্ট করে, যা প্রকাশ করে যে মানাফোর্ট একজন রাশিয়ান সহযোগীর সাথে পোলিং ডেটা শেয়ার করেছিলেন। গল্পটি একটি সম্পূর্ণ নিউজ সাইকেল dominated করে। আইনি দলটি একটি ওয়ার্ড প্রসেসরের হাইলাইটিং বৈশিষ্ট্য (কালো টেক্সটের উপর কালো হাইলাইট) ব্যবহার করেছিল এবং টেক্সট স্তর সংরক্ষিত আছে তা উপলব্ধি না করেই পিডিএফ-এ এক্সপোর্ট করেছিল।
টিএসএ বিমানবন্দর নিরাপত্তা ব্লুপ্রিন্ট (২০০৯)
পরিবহন নিরাপত্তা প্রশাসন তার বিমানবন্দর নিরাপত্তা স্ক্রীনিং পদ্ধতির ম্যানুয়ালের একটি রেড্যাক্ট করা সংস্করণ প্রকাশ করেছে। রেড্যাকশনগুলি ছিল পিডিএফ-এ টেক্সটের উপর আঁকা সাধারণ কালো আয়তক্ষেত্র। নিরাপত্তা গবেষকরা ওভারলেগুলি সরিয়ে ফেলেন এবং সম্পূর্ণ আনরেড্যাক্ট করা নথি অ্যাক্সেস করেন, যাতে স্ক্রীনিং ব্যতিক্রম, আইন প্রয়োগকারী সনাক্তকরণ পদ্ধতি এবং চেকপয়েন্ট দুর্বলতাগুলির বিবরণ ছিল। টিএসএ-কে তার পুরো স্ক্রীনিং প্রোটোকল সংশোধন করতে হয়েছিল।
এটিএন্ডটি / এনএসএ তারের ট্যাপ কেস (২০০৬)
এটিএন্ডটি-র বিরুদ্ধে এনএসএ-র ওয়ারেন্টলেস তারের ট্যাপ করার মামলার ইলেকট্রনিক ফ্রন্টিয়ার ফাউন্ডেশনের মামলায়, এটিএন্ডটি "রেড্যাক্ট করা" ট্রেড সিক্রেট সহ একটি আইনি সংক্ষিপ্ত দাখিল করেছে। রেড্যাকশনগুলি ছিল পিডিএফ-এ টেক্সটের উপর কালো বাক্স। সম্পূর্ণ টেক্সট — এটিএন্ডটি সুবিধাগুলির মধ্যে এনএসএ-র নজরদারি পরিকাঠামোর বর্ণনা — তুচ্ছভাবে এক্সট্র্যাক্টযোগ্য ছিল। নথিটি পুল করার আগে হাজার হাজার বার ডাউনলোড করা হয়েছিল।
প্যাটার্ন
প্রতিটি ক্ষেত্রে, ব্যর্থতার ধরণ একই ছিল: টেক্সটটি মুছে না ফেলেই টেক্সটের উপর একটি ভিজ্যুয়াল উপাদান আঁকা হয়েছিল। এবং যারা এই ভুলগুলি করেছিলেন তারা অসাবধান ছিলেন না — তারা আইনজীবী, সরকারি কর্মকর্তা এবং নিরাপত্তা পেশাদার ছিলেন। তারা যে সরঞ্জামগুলি ব্যবহার করেছিলেন (ওয়ার্ড প্রসেসর, সাধারণ পিডিএফ সম্পাদক, টীকা বৈশিষ্ট্য) সেগুলি কেবল আসল রেড্যাকশন সম্পাদন করে না।
কোন তথ্য আপনার রেড্যাক্ট করা উচিত?
উত্তরটি আপনার নিয়ন্ত্রক পরিবেশের উপর নির্ভর করে, তবে নিম্নলিখিত বিভাগগুলি ব্যবসায়িক নথিতে সর্বাধিক সাধারণ সংবেদনশীল ডেটা কভার করে।
ব্যক্তিগত সনাক্তকরণযোগ্য তথ্য (PII)
- সোশ্যাল সিকিউরিটি নম্বর (SSNs) এবং করদাতা সনাক্তকরণ নম্বর (TINs)
- ব্যাংক অ্যাকাউন্ট নম্বর এবং রাউটিং নম্বর
- ক্রেডিট এবং ডেবিট কার্ড নম্বর
- ড্রাইভারের লাইসেন্স এবং পাসপোর্ট নম্বর
- জন্ম তারিখ
- বাড়ির ঠিকানা এবং ব্যক্তিগত ফোন নম্বর
- ইমেল ঠিকানা (যখন অন্যান্য PII-এর সাথে যুক্ত থাকে)
- বায়োমেট্রিক শনাক্তকারী
আর্থিক তথ্য
- অ্যাকাউন্ট ব্যালেন্স এবং লেনদেনের ইতিহাস
- বেতন এবং ক্ষতিপূরণ
- আয়কর রিটার্নের ডেটা
- বিনিয়োগ অ্যাকাউন্টের বিবরণ
- ঋণ এবং মর্টগেজ তথ্য
- ক্রেডিট স্কোর এবং ক্রেডিট রিপোর্ট ডেটা
চিকিৎসা এবং স্বাস্থ্য তথ্য (HIPAA)
- রোগীর নাম স্বাস্থ্য ডেটার সাথে একত্রে
- মেডিকেল রেকর্ড নম্বর
- রোগ নির্ণয় এবং চিকিৎসার বিবরণ
- প্রেসক্রিপশন তথ্য
- স্বাস্থ্য বীমা পলিসি নম্বর
- ল্যাব ফলাফল এবং মেডিকেল ইমেজিং রিপোর্ট
আইনি এবং ব্যবসায়িক তথ্য
- আদালতের নথিতে অপ্রাপ্তবয়স্কদের নাম
- ফৌজদারি কার্যধারায় ভুক্তভোগী এবং সাক্ষীর পরিচয়
- অ্যাটর্নি-ক্লায়েন্ট বিশেষ যোগাযোগ
- ট্রেড সিক্রেট এবং মালিকানাধীন সূত্র
- সিল করা আদালতের রেকর্ড এবং গ্র্যান্ড জুরি উপকরণ
- কেস নম্বর এবং ডকেট তথ্য (কিছু বিচারব্যবস্থায়)
- গোপনীয় নিষ্পত্তির শর্তাবলী
এইচআর এবং কর্মসংস্থান রেকর্ড
- কর্মচারীর এসএসএন এবং ট্যাক্স উইথহোল্ডিং ডেটা
- বেতন এবং বোনাস পরিমাণ
- শৃঙ্খলা রেকর্ড এবং কর্মক্ষমতা পর্যালোচনা
- মেডিকেল ছুটির বিবরণ
- ব্যাকগ্রাউন্ড চেক ফলাফল
- অভ্যন্তরীণ তদন্তের নোট
সাধারণ নিয়ম: যদি তথ্য একটি নির্দিষ্ট ব্যক্তিকে সনাক্ত করতে পারে, তাদের আর্থিক পরিস্থিতি প্রকাশ করতে পারে, তাদের চিকিৎসা ইতিহাস প্রকাশ করতে পারে, অথবা সুরক্ষিত আইনি যোগাযোগ প্রকাশ করতে পারে, তবে এটি রেড্যাক্ট করা উচিত যারা এটি দেখার বৈধ প্রয়োজন নেই তাদের সাথে নথিটি শেয়ার করার আগে।
নথির ধরন অনুসারে
বিভিন্ন নথি সংবেদনশীল ডেটা বিভিন্ন জায়গায় লুকিয়ে রাখে:
- আইনি নথি: পক্ষের নাম এবং ঠিকানা (বিশেষ করে পারিবারিক/কিশোর মামলায়), বিশেষ যোগাযোগ, সাক্ষীর পরিচয়, নিষ্পত্তির শর্তাবলী, আর্থিক প্রদর্শনীতে এসএসএন, অপ্রাপ্তবয়স্কদের নাম
- আর্থিক নথি: অ্যাকাউন্ট এবং রাউটিং নম্বর, এসএসএন/টিআইএন, লেনদেনের বিবরণ, ব্যালেন্স, বেতন ডেটা
- মেডিকেল রেকর্ড (HIPAA): HIPAA-এর গোপনীয়তা বিধিমালা ডি-শনাক্তকরণের জন্য অপসারণ করা 18টি নির্দিষ্ট শনাক্তকারীর তালিকা করে, যার মধ্যে নাম, ভৌগলিক ডেটা, তারিখ, ফোন/ফ্যাক্স/ইমেল, এসএসএন, মেডিকেল রেকর্ড নম্বর, স্বাস্থ্য পরিকল্পনা আইডি, অ্যাকাউন্ট নম্বর, লাইসেন্স নম্বর, ডিভাইস শনাক্তকারী, বায়োমেট্রিক ডেটা এবং ফটোগ্রাফ অন্তর্ভুক্ত। জরিমানা প্রতি লঙ্ঘনে $100 থেকে $50,000 পর্যন্ত হতে পারে।
- এইচআর নথি: ট্যাক্স ফর্মগুলিতে (W-2, W-4, I-9) কর্মচারীর এসএসএন, বেতনের পরিমাণ, শাস্তিমূলক রেকর্ড, চিকিৎসা ছুটির বিবরণ, ব্যাকগ্রাউন্ড চেক ফলাফল, ব্যক্তিগত যোগাযোগের তথ্য
পদ্ধতি ১: PDFSub রেড্যাক্ট পিডিএফ টুল (প্রস্তাবিত)
PDFSub-এর রেড্যাক্ট পিডিএফ টুল আসল রেড্যাকশন সম্পাদন করে — রেড্যাকশন চিহ্নের নীচের টেক্সট স্থায়ীভাবে ফাইল থেকে মুছে ফেলা হয়, কেবল দৃশ্যমানভাবে ঢাকা হয় না। এবং যেহেতু টুলটি সম্পূর্ণভাবে আপনার ব্রাউজারে চলে, তাই আপনার সংবেদনশীল তথ্য ধারণকারী নথিটি আপনার ডিভাইস ছেড়ে যায় না।
এটি কিভাবে কাজ করে
ধাপ ১: আপনার পিডিএফ আপলোড করুন। আপনার নথিটি রেড্যাক্ট পিডিএফ টুল-এ ড্র্যাগ এবং ড্রপ করুন অথবা ব্রাউজ করতে ক্লিক করুন। ফাইলটি সরাসরি আপনার ব্রাউজারে লোড হয় — কোনো সার্ভার আপলোড হয় না।
ধাপ ২: রেড্যাক্ট করার জন্য এলাকা চিহ্নিত করুন। আপনি যে টেক্সট বা অঞ্চলগুলি সরাতে চান তা নির্বাচন করুন। আপনি নির্দিষ্ট শব্দ, বাক্য, সম্পূর্ণ অনুচ্ছেদ হাইলাইট করতে পারেন, অথবা ছবি এবং ডায়াগ্রামের উপর রেড্যাকশন বক্স আঁকতে পারেন। আপনি নিশ্চিত করার আগে টুলটি আপনাকে ঠিক কী রেড্যাক্ট করা হবে তা দেখায়।
ধাপ ৩: রেড্যাকশন প্রয়োগ করুন। প্রয়োগ করতে ক্লিক করুন। টুলটি স্থায়ীভাবে চিহ্নিত কন্টেন্ট পিডিএফ-এর কন্টেন্ট স্ট্রিম থেকে সরিয়ে দেয়। টেক্সট মুছে ফেলা হয় — লুকানো নয়, ওভারলে করা নয়, মুছে ফেলা হয়। যেখানে কন্টেন্ট ছিল সেখানে একটি কালো বাক্স পূরণ করে।
ধাপ ৪: ডাউনলোড করুন। রেড্যাক্ট করা পিডিএফ সেভ করুন। আপনি যে ফাইলটি ডাউনলোড করেন তাতে সরানো তথ্যের কোনো চিহ্ন থাকে না। আপনি রেড্যাক্ট করা এলাকায় টেক্সট নির্বাচন করার চেষ্টা করে (নির্বাচন করার মতো কিছু নেই) অথবা সরানো কন্টেন্টের জন্য একটি টেক্সট অনুসন্ধান চালিয়ে (কোনো মিল পাওয়া যাবে না) এটি যাচাই করতে পারেন।
কেন এই পদ্ধতি সংবেদনশীল নথির জন্য সেরা
ব্রাউজার-ভিত্তিক প্রক্রিয়াকরণ। সম্পূর্ণ রেড্যাকশন প্রক্রিয়াটি আপনার ব্রাউজারে ঘটে। আপনার পিডিএফ কখনও ইন্টারনেটের মাধ্যমে ভ্রমণ করে না, কখনও তৃতীয় পক্ষের সার্ভারে পৌঁছায় না, এবং কখনও লগ, ক্যাশে বা ধরে রাখা হয় না। কমপ্লায়েন্স-সংবেদনশীল ওয়ার্কফ্লোগুলির জন্য, এটি একটি 'থাকলে ভালো' জিনিস নয় — এটি একটি প্রয়োজনীয়তা।
আসল রেড্যাকশন, টীকা নয়। টেক্সটটি আসলে পিডিএফ-এর অভ্যন্তরীণ ডেটা স্ট্রাকচার থেকে মুছে ফেলা হয়, কেবল ঢাকা হয় না। রেড্যাকশনের পরে, কন্টেন্ট পুনরুদ্ধারযোগ্য নয়।
সাশ্রয়ী। Adobe Acrobat Pro-এর $240/বছরের মূল্যের তুলনায়, PDFSub পেশাদার রেড্যাকশন প্রদান করে তার খরচের একটি ভগ্নাংশে। টুলটি আপনার প্রয়োজন মেটায় কিনা তা যাচাই করতে ৭-দিনের বিনামূল্যে ট্রায়াল দিয়ে শুরু করুন।
যেকোনো ডিভাইসে কাজ করে। উইন্ডোজ, ম্যাক, লিনাক্স, ক্রোমবুক এবং ট্যাবলেট থেকে পিডিএফ রেড্যাক্ট করুন — যেখানেই আপনার একটি আধুনিক ওয়েব ব্রাউজার আছে।
পদ্ধতি ২: Adobe Acrobat Pro
Adobe Acrobat Pro-তে একটি ডেডিকেটেড রেড্যাকশন টুল রয়েছে যা আসল রেড্যাকশন সম্পাদন করে। এটি আইনি এবং সরকারি ওয়ার্কফ্লোগুলির জন্য শিল্প মান।
Acrobat Pro-তে কিভাবে রেড্যাক্ট করবেন
ধাপ ১: রেড্যাক্ট টুল খুলুন। Tools > Redact-এ যান। এটি রেড্যাকশন টুলবার খোলে।
ধাপ ২: রেড্যাকশনের জন্য কন্টেন্ট চিহ্নিত করুন। টেক্সট নির্বাচন করতে ক্লিক এবং ড্র্যাগ করুন, সম্পূর্ণ পৃষ্ঠাগুলি রেড্যাক্ট করুন, অথবা পুরো নথি জুড়ে প্যাটার্নগুলির জন্য অনুসন্ধান করতে "Find and Redact" ব্যবহার করুন (যেমন SSN ফর্ম্যাট)।
ধাপ ৩: রেড্যাকশন প্রয়োগ করুন। এটি গুরুত্বপূর্ণ ধাপ যা অনেক ব্যবহারকারী মিস করে। চিহ্নিতকরণ টেক্সটের চারপাশে একটি লাল রূপরেখা রাখে — এটি এখনও এটি সরিয়ে দেয় না। আপনাকে স্থায়ীভাবে কন্টেন্ট মুছে ফেলার জন্য "Apply" ক্লিক করতে হবে।
ধাপ ৪: লুকানো তথ্য সরান। মেটাডেটা, মন্তব্য, ফর্ম ফিল্ড এবং এমবেডেড ফাইলগুলি পরিষ্কার করতে "Remove Hidden Information" ব্যবহার করুন।
সুবিধা এবং অসুবিধা
Acrobat Pro শিল্প মান যা ব্যাপক আইনি/সরকারি গ্রহণযোগ্যতা সহ, ব্যাচ "Find and Redact" অফার করে, এবং লুকানো তথ্য সরিয়ে দেয়। তবে, এর দাম $240/বছর, ডেস্কটপ ইনস্টলেশন প্রয়োজন, এবং দুই-ধাপের প্রক্রিয়া (চিহ্নিত করুন তারপর প্রয়োগ করুন) ব্যবহারকারীরা প্রয়োগ ধাপটি ভুলে গেলে ত্রুটির একটি সাধারণ উৎস।
দুই-ধাপের ফাঁদ
এটি জোর দেওয়ার যোগ্য কারণ এটি বাস্তব ডেটা ফাঁসের কারণ হয়: রেড্যাকশনের জন্য কন্টেন্ট চিহ্নিত করা রেড্যাক্ট করার সমান নয়। চিহ্নিতকরণ একটি ভিজ্যুয়াল সূচক স্থাপন করে। টেক্সট এখনও ফাইলে আছে। শুধুমাত্র প্রয়োগ এটি মুছে ফেলে। আপনি যদি চিহ্নিত করার পরে কিন্তু প্রয়োগ করার আগে সেভ এবং শেয়ার করেন, তবে আপনি নকল রেড্যাকশন সহ একটি নথি শেয়ার করেছেন।
পদ্ধতি ৩: ম্যাক-এ প্রিভিউ (Preview)
Apple-এর প্রিভিউ অ্যাপ (macOS-এ বিল্ট-ইন) টীকা সরঞ্জামগুলি রয়েছে যা টেক্সটের উপর কালো আয়তক্ষেত্র স্থাপন করতে পারে। অনেক ম্যাক ব্যবহারকারী ধরে নেয় যে এটি রেড্যাকশন গঠন করে। এটি করে না।
প্রিভিউ আসলে কী করে
যখন আপনি প্রিভিউ-এর আয়তক্ষেত্র টীকা সরঞ্জাম ব্যবহার করে টেক্সট ঢেকে রাখেন:
- পিডিএফ কন্টেন্টের উপরে একটি কালো আকার আঁকা হয়।
- অন্তর্নিহিত টেক্সট সম্পূর্ণ অক্ষত থাকে।
- আয়তক্ষেত্রের নীচে ক্লিক করে এবং টেনে টেক্সট এখনও নির্বাচন করা যেতে পারে।
- টেক্সট এখনও অনুসন্ধানের ফলাফলে (Cmd+F) প্রদর্শিত হয়।
- যেকোনো পিডিএফ পার্সিং টুল দ্বারা টেক্সট বের করা যেতে পারে।
- টীকাটি সম্পূর্ণভাবে সরানো যেতে পারে, মূল টেক্সট প্রকাশ করে।
সতর্কতা: প্রিভিউ আসল রেড্যাকশন সম্পাদন করে না
প্রিভিউ-এর টীকাগুলি রেড্যাকশন নয়। এগুলি হুবহু একই ভিজ্যুয়াল ওভারলে যা মানাফোর্ট, টিএসএ এবং এটিএন্ডটি ব্যর্থতার কারণ হয়েছিল যা আগে বর্ণিত হয়েছে। রেড্যাক্ট করার জন্য প্রিভিউ ব্যবহার করা এবং এটি শেয়ার করা কার্যকারিকভাবে আনরেড্যাক্ট করা নথি শেয়ার করার সমতুল্য।
macOS Sequoia (2025) পর্যন্ত, প্রিভিউ-তে একটি আসল রেড্যাকশন বৈশিষ্ট্য অন্তর্ভুক্ত নেই। আপনি যদি ম্যাক-এ থাকেন, তাহলে PDFSub-এর ব্রাউজার-ভিত্তিক রেড্যাক্ট পিডিএফ টুল বা Adobe Acrobat Pro ব্যবহার করুন।
প্রিভিউ-এর ব্যর্থতা কিভাবে যাচাই করবেন
নিজেই চেষ্টা করুন: প্রিভিউ-তে যেকোনো পিডিএফ খুলুন, কিছু টেক্সটের উপর একটি কালো-ভরা আয়তক্ষেত্র আঁকুন, সেভ করুন, আবার খুলুন এবং "লুকানো" টেক্সট অনুসন্ধান করতে Cmd+F চাপুন। এটি পাওয়া যাবে। এটি কখনও সরানো হয়নি। এই ৩০-সেকেন্ডের পরীক্ষাটি দেখায় কেন টীকা সরঞ্জামগুলি রেড্যাকশনের জন্য ব্যবহার করা হলে বিপজ্জনক।
রেড্যাকশন সেরা অনুশীলন
রেড্যাকশন টুলটি সঠিকভাবে পাওয়া লড়াইয়ের অর্ধেক। রেড্যাকশনের চারপাশের প্রক্রিয়াটি ততটাই গুরুত্বপূর্ণ।
১. রেড্যাক্ট করার পর সবসময় যাচাই করুন
রেড্যাকশন প্রয়োগ করার পর, আউটপুট পরীক্ষা করুন। রেড্যাক্ট করা এলাকায় টেক্সট নির্বাচন করার চেষ্টা করুন — যদি আপনি একটি কালো বাক্সের নীচে কিছু হাইলাইট করতে পারেন, তবে রেড্যাকশন ব্যর্থ হয়েছে। যে কন্টেন্ট সরানো উচিত ছিল তার জন্য অনুসন্ধান করুন (Ctrl+F / Cmd+F)। একটি ভিন্ন পিডিএফ ভিউয়ারে ফাইলটি খুলুন, কারণ কিছু টীকা ভিন্নভাবে পরিচালনা করে। উচ্চ-ঝুঁকিপূর্ণ রেড্যাকশনগুলির জন্য (আইনি কার্যধারা, নিয়ন্ত্রক জমা), সমস্ত টেক্সট বের করতে এবং রেড্যাক্ট করা কন্টেন্ট অনুপস্থিত তা নিশ্চিত করতে একটি টেক্সট এক্সট্রাকশন টুল ব্যবহার করুন।
২. মেটাডেটা সরান
দৃশ্যমান টেক্সট রেড্যাক্ট করা প্রয়োজনীয় কিন্তু যথেষ্ট নয়। পিডিএফ মেটাডেটা বহন করে যা সংবেদনশীল তথ্য প্রকাশ করতে পারে: নথির বৈশিষ্ট্য (লেখক, সংস্থা, তৈরির তারিখ), মন্তব্য এবং টীকা, ফর্ম ফিল্ড ডেটা, এমবেডেড ফাইল সংযুক্তি, বুকমার্ক, জাভাস্ক্রিপ্ট এবং XMP মেটাডেটা। একটি পুঙ্খানুপুঙ্খ রেড্যাকশন ওয়ার্কফ্লো দৃশ্যমান কন্টেন্টের পাশাপাশি এই সবগুলি সরিয়ে দেয়।
৩. একটি কপি থেকে কাজ করুন
কখনই মূল নথি রেড্যাক্ট করবেন না। একটি কপি তৈরি করুন, মূলটি একটি নিরাপদ স্থানে সংরক্ষণ করুন, কপিটিতে সমস্ত রেড্যাকশন সম্পাদন করুন, যাচাই করুন এবং কেবল রেড্যাক্ট করা সংস্করণটি বিতরণ করুন। আনরেড্যাক্ট করা মূলটি পরে আইনি কার্যধারা, অডিট ট্রেল বা অভ্যন্তরীণ পর্যালোচনার জন্য প্রয়োজন হতে পারে।
৪. সামঞ্জস্যপূর্ণ রেড্যাকশন চেহারা ব্যবহার করুন
আপনার সংস্থার জুড়ে রেড্যাকশনের চেহারা মানসম্মত করুন। আইনি এবং সরকারি নথির জন্য কালো বাক্সগুলি মান। পাঠকদের কেন কন্টেন্ট সরানো হয়েছে তা জানাতে রেড্যাকশন লেবেল (যেমন, "REDACTED", "PRIVILEGED", "PII REMOVED") যোগ করার কথা বিবেচনা করুন।
৫. নথিভুক্ত করুন এবং পর্যালোচনা করুন
আইনি এবং কমপ্লায়েন্স উদ্দেশ্যে, কে রেড্যাকশন সম্পাদন করেছে, কখন, তথ্যের কোন বিভাগগুলি সরানো হয়েছে এবং কোন টুল ব্যবহার করা হয়েছে তার একটি রেকর্ড রাখুন। যদি রেড্যাকশনের পর্যাপ্ততা নিয়ে কখনও প্রশ্ন ওঠে তবে এটি একটি অডিট ট্রেল তৈরি করে।
আপনার সংস্থা ছেড়ে যাওয়ার আগে দ্বিতীয় ব্যক্তিকে রেড্যাক্ট করা নথিটি পর্যালোচনা করতে বলুন। একটি তাজা জোড়া চোখ মিস করা রেড্যাকশন, অসম্পূর্ণ অপসারণ এবং প্রাসঙ্গিক পাঠ্য থেকে রেড্যাক্ট করা কন্টেন্ট অনুমান করার অনুমতি দিতে পারে এমন প্রসঙ্গ ক্লুগুলি ধরতে পারে। দুই-ব্যক্তি পর্যালোচনা সরকারি FOIA অফিসগুলিতে স্ট্যান্ডার্ড অনুশীলন।
ব্যাচ রেড্যাকশন: প্যাটার্ন খোঁজা এবং সরানো
যখন আপনাকে একটি বড় নথিতে একই ধরনের তথ্য রেড্যাক্ট করতে হয়, তখন ম্যানুয়াল নির্বাচন অবাস্তব হয়ে পড়ে। ব্যাচ রেড্যাকশন প্যাটার্নগুলির জন্য অনুসন্ধান করে এবং সমস্ত মিল একবারে চিহ্নিত করে প্রক্রিয়াটি স্বয়ংক্রিয় করে।
ব্যাচ রেড্যাক্ট করার জন্য সাধারণ প্যাটার্ন:
| ডেটার ধরন | প্যাটার্ন ফর্ম্যাট |
|---|---|
| সোশ্যাল সিকিউরিটি নম্বর | XXX-XX-XXXX, XXX XX XXXX, XXXXXXXXX |
| ইমেল ঠিকানা | [email protected] |
| ফোন নম্বর | (XXX) XXX-XXXX, XXX-XXX-XXXX, +1XXXXXXXXXX |
| ক্রেডিট কার্ড নম্বর | 13-19 সংখ্যার ক্রম, প্রায়শই চারটির গ্রুপে |
| অ্যাকাউন্ট নম্বর | "Account #" বা "Acct" এর পরে 8-17 সংখ্যার ক্রম |
| জন্ম তারিখ | MM/DD/YYYY, Month DD, YYYY, DD-MM-YYYY |
ওয়ার্কফ্লো: আপনার প্যাটার্নগুলি সংজ্ঞায়িত করুন, সমস্ত পৃষ্ঠা জুড়ে অনুসন্ধান চালান, প্রতিটি মিল পর্যালোচনা করুন (প্রতিটি প্যাটার্ন মিল আসলে সংবেদনশীল নয়), একবারে প্রয়োগ করুন, তারপরে প্যাটার্নের সাথে মেলেনি এমন কন্টেন্টের জন্য একটি ম্যানুয়াল সুইপ করুন। নাম, ঠিকানা এবং ফ্রি-টেক্সট বিবরণগুলি সাধারণত সাধারণ প্যাটার্নের সাথে মেলে না এবং মানব পর্যালোচনার প্রয়োজন হয়।
রেড্যাকশনের জন্য আইনি প্রয়োজনীয়তা
রেড্যাকশন কেবল একটি সেরা অনুশীলন নয়। অনেক প্রেক্ষাপটে, এটি একটি আইনি প্রয়োজনীয়তা।
FOIA (Freedom of Information Act)। FOIA অনুরোধের জবাবে ফেডারেল সংস্থাগুলিকে নথি প্রকাশ করতে হবে তবে নয়টি নির্দিষ্ট ব্যতিক্রমের অধীনে আসা তথ্য রেড্যাক্ট করতে হবে — যার মধ্যে রয়েছে জাতীয় নিরাপত্তা তথ্য, ট্রেড সিক্রেট, ব্যক্তিগত গোপনীয়তা এবং আইন প্রয়োগকারী রেকর্ড। রাজ্য-স্তরের উন্মুক্ত রেকর্ড আইনগুলি অনুরূপ প্রয়োজনীয়তা আরোপ করে। অনুপযুক্ত রেড্যাকশন মামলা, আদালতের আদেশ এবং সংস্থার নিষেধাজ্ঞার কারণ হতে পারে।
GDPR। EU জেনারেল ডেটা প্রোটেকশন রেগুলেশনের অধীনে, ডেটা সাবজেক্ট অ্যাক্সেস অনুরোধের (ধারা ১৫) জবাবে সংস্থাগুলিকে একই নথিতে তৃতীয় পক্ষের ব্যক্তিগত ডেটা রেড্যাক্ট করতে হবে। "মুছে ফেলার অধিকার" (ধারা ১৭) সংস্থাটিকে অন্যথায় ধরে রাখতে হবে এমন নথি থেকে ব্যক্তিগত ডেটা রেড্যাক্ট করার প্রয়োজন হতে পারে। লঙ্ঘন 20 মিলিয়ন ইউরো বা বার্ষিক বিশ্বব্যাপী রাজস্বের 4% পর্যন্ত জরিমানা হতে পারে।
HIPAA। সুরক্ষিত স্বাস্থ্য তথ্য অ-চিকিৎসা উদ্দেশ্যে প্রকাশের আগে ডি-শনাক্ত করা আবশ্যক। "সেফ হারবার" পদ্ধতির জন্য পূর্বের তালিকাভুক্ত 18টি শনাক্তকারী বিভাগ অপসারণের প্রয়োজন। জরিমানা প্রতি লঙ্ঘনে $100 থেকে $50,000 পর্যন্ত হয়।
আদালতের আদেশ। আদালতগুলি নিয়মিতভাবে জন ফাইলিংগুলিতে অপ্রাপ্তবয়স্কদের নাম, ট্রেড সিক্রেট, তথ্যদাতার পরিচয় এবং সিল করা উপকরণগুলি রেড্যাক্ট করার আদেশ দেয়। অ-সম্মতি অবমাননার নিষেধাজ্ঞা, মামলা বাতিল বা অ্যাটর্নি শৃঙ্খলার কারণ হতে পারে।
রাজ্য গোপনীয়তা আইন। ক্যালিফোর্নিয়ার CCPA/CPRA, ভার্জিনিয়ার CDPA, কলোরাডোর CPA এবং অনুরূপ রাজ্য আইনগুলি GDPR-এর মতো বাধ্যবাধকতা আরোপ করে। ভোক্তা ডেটা অনুরোধের জবাবে সংস্থাগুলিকে প্রকাশের আগে তৃতীয় পক্ষের তথ্য রেড্যাক্ট করতে হবে।
প্রায়শই জিজ্ঞাসিত প্রশ্নাবলী
রেড্যাক্ট করা টেক্সট কি পুনরুদ্ধার করা যায়?
যদি রেড্যাকশনটি সঠিকভাবে একটি আসল রেড্যাকশন টুল ব্যবহার করে সম্পাদিত হয় — না। অক্ষর ডেটা স্থায়ীভাবে মুছে ফেলা হয়। কোনো লুকানো স্তর নেই, কোনো এনক্রিপ্টেড ব্যাকআপ নেই, কোনো ফরেনসিক পুনরুদ্ধারের পথ নেই। যদি "রেড্যাকশন" কেবল টেক্সটের উপর আঁকা একটি আকার হয় (নকল রেড্যাকশন), তবে হ্যাঁ — যে কেউ একটি সাধারণ পিডিএফ ভিউয়ার দিয়ে লুকানো টেক্সট নির্বাচন, কপি এবং পেস্ট করতে পারে।
আমি কি একটি পিডিএফ-এর মধ্যে থাকা ছবি থেকে তথ্য রেড্যাক্ট করতে পারি?
হ্যাঁ। রেড্যাকশন টুলগুলি এমবেডেড ছবিগুলির অঞ্চলের উপর বাক্স স্থাপন করতে পারে, প্রভাবিত অঞ্চলটিকে একটি কঠিন ফিল দিয়ে রাস্টারাইজ করে যাতে মূল পিক্সেলগুলি ধ্বংস হয়ে যায়। এটি স্ক্যান করা নথির জন্য গুরুত্বপূর্ণ যেখানে টেক্সট নির্বাচনযোগ্য অক্ষর হিসাবে নয় বরং একটি ছবির অংশ হিসাবে বিদ্যমান।
ফর্ম ফিল্ড রেড্যাক্ট করার ব্যাপারে কী?
পিডিএফ ফর্ম ফিল্ডগুলি দৃশ্যমান পৃষ্ঠা কন্টেন্ট থেকে আলাদাভাবে ডেটা সংরক্ষণ করে। একটি ফর্ম ফিল্ডের দৃশ্যমান অবস্থানের উপর একটি রেড্যাকশন বক্স ডেটা সংরক্ষণ করা ডেটা অপসারণ করে না। একটি পুঙ্খানুপুঙ্খ রেড্যাকশনে ফর্ম ফিল্ড এবং তাদের সংশ্লিষ্ট ডেটা ফ্ল্যাটেন বা অপসারণ করাও অন্তর্ভুক্ত থাকতে হবে।
রেড্যাকশন কি পৃষ্ঠার লেআউট পরিবর্তন করে?
না। রেড্যাক্ট করা অঞ্চলগুলি কঠিন-রঙের বাক্স দ্বারা প্রতিস্থাপিত হয় যা সরানো কন্টেন্টের একই স্থান দখল করে। চারপাশের টেক্সট এবং লেআউট তাদের আসল অবস্থানে থাকে।
আমি কি একটি রেড্যাকশন আনডু করতে পারি?
না — এটাই মূল বিষয়। রেড্যাকশন স্থায়ী এবং অপরিবর্তনীয়। এই কারণেই আপনার সর্বদা একটি কপি থেকে কাজ করা উচিত এবং আনরেড্যাক্ট করা মূলটি নিরাপদে সংরক্ষণ করা উচিত।
রেড্যাকশন এনক্রিপশন থেকে কিভাবে আলাদা?
এনক্রিপশন পুরো নথিতে কারা অ্যাক্সেস করতে পারে তা সীমাবদ্ধ করে। রেড্যাকশন একটি নথির কোন কন্টেন্ট দৃশ্যমান তা সীমাবদ্ধ করে যা যে কেউ অ্যাক্সেস করতে পারে। তারা বিভিন্ন উদ্দেশ্য পরিবেশন করে এবং প্রায়শই একসাথে ব্যবহৃত হয়।
টেক্সটের উপর কভার করার পর পিডিএফ-এ প্রিন্ট করা কি একটি বৈধ রেড্যাকশন পদ্ধতি?
অনির্ভরযোগ্য। কিছু প্রিন্ট-টু-পিডিএফ ড্রাইভার ভিজ্যুয়াল স্তর ফ্ল্যাটেন করে এবং অন্তর্নিহিত টেক্সট সরিয়ে দেয়। কিছু এটি সংরক্ষণ করে। এই পদ্ধতিটি সংবেদনশীল রেড্যাকশনগুলির জন্য কখনই নির্ভর করা উচিত নয়। একটি ডেডিকেটেড রেড্যাকশন টুল ব্যবহার করুন।
আমি কি একটি পাসওয়ার্ড-সুরক্ষিত পিডিএফ রেড্যাক্ট করতে পারি?
রেড্যাক্ট করার আগে আপনাকে পিডিএফ আনলক করতে হবে। যদি পিডিএফ-এ একটি মালিকের পাসওয়ার্ড (সম্পাদনা সীমাবদ্ধ করা) বা ব্যবহারকারীর পাসওয়ার্ড (খোলার সীমাবদ্ধ করা) থাকে, তবে আপনার প্রথমে সেই পাসওয়ার্ড প্রয়োজন। একবার আনলক হয়ে গেলে, রেড্যাকশন প্রক্রিয়াটি যেকোনো অসুরক্ষিত পিডিএফ-এর মতোই।
উপসংহার
একটি নথি যা রেড্যাক্ট করা বলে মনে হয় কিন্তু রেড্যাক্ট করা হয়নি তা একটি আনরেড্যাক্ট করা নথির চেয়েও খারাপ — এটি সুরক্ষার একটি মিথ্যা অনুভূতি তৈরি করে যা মানুষকে সংবেদনশীল তথ্য শেয়ার করতে পরিচালিত করে যা তারা অন্যথায় সুরক্ষিত রাখত।
তিনটি takeaway:
- একটি আসল রেড্যাকশন টুল ব্যবহার করুন। টেক্সটের উপর আকার আঁকলে কিছুই রেড্যাক্ট হয় না। টেক্সট ফাইলে থেকে যায়। এমন একটি টুল ব্যবহার করুন যা অন্তর্নিহিত কন্টেন্ট মুছে ফেলে।
- প্রতিবার যাচাই করুন। রেড্যাক্ট করা এলাকায় টেক্সট নির্বাচন করার চেষ্টা করুন, সরানো কন্টেন্টের জন্য অনুসন্ধান করুন এবং একটি দ্বিতীয় অ্যাপ্লিকেশনে পরীক্ষা করুন।
- প্রক্রিয়াকরণের সময় নথিটি সুরক্ষিত রাখুন। যদি আপনার টুল আপনার পিডিএফ একটি সার্ভারে আপলোড করে, তবে আপনার সংবেদনশীল নথিটি এখন একটি তৃতীয় পক্ষের সার্ভারে রয়েছে। PDFSub-এর রেড্যাক্ট পিডিএফ টুল আপনার ব্রাউজারে নথি প্রক্রিয়া করে — ফাইলটি আপনার ডিভাইস ছেড়ে যায় না।
রেড্যাকশন ভুল করার খরচ হলো প্রকাশিত এসএসএন, ফাঁস হওয়া মেডিকেল রেকর্ড, প্রকাশিত ট্রেড সিক্রেট এবং লক্ষ লক্ষ পর্যন্ত পৌঁছানো নিয়ন্ত্রক জরিমানা। এটি সঠিক করার খরচ হলো আপনার সময়ের কয়েক মিনিট।
PDFSub-এর রেড্যাক্ট পিডিএফ টুল ৭ দিনের জন্য বিনামূল্যে চেষ্টা করুন এবং নিজের জন্য যাচাই করুন যে সংবেদনশীল কন্টেন্ট স্থায়ীভাবে চলে গেছে।