HTML থেকে টেক্সট রূপান্তর করুন - মার্কআপ সরান, কন্টেন্ট রাখুন
যেকোনো ওয়েব পেজ বা HTML থেকে HTML মার্কআপ, স্ক্রিপ্ট এবং স্টাইল সরান - শুধুমাত্র পঠনযোগ্য টেক্সট কন্টেন্ট রাখুন। ETL পাইপলাইন, RAG / ভেক্টর-DB ইন্ডেক্সিং, কন্টেন্ট মাইগ্রেশন এবং প্লেইন-ইমেল বডি তৈরির জন্য আদর্শ।
১০০% ব্যক্তিগত
তাৎক্ষণিক প্রসেসিং
ব্রাউজার-ভিত্তিক
বৈশিষ্ট্য
URL বা HTML থেকে প্লেইন টেক্সট এক্সট্রাক্ট করুন
স্ক্রিপ্ট, স্টাইল এবং ট্যাগ সরানো হয়েছে
JavaScript-রেন্ডার করা SPA কন্টেন্ট ক্যাপচার করা হয়েছে
শব্দ সংখ্যা এবং অক্ষর সংখ্যা ফেরত দেওয়া হয়
সিলেকটর / নেটওয়ার্ক নিষ্ক্রিয় / নির্দিষ্ট টাইমআউটের জন্য অপেক্ষা করুন
X-Word-Count এবং X-Character-Count হেডার সহ REST API
How It Looks
Before
After
কিভাবে কাজ করে
1
একটি URL বা HTML পেস্ট করুন
2
রূপান্তর করুন ক্লিক করুন
3
আউটপুট কপি করুন বা .txt হিসাবে ডাউনলোড করুন
সাধারণ ব্যবহার
সার্চ-ইনডেক্স প্রি-প্রসেসিং
RAG / ভেক্টর-DB ইনজেশন
লিগ্যাসি CMS থেকে কন্টেন্ট মাইগ্রেশন
প্লেইন-ইমেল বডি তৈরি
টেক্সট ক্লাসিফিকেশন পাইপলাইন
সাধারণ জিজ্ঞাস্য
এটি কি JavaScript-রেন্ডার করা কন্টেন্ট পরিচালনা করে?
হ্যাঁ - URL ইনপুটগুলি প্রথমে হেডলেস Chrome-এ রেন্ডার করা হয়, তাই SPA / ডাইনামিক কন্টেন্ট ক্যাপচার করা হয়। সরাসরি HTML ইনপুটগুলি দ্রুত পাথের জন্য Chrome এড়িয়ে যায়।
হোয়াইটস্পেস কি সংরক্ষিত থাকে?
ব্লক এলিমেন্টগুলিতে নতুন লাইন এবং ইনলাইন এলিমেন্টগুলিতে স্পেস যুক্ত হয়। আউটপুটটি সোর্স পেজের একটি স্ট্রিপড-ডাউন সংস্করণের মতো দেখায়।
একটি REST API আছে কি?
হ্যাঁ - POST /api/v1/convert/text। রেসপন্স হেডারে X-Word-Count এবং X-Character-Count অন্তর্ভুক্ত থাকে।
HTML থেকে টেক্সট
যেকোনো ওয়েব পেজ বা HTML থেকে HTML মার্কআপ, স্ক্রিপ্ট এবং স্টাইল সরান - শুধুমাত্র পঠনযোগ্য টেক্সট কন্টেন্ট রাখুন। ETL পাইপলাইন, RAG / ভেক্টর-DB ইন্ডেক্সিং, কন্টেন্ট মাইগ্রেশন এবং প্লেইন-ইমেল বডি তৈরির জন্য আদর্শ।
Sign up