تبدیل HTML به متن - حذف نشانهگذاری، حفظ محتوا
نشانهگذاری HTML، اسکریپتها و استایلها را از هر صفحه وب یا HTML حذف کنید - فقط محتوای متنی قابل خواندن را نگه دارید. ایدهآل برای پایپلاینهای ETL، نمایهسازی RAG / vector-DB، مهاجرت محتوا و تولید بدنه ایمیل ساده.
۱۰۰٪ خصوصی
پردازش فوری
مبتنی بر مرورگر
ویژگیها
استخراج متن ساده از URL یا HTML
اسکریپتها، استایلها و تگها حذف شدهاند
محتوای SPA رندر شده با جاوا اسکریپت ثبت شده است
تعداد کلمات و تعداد کاراکترها برگردانده میشود
انتظار برای سلکتور / شبکه بیکار / مهلت زمانی ثابت
API REST با هدرهای X-Word-Count و X-Character-Count
How It Looks
Before
After
نحوه کار
1
یک URL یا HTML را وارد کنید
2
روی تبدیل کلیک کنید
3
خروجی را کپی کنید یا به صورت .txt دانلود کنید
موارد استفاده رایج
پیشپردازش شاخص جستجو
ورود داده RAG / vector-DB
مهاجرت محتوا از CMSهای قدیمی
تولید بدنه ایمیل ساده
پایپلاینهای طبقهبندی متن
سوالات متداول
آیا محتوای رندر شده با جاوا اسکریپت را مدیریت میکند؟
بله - ورودیهای URL ابتدا در Chrome بدون رابط کاربری رندر میشوند، بنابراین محتوای SPA / پویا ثبت میشود. ورودیهای مستقیم HTML برای مسیری سریعتر از Chrome عبور میکنند.
آیا فاصلهگذاری حفظ میشود؟
به عناصر بلوکی خطوط جدید و به عناصر درونخطی فاصلهها داده میشود. خروجی مانند نسخه سادهشدهای از صفحه منبع خوانده میشود.
آیا API REST وجود دارد؟
بله - POST /api/v1/convert/text. هدرهای پاسخ شامل X-Word-Count و X-Character-Count هستند.
HTML به متن
نشانهگذاری HTML، اسکریپتها و استایلها را از هر صفحه وب یا HTML حذف کنید - فقط محتوای متنی قابل خواندن را نگه دارید. ایدهآل برای پایپلاینهای ETL، نمایهسازی RAG / vector-DB، مهاجرت محتوا و تولید بدنه ایمیل ساده.
Sign up