تحويل HTML إلى نص - إزالة الترميز، الاحتفاظ بالمحتوى
إزالة ترميز HTML والنصوص البرمجية والتنسيقات من أي صفحة ويب أو HTML - الاحتفاظ بالنص القابل للقراءة فقط. مثالي لخطوط أنابيب ETL، وفهرسة RAG / vector-DB، وترحيل المحتوى، وإنشاء نص البريد الإلكتروني العادي.
خصوصية 100%
معالجة فورية
يعمل عبر المتصفح
المميزات
استخراج نص عادي من URL أو HTML
إزالة النصوص البرمجية والتنسيقات والعلامات
التقاط محتوى SPA الذي تم عرضه بواسطة JavaScript
إرجاع عدد الكلمات وعدد الأحرف
الانتظار للمحدد / خمول الشبكة / مهلة ثابتة
واجهة برمجة تطبيقات REST مع رؤوس X-Word-Count و X-Character-Count
How It Looks
Before
After
كيف يعمل
1
لصق URL أو HTML
2
انقر فوق تحويل
3
نسخ المخرجات أو تنزيلها كملف .txt
حالات الاستخدام الشائعة
المعالجة المسبقة لفهرس البحث
استيعاب RAG / vector-DB
ترحيل المحتوى من أنظمة إدارة المحتوى القديمة
إنشاء نص البريد الإلكتروني العادي
خطوط أنابيب تصنيف النصوص
الأسئلة الشائعة
هل يتعامل مع المحتوى المعروض بواسطة JavaScript؟
نعم - يتم عرض مدخلات URL في متصفح Chrome بدون واجهة أولاً، لذلك يتم التقاط محتوى SPA / الديناميكي. تتجاوز مدخلات HTML المباشرة Chrome لمسار أسرع.
هل يتم الاحتفاظ بالمسافات البيضاء؟
تحصل العناصر الكتل على أسطر جديدة، وتحصل العناصر المضمنة على مسافات. تبدو المخرجات كنسخة مبسطة من الصفحة المصدر.
هل توجد واجهة برمجة تطبيقات REST؟
نعم - POST /api/v1/convert/text. تتضمن رؤوس الاستجابة X-Word-Count و X-Character-Count.
HTML إلى نص
إزالة ترميز HTML والنصوص البرمجية والتنسيقات من أي صفحة ويب أو HTML - الاحتفاظ بالنص القابل للقراءة فقط. مثالي لخطوط أنابيب ETL، وفهرسة RAG / vector-DB، وترحيل المحتوى، وإنشاء نص البريد الإلكتروني العادي.
Sign up