แปลง HTML เป็นข้อความ - ลบ Markup คงเนื้อหา
ลบ Markup, สคริปต์ และสไตล์จากหน้าเว็บหรือ HTML ใดๆ - คงไว้เพียงเนื้อหาข้อความที่อ่านได้ เหมาะสำหรับ ETL pipelines, การทำดัชนี RAG / vector-DB, การย้ายเนื้อหา และการสร้างเนื้อหาอีเมลแบบธรรมดา
เป็นส่วนตัว 100%
ประมวลผลทันที
ทำงานผ่านเบราว์เซอร์
คุณสมบัติ
ดึงข้อความธรรมดาจาก URL หรือ HTML
ลบสคริปต์, สไตล์ และแท็ก
จับเนื้อหาที่เรนเดอร์ด้วย JavaScript ใน SPA
แสดงจำนวนคำและจำนวนอักขระ
รอ Selector / Network Idle / Timeout ที่กำหนด
REST API พร้อม Header X-Word-Count และ X-Character-Count
How It Looks
Before
After
วิธีการทำงาน
1
วาง URL หรือ HTML
2
คลิก แปลง
3
คัดลอกผลลัพธ์ หรือดาวน์โหลดเป็น .txt
กรณีการใช้งานทั่วไป
การประมวลผลเบื้องต้นสำหรับ Search-index
การนำเข้า RAG / vector-DB
การย้ายเนื้อหาจาก CMS รุ่นเก่า
การสร้างเนื้อหาอีเมลแบบธรรมดา
Pipelines การจำแนกประเภทข้อความ
คำถามที่พบบ่อย
รองรับเนื้อหาที่เรนเดอร์ด้วย JavaScript หรือไม่?
ใช่ - อินพุตที่เป็น URL จะถูกเรนเดอร์ใน Headless Chrome ก่อน ดังนั้นจึงจับเนื้อหา SPA / แบบไดนามิกได้ อินพุตที่เป็น HTML โดยตรงจะข้าม Chrome เพื่อความเร็ว
รักษาระยะห่าง (Whitespace) หรือไม่?
องค์ประกอบบล็อกจะขึ้นบรรทัดใหม่ องค์ประกอบอินไลน์จะเว้นวรรค ผลลัพธ์จะอ่านได้เหมือนเวอร์ชันที่ถูกตัดทอนของหน้าต้นฉบับ
มี REST API หรือไม่?
ใช่ - POST /api/v1/convert/text. Header การตอบกลับรวมถึง X-Word-Count และ X-Character-Count
HTML เป็นข้อความ
ลบ Markup, สคริปต์ และสไตล์จากหน้าเว็บหรือ HTML ใดๆ - คงไว้เพียงเนื้อหาข้อความที่อ่านได้ เหมาะสำหรับ ETL pipelines, การทำดัชนี RAG / vector-DB, การย้ายเนื้อหา และการสร้างเนื้อหาอีเมลแบบธรรมดา
Sign up