HTML 轉純文字 - 移除標記,保留內容
從任何網頁或 HTML 中移除 HTML 標記、腳本和樣式,只保留可讀取的文字內容。適用於 ETL 管道、RAG / vector-DB 索引、內容遷移和純電子郵件內文生成。
100% 私密
即時處理
瀏覽器即用
功能特色
從 URL 或 HTML 提取純文字
移除腳本、樣式和標籤
擷取 JavaScript 渲染的 SPA 內容
返回字數和字符數
等待選擇器 / 網路閒置 / 固定超時
REST API 附帶 X-Word-Count 和 X-Character-Count 標頭
How It Looks
Before
After
運作方式
1
貼上 URL 或 HTML
2
點擊轉換
3
複製輸出或下載為 .txt
常見用途
搜尋索引預處理
RAG / vector-DB 導入
從舊版 CMS 遷移內容
純電子郵件內文生成
文字分類管道
常見問題
它能處理 JavaScript 渲染的內容嗎?
是的 - URL 輸入會先在無頭 Chrome 中渲染,因此可以擷取 SPA / 動態內容。直接 HTML 輸入則跳過 Chrome 以加快速度。
空格會被保留嗎?
區塊元素會獲得換行符,內嵌元素會獲得空格。輸出讀起來就像原始頁面的精簡版。
有 REST API 嗎?
是的 - POST /api/v1/convert/text。回應標頭包含 X-Word-Count 和 X-Character-Count。
HTML 轉純文字
從任何網頁或 HTML 中移除 HTML 標記、腳本和樣式,只保留可讀取的文字內容。適用於 ETL 管道、RAG / vector-DB 索引、內容遷移和純電子郵件內文生成。
Sign up