PDFSub 如何處理您的 PDF:瀏覽器、引擎與 AI
大多數線上 PDF 工具會將您的檔案上傳到遠端伺服器。PDFSub 使用三個處理層級 — 基於瀏覽器的編輯、用於轉換的獨立 PDFSub 引擎,以及用於智慧分析的 AI — 每個層級都旨在保護您的資料。以下是其運作方式。
您需要將銀行對帳單轉換為 Excel。或將兩個合約合併為一個 PDF。或在寄送給客戶前壓縮稅務申報表。
於是您搜尋「PDF 轉換器」,點擊第一個結果,然後將檔案拖曳到上傳框中。進度列填滿。旋轉圖示轉動。三十秒後,您下載結果。
簡單。快速。而您的敏感文件剛經過網際網路,登陸陌生人的伺服器,由您無法檢查的軟體處理,並(希望)之後被刪除。
這就是線上文件工具的隱私悖論。您最需要處理的文件 — 銀行對帳單、稅務申報表、法律合約、醫療記錄、財務報告 — 正是您應該最謹慎分享的文件。然而,每個主要 PDF 工具的標準工作流程都要求您將這些檔案交給第三方。
PDFSub 的建立就是為了打破這種模式。對於大多數操作,您的檔案永遠不會離開您的裝置。本文將詳細說明其運作方式、何時需要伺服器端處理,以及您如何自行驗證所有聲明。

大多數線上 PDF 工具如何運作
在說明 PDFSub 的不同之處之前,了解標準方法會很有幫助。幾乎所有線上 PDF 工具 — 無論免費或付費 — 都遵循相同的模式:
- 您在裝置上選擇一個檔案
- 檔案透過網際網路上傳到提供者的伺服器
- 伺服器處理檔案(合併、壓縮、轉換、提取資料)
- 結果作為下載傳送給您
- 原始檔案保留在他們的伺服器上,直到(據稱)被刪除
這種架構從提供者的角度來看是合理的。伺服器端處理更容易建置、更容易擴展,並讓提供者擁有完全控制權。但從您的角度來看,這意味著您的文件接觸了您無法控制的基礎設施。
即使提供者使用 HTTPS,即使他們承諾在處理後刪除檔案,即使他們有令人安心的隱私權政策 — 您的檔案仍然在他們的伺服器上。它存在於他們的記憶體、磁碟,可能還有備份和日誌中。支援人員可能可以存取。次要處理者可能收到副本。如果他們的基礎設施被入侵,您的文件可能會與數百萬份其他文件一起洩露。
這幾乎適用於您使用過的每一個線上 PDF 工具。知名品牌、免費工具、「注重隱私」的工具 — 幾乎都遵循這種上傳-處理-下載模式。
「注重隱私」通常意味著什麼
有些工具將自己宣傳為注重隱私。但仔細看看這通常意味著什麼:
- 「檔案在傳輸中加密」 — 這只是 HTTPS。每個網站都使用它。它保護您的檔案在傳輸過程中,而不是在伺服器上時。
- 「檔案在 2 小時後刪除」 — 對於第三方伺服器上的敏感文件來說,兩小時是很長的時間。「刪除」並不總是意味著從備份中清除。
- 「我們不讀取您的檔案」 — 技術上屬實 — 自動化軟體會處理它們。但檔案仍然在其基礎設施上,任何擁有伺服器存取權的人都可以存取。
- 「SOC 2 認證」 — 這證明了安全流程的存在,而不是無法發生洩漏。四大會計師事務所中有三家在 MOVEit 洩漏事件中暴露了 9330 萬人的數據時擁有 SOC 2。
這些措施都沒有錯。它們只是對於真正敏感的文件來說不夠。最安全的方法不是更好的加密或更短的保留時間 — 而是根本不傳送檔案。
PDFSub 的不同之處:基於瀏覽器的處理

PDFSub 採取了根本不同的架構方法。PDFSub 不會將您的檔案上傳到伺服器進行處理,而是在您的網頁瀏覽器中直接執行處理軟體。
當您開啟 PDFSub 並載入 PDF 時,檔案會從您的裝置讀取到您瀏覽器的記憶體中。處理程式碼 — 以 JavaScript 和 WebAssembly 編寫 — 在您的電腦上執行,使用您的處理器和記憶體。結果會在本地產生,並直接從您的瀏覽器下載到您的硬碟。
檔案永遠不會經過網路。它永遠不會接觸遠端伺服器。沒有上傳,沒有原始檔案資料的下載,沒有伺服器端儲存,沒有保留期限,也沒有第三方存取。
這不是一個需要信任的行銷聲明。這是一種您可以自行驗證的技術架構(稍後詳述)。
基於瀏覽器的處理實際上如何運作
您不需要成為軟體工程師就能理解這一點。將傳統的 PDF 工具想像成一個照片沖印機。您將照片交給沖印機,它處理並列印,然後(希望)銷毀您的原始照片。您必須信任沖印機操作員。
基於瀏覽器的處理更像是家裡有一台照片印表機。照片永遠不會離開您的家。處理過程在您的設備上進行,在您的控制之下。
當 PDFSub 在您的瀏覽器中載入時,它會將處理軟體下載到您的裝置。然後該軟體完全在您的機器上執行。您的瀏覽器提供一個安全的、沙盒化的環境,讓程式碼可以讀取和處理您的檔案,而無法將原始檔案資料傳送出去。
以下是典型操作的逐步流程:
- 您開啟 PDFSub — 您的瀏覽器下載應用程式碼(JavaScript、WebAssembly)。這是處理引擎。
- 您選擇一個 PDF 檔案 — 您的瀏覽器從您的硬碟將檔案讀取到本地記憶體。不會發出網路請求。
- 處理在本地進行 — JavaScript/WebAssembly 程式碼解析 PDF 結構、提取文字、操作頁面,或執行您選擇的任何操作。所有計算都使用您裝置的處理器。
- 結果在記憶體中產生 — 輸出檔案(合併的 PDF、Excel 電子表格、壓縮的 PDF 等)在您的瀏覽器記憶體中建立。
- 您下載結果 — 檔案直接從瀏覽器記憶體儲存到您的硬碟。沒有涉及伺服器。
在任何時候,原始檔案 — 或其內容 — 都沒有離開您的裝置。瀏覽器的安全模型強制執行這一點:網頁中執行的 JavaScript 在沒有發出網路請求的情況下無法靜默傳輸資料,您可以在即時監控網路請求。
瀏覽器安全模型保護您
現代網頁瀏覽器提供了多層保護,使這種架構真正安全:
- 同源策略 — 一個網站的程式碼無法存取另一個網站的資料。沒有其他分頁或網站可以讀取您在 PDFSub 中處理的檔案。
- 進程隔離 — 每個瀏覽器分頁都在單獨的沙盒化進程中運行。您電腦上的其他應用程式無法存取正在處理的資料。
- 無持久儲存 — 當您關閉分頁時,記憶體中的所有資料都會被銷毀。與伺服器端處理不同,磁碟上沒有殘留副本,沒有備份快照,沒有包含您資料的日誌檔案。
- 可審核的網路活動 — 您的瀏覽器發出的每個網路請求都可以在開發人員工具中看到。您可以即時驗證沒有檔案資料被傳輸。
這不是 PDFSub 建置的專有安全系統。這是網頁平台本身的安全性模型,由 Chrome、Firefox、Safari 和 Edge 強制執行 — 這些瀏覽器背後有數十億美元的安全投資。
離線也能運作
一旦 PDFSub 的頁面載入完成,即使您斷開網路連線,許多操作仍然可以運作。處理程式碼已經在您的瀏覽器中。檔案已經在記憶體中。合併 PDF、壓縮文件或提取文字不需要網路連線。
載入 PDFSub,開啟飛航模式,然後處理檔案。它有效 — 因為檔案本來就不會被上傳。
何時需要伺服器端處理
透明度很重要,所以我們直說:並非所有操作都能在您的瀏覽器中完成。有些任務需要瀏覽器沒有的功能,對這些任務,PDFSub 會使用伺服器端處理。
以下是具體情況:
需要 OCR 的掃描式 PDF
當 PDF 是掃描影像 — 列印文件的照片 — 時,您的瀏覽器可以看到像素但無法讀取文字。從影像中提取文字需要光學字元辨識 (OCR),而這又需要 AI 模型,這些模型太大且計算量太大,無法在瀏覽器中執行。
對於掃描文件,PDF 會被傳送到 PDFSub 的伺服器,然後由 AI 驅動的 OCR 從影像中讀取文字、提取資料並傳回結果。
AI 驅動的功能
像 AI 摘要、AI 翻譯、AI 資料提取和關於文件的 AI 對話等功能,需要運行在專用硬體上的大型語言模型。這些功能目前無法在瀏覽器中執行 — 模型需要大量的計算資源,超出消費級裝置所能提供的。
當您使用 AI 功能時,相關文件內容會被傳送到伺服器進行處理。
複雜的伺服器端解析
某些 PDF 文件具有不尋常的編碼、損壞的結構或邊緣情況的格式,導致基於瀏覽器的解析器無法處理。在這些情況下,PDFSub 會回退到一個擁有更強大解析工具的伺服器端解析器。
伺服器端處理期間會發生什麼
當需要伺服器端處理時,確切的流程如下:
- 加密傳輸 — 您的檔案透過 TLS(與網上銀行相同的加密方式)傳送到 PDFSub 的伺服器。
- 記憶體中處理 — 檔案會立即處理。在處理過程中,它保留在伺服器記憶體中,而不是寫入永久儲存。
- 傳回結果 — 處理結果會傳回您的瀏覽器。
- 立即刪除 — 原始檔案和任何中間資料在處理完成後會立即從伺服器記憶體中刪除。
- 無保留 — PDFSub 不儲存您的檔案,不記錄檔案內容,也不保留處理後的任何文件資料。
- 無 AI 訓練 — 您的文件絕不會用於訓練 AI 模型。檔案內容會被處理並丟棄。
與其他工具的關鍵區別:PDFSub 僅在技術上需要時才使用伺服器端處理,並且僅用於需要它的特定操作。大多數工具會將每個檔案傳送到其伺服器,無論是否需要。
這對您的文件意味著什麼
不同的文件類型有不同的處理路徑。以下是實際的分類:
銀行對帳單(數位 PDF)
如果您從網上銀行入口網站下載銀行對帳單,它就是數位 PDF — 文字是實際的文字,而不是掃描影像。對於這些文件,PDFSub 的提取引擎完全在您的瀏覽器中運行。
交易日期、描述、金額和餘額會在本地進行解析和結構化。輸出 — 無論是 Excel、CSV、QBO、OFX 或任何其他格式 — 都會在您的裝置上產生。您的銀行對帳單,包含帳戶號碼、交易記錄和餘額,永遠不會離開您的電腦。
這是銀行對帳單轉換最常見的情況,因為當今絕大多數銀行對帳單都是數位下載的。
銀行對帳單(掃描)
如果您處理的是實體對帳單,該對帳單被拍照或掃描,則 PDF 包含影像而非文字。這些需要伺服器端 AI 來從影像中讀取文字。檔案會被傳送到伺服器,處理後立即刪除。
發票和收據
從數位發票和收據中提取文字會在您的瀏覽器中進行。如果您需要 AI 驅動的分析 — 自動識別供應商名稱、項目、稅額和總計 — 這就需要伺服器端 AI 處理。
合約和法律文件
合併合約、壓縮法律文件、提取特定頁面、添加浮水印、編輯內容,以及大多數其他 PDF 操作都在您的瀏覽器中完成。文件在整個過程中都保留在您的裝置上。
財務報告
對於數位 PDF,將財務報告的表格轉換為 Excel 會在瀏覽器中進行。AI 驅動的分析 — 生成摘要、提取關鍵指標或詢問內容 — 需要伺服器端處理。
一般規則
如果操作是結構性的(合併、分割、壓縮、旋轉、提取頁面、轉換格式、添加浮水印)— 它會在您的瀏覽器中進行。
如果操作需要 AI 理解(摘要、翻譯、從複雜或掃描文件提取資料、問答)— 它需要伺服器端處理。
PDFSub 提供 84+ 種工具。大多數是基於瀏覽器的操作,永遠不會接觸伺服器。
對於受監管的行業
如果您從事有嚴格資料處理要求的領域,基於瀏覽器和基於伺服器的處理之間的區別具有實際的合規影響。
醫療保健 (HIPAA)
HIPAA 要求涵蓋實體和業務夥伴保護病患健康資訊 (PHI)。當您使用雲端工具處理包含 PHI 的文件時,該工具的提供者就成為業務夥伴 — 需要簽署業務夥伴協議 (BAA)、記錄在案的安全控制和洩漏通知義務。
當您使用 PDFSub 的基於瀏覽器的工具處理包含 PHI 的 PDF 時,文件永遠不會離開您的裝置。不會共享 PHI,因此這些操作不需要 BAA。這簡化了合規性並消除了供應商風險類別。
對於需要伺服器端處理的 AI 驅動功能,適用標準的 HIPAA 供應商評估。
金融服務
銀行、投資公司、保險公司和財務顧問處理的資料受《葛蘭姆-李奇-布羅利法案》(Gramm-Leach-Bliley Act)、SEC 法規、FINRA 要求和州特定法規的管轄。這些要求有記錄在案的資料處理程序、供應商風險評估以及與第三方共享客戶資料的限制。
對於不需要 AI 的操作,基於瀏覽器的處理意味著客戶財務資料保留在本地。這減少了您合規性文件中的第三方資料處理者數量,並簡化了供應商風險評估。
法律
律師處理受律師客戶保密權保護的文件。將特權文件上傳到第三方伺服器會產生風險,如果文件被提供者存取、洩漏或被傳喚,保密權可能會受到質疑。
對於特權文件的基本 PDF 操作 — 合併證據文件、壓縮附件、提取頁面 — 基於瀏覽器的處理意味著文件永遠不會離開律師的裝置。保密權得以毫無疑問地維持。
會計和稅務準備
IRS 要求所有稅務專業人士維護書面資訊安全計畫 (WISP)。AICPA 限制向第三方披露機密客戶資訊。為客戶財務文件使用雲端工具會產生合規性義務。
對於不需要伺服器端 AI 的操作,基於瀏覽器的處理消除了這些義務。您的 WISP 會更簡單,您的供應商風險清單會更短,您的合規性立場會更強。
如何自行驗證
您不必相信 PDFSub 的話。基於瀏覽器的架構可以使用您網頁瀏覽器中已有的工具進行完全審核。
步驟 1:開啟開發人員工具
在任何現代瀏覽器中,按下 F12(或在頁面任何位置按右鍵選擇「檢查」)。這會開啟開發人員工具面板。
步驟 2:前往網路分頁
點擊 網路 分頁。這會顯示您的瀏覽器發出的每一個網路請求 — 每個下載的檔案、每個 API 調用、每次資料傳輸。沒有任何東西可以從您的瀏覽器發送而沒有出現在這裡。
步驟 3:清除日誌
點擊清除按鈕(一個帶有斜線的圓圈)以開始乾淨的記錄。
步驟 4:處理文件
將 PDF 載入 PDFSub 並執行任何基於瀏覽器的操作 — 合併、壓縮、提取文字、轉換銀行對帳單。
步驟 5:檢查網路日誌
查看處理過程中出現的請求。對於基於瀏覽器的操作,您會看到:
- 沒有檔案上傳請求 — 沒有 POST 或 PUT 請求將您的 PDF 資料傳輸到伺服器。
- 任何請求中都沒有文件內容 — 檔案位元組保留在您瀏覽器的記憶體中。
- 只有小型中繼資料請求 — 例如使用分析(頁面瀏覽量、功能使用量)等,不包含文件資料。
這是安全研究人員用來審核網頁應用程式的相同技術。如果 PDFSub 暗中上傳您的檔案,這會立即顯現出來。
AI 操作呢?
如果您使用需要伺服器端 AI 的功能,您會在網路分頁中看到一個網路請求。這是預期的 — 內容需要到達伺服器進行 AI 處理。不同之處在於 PDFSub 會對需要這種處理的操作保持透明,而不是靜默上傳每個檔案。
PDFSub 收集了什麼與沒有收集什麼
完全的透明度意味著具體說明 PDFSub 處理和不處理的資料。
PDFSub 收集的內容
- 帳戶資訊 — 如果您建立帳戶,您的電子郵件地址、姓名和訂閱詳細資訊。
- 使用分析 — 您使用哪些工具、頻率、頁面瀏覽量和功能互動。這是標準的網路分析,有助於改進產品。
- 錯誤報告 — 如果出現問題,匿名的錯誤資訊(非您的文件內容)有助於診斷和修復問題。
- 付款資訊 — 由付款提供者處理(PDFSub 不直接儲存)。
對於基於瀏覽器的操作,PDFSub 不收集的內容
- 您的文件內容 — 對於基於瀏覽器的操作,您的 PDF 位元組永遠不會傳輸到 PDFSub 的伺服器。
- 提取的文字 — 交易描述、名稱、金額、日期 — 對於本地操作,這些資料都不會離開您的裝置。
- 文件元資料 — 檔案名稱、作者欄位、PDF 中的創建日期會保留在您的裝置上。
- 處理後的輸出 — Excel 檔案、CSV、合併的 PDF 或壓縮的文件會在您的瀏覽器中產生並儲存到您的裝置上。
對於伺服器端操作
當操作需要伺服器端處理時(AI 功能、掃描文件 OCR),文件內容會被傳送到伺服器進行處理,並在處理後立即刪除。它不會被儲存、記錄、索引或用於除完成您請求的操作以外的任何目的。
與其他方法的比較
為了將 PDFSub 的方法置於背景中,以下是它與常見替代方案的比較:
| 方法 | 處理發生在哪裡 | 是否需要上傳檔案 | 資料保留 | 隱私等級 |
|---|---|---|---|---|
| PDFSub(基於瀏覽器的工具) | 您的裝置 | 否 | 無 | 最高 — 檔案永不離開 |
| PDFSub(AI 功能) | PDFSub 伺服器 | 是(需要時) | 無 — 立即刪除 | 高 — 最小化暴露 |
| 典型雲端 PDF 工具 | 提供者伺服器 | 是,總是 | 小時到天 | 中等 — 取決於提供者 |
| 企業級雲端工具 | 提供者伺服器 | 是,總是 | 根據保留政策 | 中等 — 有記錄的控制 |
| 桌面軟體 | 您的裝置 | 否 | 本地檔案 | 高 — 但需要安裝 |
桌面軟體在隱私方面是最接近的比較 — 兩者都在本地處理。基於瀏覽器的優勢:無需安裝,可在任何有瀏覽器的裝置上運行,始終保持最新,並且可從無法運行桌面軟體的 Chromebook 和平板電腦存取。
誠實的權衡
沒有方法是完美的,而值得信賴意味著誠實面對限制。
對於非常大的檔案,基於瀏覽器的處理可能會較慢。 具有優化硬體的專用伺服器對於極大的文件(100+ 頁)來說可能更快。對於典型文件,差異幾乎無法察覺。
AI 功能需要伺服器端處理。 如果您需要 AI 摘要、翻譯或掃描文件的 OCR,內容必須到達伺服器。PDFSub 透過先進行本地處理,並僅在必要時升級,來最大限度地減少這種情況。
瀏覽器功能有限制。 邊緣情況 — 損壞的 PDF、不尋常的編碼、極其複雜的佈局 — 可能需要伺服器端的回退。PDFSub 會優雅地處理這些情況,但在那些情況下檔案確實會離開您的裝置。
理念:盡可能在本地處理,僅在確實需要時使用伺服器端,對兩者進行透明說明,並在需要伺服器處理時立即刪除所有內容。
為何這種架構很重要
軟體的趨勢是更多的雲端處理、更多的資料收集、更多的伺服器端計算。對於敏感文件 — 銀行對帳單、稅務申報表、法律合約、醫療記錄和財務報告 — 這種趨勢恰恰相反。
最安全的文件是永遠不會離開您裝置的文件。最安全的伺服器是從未接收您數據的伺服器。最強大的隱私權政策是那個因為提供者端沒有需要保護的東西而無需存在的政策。
PDFSub 的基於瀏覽器的架構不是行銷差異化。它是一個基本的設計決策,塑造了每個工具的建置方式。當一個新功能可以在客戶端實現時,它就會被實現。伺服器端處理是例外,而不是預設。
對於注重隱私的專業人士、合規官和 IT 管理員 — 問題不僅僅是「這個工具是否有良好的隱私權政策?」而是「這個工具是否需要存取我的檔案?」
對於 PDFSub 所做的絕大多數事情,答案是「否」。
親自嘗試
評估 PDFSub 隱私架構的最佳方式是親身體驗。
開始您的 7 天免費試用 — 瀏覽所有 84+ 種工具,在開啟網路分頁的情況下處理文件,親眼看看。沒有檔案上傳。沒有伺服器端處理。您的文件保留在您的裝置上。
對於銀行對帳單轉換、PDF 合併、壓縮、文字提取以及數十種其他操作 — 您的文件永遠不會離開您的瀏覽器。這不是一個承諾。這是一個您可以驗證的架構。