您有一份看不懂語言的 PDF 文件。也許是德國供應商的合約、日本合作夥伴的銀行對帳單、葡萄牙文的研究論文，或是阿拉伯文的政府表格。您需要了解其內容——最好是不用花 200 美元請專業翻譯師來翻譯一份您只需要審閱的文件。

於是您嘗試了最明顯的方法：選取所有文字，複製，然後貼上到 Google 翻譯。

結果卻是一團糟。欄位合併了。表格資料被打亂了。原始 PDF 中排版整齊的標頭和頁腳混入了內文。原本整齊對齊的數字現在散落在翻譯後的文字牆中，位置隨機。讓文件可讀的格式——那些告訴您哪個數字屬於哪個項目的結構——消失了。

這不是 Google 翻譯的問題。這是 PDF 的問題。解決這個問題需要了解為什麼 PDF 和翻譯工具無法自然地協同工作。

How to translate a PDF document while preserving the original layout - comparison of methods

標準翻譯工具為何無法處理 PDF

PDF 格式並非為文字擷取而生

PDF 儲存文字的方式與 Word 文件或 HTML 網頁不同。它沒有段落、句子或「此文字應放在此欄位」的概念。相反地，PDF 在畫布上以精確的 x,y 座標儲存個別字元。對您而言看起來排版整齊的表格，實際上是數百個獨立的文字放置指令，彼此之間沒有結構關係。

當您從 PDF 複製文字時，您的 PDF 檢視器會嘗試透過排序這些座標來重建閱讀順序。有時它能正確處理。但經常出錯——特別是對於：

多欄版面配置 - 左欄的文字會與右欄的文字交錯
表格 - 列資料會被串連成單一行，完全失去欄結構
標頭和頁腳 - 執行中的標頭、頁碼和頁腳會混入主要內容中
註腳和側邊欄 - 位置化的元素會插入到擷取的文字中不可預測的位置
由右至左的文字 - 阿拉伯文、希伯來文和波斯文的文字可能會以反向的字元順序擷取

翻譯工具不懂 PDF 結構

即使您能從 PDF 中擷取出乾淨的文字，貼到標準翻譯工具中會產生第二個問題：您會失去關於該文字屬於文件哪個位置的所有上下文資訊。

合約可能在標頭有文字（「機密」）、表格中有文字（付款條款）、註腳中有文字（法律免責聲明），以及邊距中有文字（文件參考編號）。當這些文字全部被壓平成單一文字串並一起翻譯時，翻譯結果會是一整塊外文文字，無法區分哪些是標頭、哪些是表格儲存格、哪些是註腳。

手動重建原始版面配置——將每個翻譯後的區塊複製回正確的位置——非常繁瑣，以至於通常比翻譯本身花費的時間還長。

特殊字元和編碼問題

PDF 使用特定字體的字元編碼。有些儲存實際的 Unicode 字元，可以乾淨地擷取。其他則使用自訂編碼，您看到的字形與預期的字元碼不符——即使 PDF 在螢幕上完美呈現，也會產生亂碼、遺漏變音符號或無法讀取的字串。這在舊版 PDF、嵌入式自訂字體、複雜腳本（泰文、印地文、阿拉伯文）以及 OCR 不完美的掃描文件中尤其常見。

How PDF translation works: Upload → Detect Language → Translate → Download with layout preserved

方法一：PDFSub PDF 翻譯器（推薦）

PDFSub 的 PDF 翻譯器是專門為了解決這個問題而設計的。它不是先擷取文字、單獨翻譯，然後再嘗試重新組合文件，而是將整個流程一步到位——理解文件的結構並在保留版面配置的同時翻譯內容。

如何運作

步驟 1：上傳您的 PDF。 將任何 PDF 檔案拖放到翻譯器中。付費方案沒有檔案大小限制，該工具可處理數位建立的 PDF 和掃描文件。

步驟 2：選擇您的目標語言。 從 130 多種支援的語言中選擇。完整列表包含所有主要的全球語言和數十種地區性語言——從南非荷蘭語到祖魯語，並完全支援中文、日文、韓文、阿拉伯文、希伯來文、印地文、泰文等複雜腳本。

步驟 3：翻譯。 AI 分析文件的結構，識別文字區域、表格、標頭、頁腳和格式元素，然後根據上下文翻譯內容。這不是逐字替換——AI 理解句子結構、慣用語和領域特定術語。

步驟 4：下載。 下載翻譯後的 PDF，原始版面配置得以保留。表格仍是表格。標頭仍是標頭。多欄版面配置保持其結構。

為何比複製貼上翻譯效果更好

版面配置保留。 翻譯器理解 PDF 的空間結構——哪些文字區塊是標題、哪些是表格儲存格、哪些是註腳。翻譯後的輸出會維持這些關係，因此您可以像瀏覽原始文件一樣瀏覽翻譯後的文件。

上下文 AI 翻譯。 現代 AI 翻譯模型不僅翻譯單字——它們翻譯意義。英文發票中的「net 30」不會在翻譯版本中變成釣魚的參考。財務術語、法律語言和技術詞彙會根據適當的領域上下文進行翻譯。

完整文件涵蓋。 標頭、頁腳、浮水印、表格儲存格、表單標籤、側邊欄文字——所有內容都會被翻譯。標準複製貼上方法會遺漏這些位置的文字，因為它們位於主要內容流之外。

130 多種語言。 PDFSub 支援超過 130 種語言，包括：

歐洲語言： 英語、西班牙語、法語、德語、義大利語、葡萄牙語、荷蘭語、波蘭語、瑞典語、挪威語、丹麥語、芬蘭語、希臘語、捷克語、羅馬尼亞語、匈牙利語等。
亞洲語言： 中文（簡體和繁體）、日文、韓文、泰文、越南文、印尼文、馬來文、菲律賓文、印地文、孟加拉文、泰米爾文、烏爾都文。
中東語言： 阿拉伯文、希伯來文、波斯文、土耳其文。
非洲語言： 斯瓦希里語、阿姆哈拉語、約魯巴語、祖魯語、南非荷蘭語。
由右至左腳本： 完全支援阿拉伯文、希伯來文、波斯文和烏爾都文的 RTL 支持——翻譯後的文件會維持正確的文字方向。

處理掃描的 PDF。 如果您的 PDF 是掃描圖像而不是數位建立的文件，PDFSub 會使用 AI 視覺直接從圖像中讀取文字、翻譯它，並產生乾淨的翻譯輸出。無需額外的 OCR 步驟。

定價

PDFSub 提供 7 天免費試用，讓您在決定購買前，可以用實際文件測試翻譯器。翻譯使用 AI 點數，包含在所有訂閱方案中。這表示您獲得翻譯以及 PDFSub 完整的 84+ 種 PDF 工具套件的存取權——而不是單獨按頁收費的翻譯費用。

方法二：Google 翻譯文件上傳

Google 翻譯具有內建的文件翻譯功能，可以直接處理 PDF。它是免費的、快速的，並且支援 100 多種語言。

如何使用

前往 translate.google.com
點擊「文件」分頁
上傳您的 PDF（最多 10MB）
選擇來源和目標語言
點擊「翻譯」
下載翻譯後的文件

有效之處

免費。 無需帳戶、無信用卡、無文件數量限制（在合理每日使用範圍內）。
快速。 大多數文件可在數秒內翻譯完成。
良好的語言涵蓋範圍。 支援 100 多種語言，品質參差不齊。
適用於簡單文件。 單欄、以文字為主的 PDF，格式極少時，翻譯效果尚可。

無效之處

格式遺失。 這是最大的限制。表格、多欄版面配置、標頭、頁腳以及大多數結構元素在翻譯輸出中會被剝離或打亂。您收到的通常是幾乎沒有格式的純文字翻譯。
10MB 檔案大小限制。 大型 PDF——特別是包含圖像、掃描頁面或嵌入式字體的 PDF——經常超過此限制。
不支援掃描的 PDF。 如果您的 PDF 是沒有文字圖層的掃描圖像，Google 翻譯無法擷取任何文字進行翻譯。您將得到空白或近乎空白的結果。
品質因語言對而異。 Google 翻譯對於常見語言對（例如英語-西班牙語或英語-法語）非常出色。對於較不常見的語言對（例如芬蘭語-韓語、泰語-葡萄牙語）以及包含專業詞彙的文件，品質會明顯下降。
無領域上下文。 Google 翻譯不知道您的文件是法律合約、醫療報告還是財務報表。相同的歧義術語會獲得相同的翻譯，而不考慮上下文——這在專業文件中可能導致不正確或誤導性的結果。
隱私疑慮。 您的文件會上傳到 Google 伺服器進行處理。對於敏感文件——合約、財務報表、醫療記錄——這可能會違反保密要求或資料保護法規。

何時使用

當以下情況時，Google 翻譯文件上傳是一個不錯的選擇：

您需要快速、粗略地了解一份簡單的文件。
文件主要是文字，格式很少。
您不需要保留原始版面配置。
內容不敏感或不機密。
語言對支援良好（主要的歐洲語言、中文、日文、韓文）。

方法三：複製文字、翻譯、手動重新格式化

手動方法：從 PDF 中擷取文字，逐段翻譯，然後在文字處理器中重建文件。

如何執行

在檢視器（Adobe Acrobat、Preview、Chrome）中開啟 PDF
一次選取並複製文字區塊
將每個區塊貼到翻譯工具（Google 翻譯、DeepL、ChatGPT）中
翻譯並複製輸出
將翻譯後的文字貼到 Word 文件或文字編輯器中
手動重新建立原始格式——標題、表格、欄位、字體

何時適用

非常短的文件。 單頁信件或簡短備忘錄——文字量少於一頁且沒有表格。
部分翻譯。 您只需要翻譯特定區塊，而不是整個文件。
最大程度的控制。 您想單獨審查和調整每個翻譯後的句子。

為何通常不適用

時間。 一份有表格的 10 頁文件需要 2-4 小時才能手動擷取、翻譯和重新格式化。一份 50 頁的技術手冊可能需要數天。
準確性。 逐段複製文字會產生錯誤——遺漏文字、重複段落、順序錯誤的區塊。
表格破壞。 從 PDF 複製的表格幾乎從未能乾淨地貼上。您將花費大部分時間在 Word 或 Excel 中重建表格結構。
不一致。 獨立翻譯區塊意味著相同的術語在文件不同部分可能被翻譯成不同的內容。處理完整文件的翻譯工具可以維持術語的一致性。
編碼問題。 從具有自訂字體編碼的 PDF 複製的文字可能會貼成亂碼，需要在翻譯前進行額外的清理。

這種方法相當於手動重打掃描文件。技術上可行，但幾乎從來都不是最有效率的時間利用方式。

翻譯品質：2026 年的預期

機器翻譯在過去五年中有了顯著的進步。從統計機器翻譯（SMT）到神經機器翻譯（NMT）再到大型語言模型（LLM）翻譯的轉變，大大縮小了機器與人工輸出的差距。

現代 AI 翻譯與傳統機器翻譯有何不同

統計機器翻譯（2016 年前）： 使用統計模式逐句翻譯。對於複雜的句子，經常產生笨拙或無法理解的輸出。

神經機器翻譯（2016-2022 年）： 在數百萬個句子對上訓練的編碼器-解碼器神經網路。流暢度有重大提升。Google 翻譯、DeepL 和 Microsoft Translator 在此期間都切換到了 NMT。

基於 LLM 的翻譯（2023 年至今）： 大型語言模型能夠理解整個文件的上下文進行翻譯，理解整體主題、語氣和術語。它們在處理歧義、慣用語和領域特定詞彙方面，比 NMT 好得多。

AI 翻譯的優勢所在

一般商務往來。 電子郵件、備忘錄、提案、簡報——對於主要的語言對，品質接近專業水準。
技術文件。 產品手冊、規格、使用者指南——一致的詞彙與 AI 模型配合良好。
新聞、新聞報導和電子商務內容。 標準語言內容翻譯乾淨。

人工審閱仍很重要的地方

法律文件。 單一的翻譯錯誤條款可能會改變法律義務。AI 有助於理解，但認證翻譯應由合格的法律翻譯師完成。
醫療文件。 劑量、診斷或禁忌症的誤譯會產生實際的安全影響。
需要法規遵循的財務文件。 官方文件通常需要認證翻譯。
行銷和創意內容。 口號和品牌訊息需要在地化，而不僅僅是翻譯。
罕見語言對。 不太常見的組合（例如冰島語到越南語）訓練資料較少，品質較低。

實際準確度預期

對於主要的語言對（英語與西班牙語、法語、德語、中文、日文、韓文、葡萄牙語、義大利語、荷蘭語之間），現代 AI 翻譯的輸出：

一般內容準確度為 90-95% ——表示 90-95% 的句子翻譯正確且語句自然。
技術內容準確度為 85-90% ——專業術語偶爾會出錯，但整體意義清晰。
法律/財務內容準確度為 80-85% ——關鍵術語通常正確，但細微差別可能會丟失。

這些對於理解、審閱和內部溝通很有用。對於出版、法律或監管目的，建議進行專業審閱。

PDFSub 語言支援：130 多種語言

PDFSub 的翻譯引擎支援 130 多種語言，涵蓋所有主要的書寫系統和文字方向：

由右至左 (RTL)： 阿拉伯文、希伯來文、波斯文和烏爾都文，具有正確的文字方向處理和混合方向內容支援。
CJK： 中文（簡體和繁體）、日文和韓文——原生處理單字邊界、多種書寫系統和複雜的字元集。
印度語言： 印地文、孟加拉文、泰米爾文、泰盧固文、卡納達文、馬拉雅拉姆文、古吉拉特文、馬拉地文、旁遮普文等，具有複雜的連字和母音符號。
東南亞語言： 泰文（單字之間無空格）、越南文（大量變音符號）、印尼文、馬來文、菲律賓文、緬甸文、高棉文和寮文。
歐洲語言： 所有主要的和次要的歐洲語言——從西班牙語和德語到加泰隆尼亞語、巴斯克語、威爾斯語、冰島語和阿爾巴尼亞語。

常見 PDF 翻譯情境

國際合約與協議

一家美國公司收到台灣製造商的供應協議。這份 30 頁的合約完全是繁體中文。法律團隊需要在聘請認證翻譯師進行最終版本之前，了解其條款。

最佳方法： 使用 PDFSub 翻譯整個文件，以獲得可讀的英文版本並保留版面配置。用於內部審閱、團隊討論，並識別需要認證翻譯師密切關注的區塊。透過在昂貴的人工翻譯開始前提供上下文資訊，可以節省時間和金錢。

外國銀行對帳單和財務文件

一位會計師管理有國際業務的客戶。每月都會收到來自 Deutsche Bank（德文）、BNP Paribas（法文）和 Mizuho Bank（日文）的銀行對帳單。會計師需要對帳這些對帳單並分類交易。

最佳方法： 翻譯對帳單以了解交易描述和帳戶詳細資訊。甚至更好的是，使用 PDFSub 的銀行對帳單轉換器將交易資料直接擷取到 Excel 或 CSV 中——它原生支援 130 多種語言的對帳單。

學術論文與研究

一位研究生發現了一篇重要的葡萄牙文研究論文。這篇 25 頁的論文包含方法論、數據表格和參考文獻。

最佳方法： 翻譯整篇論文，以獲得可讀的版本並保留表格。對於論文中的直接引用，請由主題專家翻譯特定段落。

政府表格與官方文件

一位移民在與移民律師預約前，需要了解一份外文的政府表格。

最佳方法： 翻譯表格以了解要求提供哪些資訊以及正在做出哪些聲明。實際表格應在專業協助下以要求的語言填寫。

產品手冊與規格

一支工程團隊收到韓國製造商提供的技術規格——40 頁的公差表、材料規格和測試程序，全部為韓文。

最佳方法： 翻譯整個文件作為工作參考。保留的版面配置使表格保持可讀性，並使規格保持在上下文中。

獲得最佳翻譯結果的秘訣

從乾淨、高品質的 PDF 開始

翻譯品質始於文件品質。一個乾淨、數位建立的 PDF 搭配嵌入式字體，其翻譯效果遠優於褪色的影印掃描件。

數位建立的 PDF（由 Word、Excel 或類似軟體產生）可以完美擷取文字並以最高的準確度進行翻譯。
高解析度掃描（300 DPI 或更高，對齊良好，原始文件乾淨）與 AI 視覺擷取效果良好。
低解析度或傾斜的掃描 可能會產生 OCR 錯誤，在翻譯過程中加劇。如果可能，請取得原始文件的更乾淨副本。

手動審閱關鍵區塊

即使有出色的 AI 翻譯，關鍵區塊仍應進行人工審閱：

數字和日期。 驗證貨幣金額、日期和數字參考是否翻譯正確。日期格式差異（MM/DD/YYYY vs. DD.MM.YYYY）可能會造成混淆。
姓名和專有名詞。 個人姓名、公司名稱和地名應保留其原始形式或遵循既定的音譯慣例。
法律和財務術語。 驗證關鍵的合約條款、財務類別和法律概念是否翻譯準確。
否定和條件。 包含「不」、「除非」、「除了」或「儘管如此」的句子是改變意義的翻譯錯誤最常見的來源。

了解翻譯與認證的區別

AI 翻譯的文件對於理解、審閱、決策和內部溝通很有用。它們通常不適用於：

法庭程序的認證翻譯。
移民文件的官方翻譯。
需要宣誓翻譯的監管文件。
政府機構的公證翻譯。

對於這些目的，您需要一位認證的人工翻譯師——通常是 ATA（美國翻譯協會）認證或在目標國家持有同等資格的人員。AI 翻譯的版本仍然可以透過提供認證翻譯師一份草稿來節省成本，而不是從頭開始。

使用正確的語言變體

翻譯成有地區性變體的語言時，請指定正確的變體：

葡萄牙語： 巴西葡萄牙語與歐洲葡萄牙語在詞彙和語法上有顯著差異。
中文： 簡體中文（中國大陸、新加坡）與繁體中文（台灣、香港）。
西班牙語： 雖然大部分可互通，但拉丁美洲和歐洲西班牙語在詞彙和正式度慣例上有所不同。
法語： 加拿大法語與歐洲法語在某些術語上有所不同，特別是技術和商業語言。

如果您經常處理不熟悉語言的文件，試試 PDFSub 的 PDF 翻譯器並使用您的實際文件。7 天的免費試用期足以讓您針對對您的工作流程重要的文件進行測試。