如何删除或编辑PDF元数据(作者、标题、隐藏数据)
PDF包含隐藏的元数据——作者姓名、创建日期、使用的软件,甚至GPS坐标。在共享之前,这里介绍如何查看、编辑或清除这些信息。
您创建或编辑的每个PDF都包含隐藏信息——元数据,用于描述谁创建了它、何时创建、使用什么软件创建、在哪个操作系统上创建,有时甚至更多。在正常查看文档时,这些信息是不可见的,但任何人都可以通过任何PDF阅读器中的“文件”>“属性”在几秒钟内访问它。
大多数情况下,元数据是无害的。但是,当您与外部人员共享文档时——例如与客户、对方律师、公众或匿名收件人——元数据可能会泄露您不打算共享的信息。您的全名和电子邮件地址。您公司的内部软件环境。显示文档编辑次数的草稿修订历史。如果文档包含手机拍摄的照片,则可能包含创建时间戳。甚至GPS坐标。
本指南将介绍您的PDF中隐藏了哪些元数据、为什么它很重要,以及如何在共享之前编辑它以显示您想要的内容,或将其完全清除。

PDF中包含哪些元数据
PDF元数据分为两类:基本文档属性(在任何PDF阅读器的“属性”对话框中可见)和扩展的XMP元数据(存储在文件内的更详细的XML块)。
基本文档属性
这些是每个PDF都可以包含的标准字段:
标题: 文档的标题。通常从文件名或源文档的第一个标题自动填充。有时留空,有时会显示内部工作标题(例如“草稿 - 合并协议 v3 - 请勿分发”)。
作者: 创建文档的个人或组织。这通常是从创建PDF的软件的用户配置文件中提取的。如果您在个人电脑上创建了Word文档,这很可能是您在Microsoft Office中注册的全名。
主题: 文档主题的描述。通常为空,但某些文档管理系统会自动填充。
关键字: 与文档关联的标签。有时由文档管理系统填充,或由作者手动填充。可以显示分类信息(“机密”、“受限”、“仅内部使用”)或主题分类。
创建者: 用于创建源文档的应用程序。示例:“Microsoft Word 2024”、“Google Docs”、“Adobe InDesign 2026”、“LibreOffice 7.6”。这会显示您组织使用的软件。
生产者: 生成PDF的应用程序或库。这通常与创建者不同——Word可能是创建者,但PDF可能由“Microsoft Print to PDF”或特定的PDF库生成。这会显示技术基础设施的详细信息。
创建日期: PDF首次创建的时间。包括精确的时间戳——日期、时间和时区。如果您声称文档是在3月1日创建的,但元数据显示是1月15日,那么在法律或合规情况下,这种不一致可能会有问题。
修改日期: PDF最后修改的时间。结合创建日期,这显示了文档的生命周期。1月份创建并在3月份修改了47次的文档会讲述编辑过程的故事。
扩展XMP元数据
XMP(Extensible Metadata Platform)是一种更详细的元数据格式,以XML形式嵌入在PDF内部。它可以包含:
- 文档历史记录: 文档经过的每次保存、编辑和转换的日志
- 贡献者信息: 接触过该文档的所有人的姓名和标识符
- 权利管理: 版权声明、使用限制、许可条款
- 自定义属性: 软件或工作流嵌入的任何键值对
- 缩略图: 第一页的预览图像,嵌入在元数据中
图像级元数据(EXIF)
如果您的PDF包含照片(尤其是手机拍摄的),这些照片可能带有自己的EXIF元数据:
- GPS坐标: 照片拍摄地点——精确到几米
- 相机信息: 设备型号、镜头、设置
- 日期和时间: 照片拍摄时间
- 方向和尺寸: 原始图像属性
这尤其敏感。包含您家地址拍摄的照片的PDF会在EXIF数据中包含您的GPS坐标。
元数据何时重要
法律文件共享
律师事务所通常会在与对方律师共享文件之前清除元数据。元数据可以显示:
-
文件实际创建时间(而不是声称的创建时间)
-
修订次数(暗示谈判策略)
-
其他贡献者(显示团队构成)
-
使用的软件(可能与真实性有关)
许多法律执业责任索赔都涉及本应被清除但未被清除的元数据。在法律实践中,这被认为是基本的职业责任。
公开文件发布
当组织向公众发布文件时——监管文件、年度报告、新闻稿、公开记录响应——元数据应保持干净。政府机构发布公共文件时不应泄露个别员工的姓名、个人软件许可证或其计算机的时区。
敏感业务文件
公司之间共享的合同、提案和财务文件可能会通过元数据无意中泄露信息。提案的创建日期可能显示您在客户的官方RFP发布之前就已准备好(暗示内部知识)。作者字段可能显示是外包的承包商——而不是您声称的内部团队——准备了工作。
隐私和人身安全
对于个人而言,元数据可能是一个安全问题。在线上或与陌生人共享的文档不应包含您的全名、电子邮件、实际位置(通过嵌入照片中的GPS)或任何个人标识符。这对于举报人、记者信源、骚扰受害者以及任何需要共享文档而不暴露身份的人来说尤其重要。
GDPR和数据保护合规
根据GDPR和类似法规,个人数据包括文档元数据中的姓名和标识符。如果您共享包含个人信息的元数据的文档,您可能在没有合法依据的情况下处理个人数据。共享前清除元数据是一项简单的合规措施。
编辑元数据与删除元数据
您有两个选择,正确的选择取决于您的情况。
编辑元数据
编辑允许您将元数据值替换为您想要显示的信息。将作者设置为您的公司名称,而不是您的个人姓名。将标题设置为“服务协议 2026”,而不是“草稿 - 合并 v3”。将创建者设置为通用值,而不是显示您的软件堆栈。
何时编辑: 当文档应包含元数据时——只是当前值不合适。专业的文档受益于拥有正确的标题、公司作者和相关关键字。编辑可以让您在保持元数据结构完整的同时控制叙述。
删除元数据
删除会清除所有元数据字段,将其设置为空白或默认值。文档将不保留有关谁创建了它、何时创建或如何创建的任何信息。这是终极选项——彻底且不可逆。
何时删除: 当任何元数据都可能构成风险时。法律文件共享、公开记录发布、匿名文件共享以及您根本不希望留下任何元数据足迹的情况。如有疑问,请全部删除。
如何使用PDFSub编辑PDF元数据
PDFSub的编辑元数据工具在您的浏览器中运行。您的PDF在本地处理——文件永远不会离开您的设备。
分步说明
第1步:打开工具。 导航到pdfsub.com/tools/edit-metadata。
第2步:上传您的PDF。 拖放文件或单击以浏览。PDF将在您的浏览器中加载。
第3步:查看当前元数据。 该工具将显示文档中当前的所有元数据字段——标题、作者、主题、关键字、创建者、生产者、创建日期和修改日期。
第4步:编辑字段。 单击任何字段以修改其值。将作者更改为您的组织名称,将标题更新为适当的内容,添加或删除关键字,或调整日期。
第5步:保存。 下载带有更新元数据的修改后的PDF。
如何使用PDFSub删除PDF元数据
PDFSub的删除元数据工具会清除文档中的所有元数据,也完全在您的浏览器中运行。
分步说明
第1步:打开工具。 导航到pdfsub.com/tools/remove-metadata。
第2步:上传您的PDF。 拖放文件或单击以浏览。
第3步:删除。 单击删除按钮。该工具将清除所有文档属性、XMP元数据以及嵌入图像中的EXIF数据。
第4步:下载。 清理后的PDF将下载,所有元数据均已删除。
删除的内容
删除过程将清除:
- 所有文档属性(标题、作者、主题、关键字、创建者、生产者)
- 所有时间戳(创建日期、修改日期)
- 所有XMP元数据(编辑历史、贡献者信息、自定义属性)
- 嵌入图像中的EXIF数据(GPS坐标、相机信息、拍摄日期)
- 元数据中嵌入的缩略图
- 文档管理系统添加的自定义元数据字段
保留的内容
可见的文档内容——文本、图像、布局、注释、表单字段——完全不变。删除元数据仅影响隐藏的信息层;文档本身的外观和功能保持不变。
检查您的PDF元数据
在编辑或删除之前,您应该知道其中已包含什么。以下是检查方法。
在任何PDF阅读器中
打开PDF并查看文档属性:
- Adobe Acrobat/Reader: 文件 > 属性 > 描述选项卡
- Preview (Mac): 工具 > 显示检查器 > 常规选项卡
- Chrome/Edge浏览器: 打开PDF,单击属性图标
这会显示基本元数据字段。它不会显示完整的XMP元数据块。
使用PDFSub
将PDF上传到PDFSub的编辑元数据工具,它将显示所有元数据字段——包括基本查看器不显示的XMP数据和嵌入图像元数据。
建立元数据卫生工作流程
与其在事后才清理元数据,不如将其纳入您的文档工作流程。
在外部共享之前
将其作为清单项:在任何文档发送给外部方之前,先通过元数据删除或编辑工具处理一遍。这只需要几秒钟,就能消除一整类信息泄露的风险。
模板文档
如果您的组织从模板创建文档,请将模板元数据设置为适当的值(公司名称作为作者,通用创建者等)。这样,每个新文档都将以干净的元数据开始,而不是继承模板创建者的个人信息。
合并PDF之后
当您合并来自不同来源的多个PDF时,生成的文件将继承源文件的元数据——有时会合并来自多个文档的作者姓名、创建日期和软件标识符。在任何合并操作后都要清理元数据。
扫描之后
扫描的文档会携带扫描仪特定的元数据(设备型号、固件版本、扫描设置)。如果您要向外部分发扫描的文档,请清除此元数据,以避免泄露您的设备详细信息。
常见问题解答
删除元数据会改变我的PDF外观吗?
不会。元数据是与文档内容一起存储的不可见信息。删除它对文档的外观、文本、图像、格式或功能没有任何影响。唯一的变化在于隐藏的属性——即您在检查“文件”>“属性”时看到的内容。
删除的元数据可以恢复吗?
不能。一旦元数据从PDF中被剥离,它就消失了。删除过程会覆盖文件中的元数据块——没有撤销或恢复机制。如果您将来可能需要元数据,请务必保留原始文件的副本。
元数据会影响文件大小吗?
极小。基本元数据(标题、作者、日期)只有几百字节。包含编辑历史的扩展XMP元数据可能重达几千字节。元数据中嵌入的缩略图可能为20-50 KB。对于典型文档,删除元数据节省的量不到100 KB——与文档内容相比微不足道。
元数据与文档属性相同吗?
文档属性是元数据的一个子集。“文档属性”通常指属性对话框中可见的基本字段(标题、作者、主题、关键字、日期)。“元数据”是一个更广泛的术语,包括文档属性以及XMP数据、图像EXIF数据、编辑历史和自定义字段。当人们说“删除元数据”时,他们通常是指全部——而不仅仅是可见的属性。
我可以选择性地删除部分元数据但保留其他字段吗?
是的。PDFSub的编辑元数据工具允许您修改单个字段。例如,您可以清除作者和创建者,同时保留标题和关键字。如果您想要完全删除而无需做任何决定,请改用删除元数据工具。大多数人要么编辑特定字段,要么删除所有内容——部分删除不太常见,但完全支持。
摘要
PDF元数据是隐藏的信息,可以显示谁创建了文档、何时创建、使用什么软件创建,有时甚至在哪里创建。对于大多数内部文档,这并不重要。对于与外部共享的文档——与客户、对方律师、公众或匿名收件人——元数据可能构成隐私和安全风险。
| 操作 | 何时使用 | 变化 |
|---|---|---|
| 编辑元数据 | 应具有受控元数据的专业文档 | 特定字段更新为选定的值 |
| 删除元数据 | 敏感共享、法律、合规、隐私 | 所有隐藏数据完全清除 |
| 不操作 | 内部文档、受信任的收件人 | 无——现有元数据保留 |
通用规则是:如果文档要离开您的组织,请清理元数据。 这只需要几秒钟,就能消除一整类无意的信息泄露。
准备好清理您的PDF了吗?编辑元数据以控制显示的内容,或删除元数据以清除所有内容——这两个工具都在您的浏览器中运行,无需上传文件。