손상된 PDF 파일을 온라인에서 복구하는 방법
PDF가 열리지 않거나 오류가 발생하나요? 손상된 헤더, 깨진 교차 참조, 잘린 데이터를 수정하여 손상된 PDF 파일을 복구하는 방법을 알아보세요.
PDF를 더블 클릭했는데 아무 반응이 없거나, 파일은 열리지만 페이지가 비어 있는 경우가 있습니다. 또는 PDF 뷰어에 "이 문서는 손상되어 복구할 수 없습니다"라는 오류가 표시되기도 합니다. 손상된 PDF는 특히 중요한 데이터가 포함되어 있고 백업본이 없을 때 매우 치명적인 문제로 느껴집니다.
다행인 점은 많은 손상된 PDF를 복구할 수 있다는 것입니다. 대부분의 손상은 내용 자체가 아닌 구조적인 문제입니다. 텍스트와 이미지는 여전히 파일 안에 존재하지만, PDF 뷰어에 해당 데이터의 위치를 알려주는 내부 기록 체계가 깨진 상태인 경우가 많습니다.
이 가이드에서는 PDF가 손상되는 이유, 복구 도구가 실제로 수정하는 항목, 손상된 PDF를 복구하는 방법, 그리고 파일 복구가 불가능한 상황을 판단하는 기준에 대해 설명합니다.
PDF가 손상되는 이유
PDF 손상은 무작위로 발생하지 않습니다. 거의 항상 구체적인 원인이 있으며, 이를 이해하면 향후 손상을 방지하는 데 도움이 됩니다.
불완전한 다운로드
가장 흔한 원인입니다. 브라우저나 다운로드 관리자가 파일 다운로드를 완전히 마치지 못한 경우입니다. PDF가 중간에 잘려나가 시작 부분은 정상이지만 끝부분이 갑자기 끊깁니다. 헤더와 앞부분의 페이지는 온전할 수 있지만, 뒷부분의 페이지와 파일 끝에 위치한 중요한 교차 참조 테이블이 누락됩니다.
이메일 첨부 파일 손상
일부 이메일 시스템은 전송 중에 바이너리 첨부 파일을 수정하기도 합니다. 오래된 메일 서버, 공격적인 바이러스 스캐너 또는 인코딩 불일치로 인해 바이트 스트림이 손상될 수 있습니다. 파일은 PDF처럼 보이지만(올바른 확장자와 아이콘) 내부 데이터가 엉망이 된 상태로 도착합니다.
디스크 및 저장 장치 오류
하드 드라이브의 배드 섹터, 플래시 드라이브 손상 또는 저장 매체의 노후화로 인해 파일 내의 개별 바이트가 손상될 수 있습니다. 잘못된 위치에 있는 단 하나의 비트 오류만으로도 파일을 읽을 수 없게 될 수 있습니다.
저장 중단
PDF를 작성하는 동안 애플리케이션이 충돌하거나, 파일을 저장하는 중에 USB 드라이브를 뽑으면 파일이 부분적으로만 기록됩니다. 이전 버전은 사라지고 새 버전은 완성되지 않은 상태가 됩니다.
소프트웨어 버그
PDF 생성 소프트웨어도 완벽하지 않습니다. PDF를 만든 도구의 버그로 인해 구조적 오류가 있는 파일이 생성될 수 있습니다. 일부 뷰어에서는 열리지만 다른 뷰어에서는 깨지는 경우가 있는데, 이는 자동화된 PDF 생성기에서 의외로 자주 발생합니다.
파일 전송 중 손상
바이너리 모드가 아닌 텍스트 모드로 전송된 FTP 전송, 불안정한 네트워크 드라이브에서의 복사 작업 또는 클라우드 저장소의 동기화 충돌로 인해 손상이 발생할 수 있습니다. PDF의 원시 바이트를 아주 조금이라도 수정하는 모든 프로세스는 파일을 깨뜨릴 수 있습니다.
PDF 복구가 실제로 해결하는 것
PDF 파일은 특정한 내부 구조를 가지고 있습니다. 이를 이해하면 복구를 통해 무엇을 얻을 수 있는지 현실적인 기대를 할 수 있습니다.
PDF 구조 (단순화)
헤더(Header) — 파일이 PDF임을 식별하고 버전을 표시
본문(Body) — 실제 내용 (텍스트, 이미지, 글꼴, 페이지)
교차 참조(Cross-Ref) — 파일 내 모든 객체의 시작 위치를 나열한 테이블
트레일러(Trailer) — 교차 참조 테이블과 루트 객체를 가리킴
교차 참조 테이블(xref)은 가장 중요한 구조적 요소입니다. 책의 목차와 같아서 PDF 뷰어에 각 페이지, 이미지, 텍스트 블록이 파일 어디에 있는지 알려줍니다. xref가 손상되면 내용은 그대로 있어도 뷰어가 내용을 찾을 수 없습니다.
복구 도구가 수정하는 항목
손상되거나 누락된 교차 참조 테이블. 복구 도구는 파일 전체를 스캔하여 모든 객체를 찾고 xref 테이블을 처음부터 다시 작성합니다. 이는 가장 흔한 유형의 손상을 해결합니다.
깨지거나 누락된 헤더. PDF 헤더가 손상된 경우, 도구는 파일에서 발견된 내용을 바탕으로 헤더를 재구성합니다.
손상된 스트림 데이터. PDF 내용은 압축된 스트림에 저장됩니다. 스트림의 메타데이터(길이, 압축 방식)가 틀렸지만 스트림 데이터가 온전하다면, 도구는 올바른 값을 다시 계산할 수 있습니다.
잘린 파일. 다운로드 미완성 등으로 파일이 중간에 끊긴 경우, 도구는 온전한 부분에 존재하는 내용이라도 복구합니다. 10페이지 중 8페이지라도 건지는 것이 아예 못 쓰는 것보다 낫습니다.
선형화(Linearization) 오류. 웹 보기에 최적화된 선형화된 PDF는 추가적인 구조를 가지는데, 이 부분이 불일치할 수 있습니다. 복구 도구는 선형화 데이터를 제거하거나 다시 빌드할 수 있습니다.
복구 도구가 해결할 수 없는 항목
덮어씌워진 내용. 특정 페이지의 텍스트나 이미지가 저장된 바이트가 가비지 데이터로 대체되었다면, 어떤 도구도 원래 내용을 재구성할 수 없습니다. 정보 자체가 사라진 것이기 때문입니다.
비밀번호를 분실한 암호화된 파일. 암호화된 PDF의 보안 데이터가 손상되면 내용을 복호화할 수 없습니다. 복구 도구는 구조적 문제를 해결할 수 있지만, 암호화 키가 손상되었다면 내용에 접근할 수 없습니다.
심각한 바이트 수준의 손상. 구조적 메타데이터뿐만 아니라 파일의 큰 섹션 자체가 손상된 경우, 복구는 온전하게 남아 있는 일부 내용으로 제한됩니다.
0바이트 파일. 파일이 완전히 비어 있다면 복구할 대상이 없습니다.
온라인에서 PDF를 복구하는 방법 (단계별 안내)
1단계: 손상된 PDF 업로드
PDFSub의 PDF 복구 도구로 이동하여 손상된 파일을 업로드합니다. 파일은 안전하고 격리된 환경에서 처리를 위해 PDFSub Engine으로 전송됩니다.
2단계: 분석 및 복구
PDFSub Engine이 파일 구조를 분석하고 손상 유형을 식별한 후 복구를 시도합니다.
- 파일 내의 모든 PDF 객체 스캔
- 교차 참조 테이블 재구축
- 필요한 경우 트레일러 및 헤더 재구성
- 스트림 데이터 유효성 검사 및 길이 불일치 수정
- 교정된 구조로 파일 재조립
이 프로세스는 일반적으로 몇 초 정도 소요됩니다.
3단계: 복구된 파일 다운로드
복구에 성공하면 수정된 PDF를 다운로드합니다. PDF 뷰어에서 파일을 열어 모든 페이지, 이미지, 텍스트가 온전한지 확인합니다.
4단계: 철저한 확인
첫 페이지만 확인하지 말고 문서 전체를 훑어보세요.
- 모든 페이지가 존재하는가?
- 이미지가 올바르게 표시되는가?
- (이전에 가능했다면) 텍스트 선택이 가능한가?
- 하이퍼링크가 작동하는가?
- 임베디드 글꼴이 제대로 렌더링되는가?
일부 내용이 누락되었다면 구조뿐만 아니라 내용 데이터 자체에 손상이 있었을 가능성이 높습니다. 복구된 파일은 복구 가능한 모든 내용을 포함하고 있습니다.
기타 복구 방법
다른 PDF 뷰어 시도하기
복구 도구를 실행하기 전에 다른 PDF 뷰어에서 파일을 열어보세요. 애플리케이션마다 구조적 오류에 대한 허용 오차가 다릅니다. 한 뷰어에서 열리지 않는 파일이 다른 뷰어에서는 잘 열릴 수도 있습니다.
시도해 볼 만한 뷰어:
- 웹 브라우저 (Chrome, Firefox, Edge 모두 PDF 렌더러 내장)
- Adobe Acrobat Reader
- Foxit Reader
- SumatraPDF (Windows)
- 미리보기 (macOS)
일부 뷰어는 구조적 문제를 감지하면 자동으로 복구를 시도합니다. "이 파일은 손상되었습니다. 복구가 시도되었습니다"와 같은 메시지가 표시될 수 있습니다.
파일 다시 다운로드
다운로드한 파일인 경우 다시 다운로드하세요. 불완전한 다운로드는 손상의 가장 흔한 원인이며, 다시 다운로드하는 것만으로 즉시 해결되는 경우가 많습니다. 파일을 열기 전에 다운로드가 완전히 완료되었는지 확인하세요.
백업에서 복원
백업 복사본을 확인하세요.
- 클라우드 저장소 버전 기록 (Google Drive, Dropbox, OneDrive)
- Time Machine (macOS) 또는 파일 히스토리 (Windows)
- 이메일 첨부 파일 (누군가 파일을 보낸 경우)
- 원본 소스 (보낸 사람에게 다시 요청 가능 여부)
백업에서 가져온 깨끗한 복사본은 항상 복구된 파일보다 낫습니다.
가능한 내용 추출
복구에 실패하더라도 일부 내용을 추출할 수 있습니다.
- 텍스트 복사: 일부 뷰어는 부분적으로 손상된 파일에서도 텍스트를 선택하고 복사할 수 있습니다.
- 이미지 추출: 이미지 추출 도구는 때때로 손상된 PDF에서 포함된 이미지를 뽑아낼 수 있습니다.
- 열리는 부분만 변환: 일부 페이지라도 렌더링된다면 해당 페이지를 새 PDF로 인쇄(저장)할 수 있습니다.
PDF 손상 방지 방법
다운로드 확인
PDF를 다운로드한 후 파일 크기를 확인하세요. 보낸 사람이 예상 크기를 알려줄 수 있다면 비교해 보세요. 예상보다 훨씬 작은 파일은 전송 중에 잘렸을 가능성이 큽니다.
파일 전송 시 바이너리 모드 사용
FTP나 기타 파일 전송 도구를 통해 PDF를 전송할 때는 항상 바이너리(Binary) 모드를 사용하세요. 텍스트 모드는 줄 바꿈 문자를 변환하여 바이너리 파일을 손상시킬 수 있습니다.
저장 중단 금지
애플리케이션을 닫거나 드라이브를 꺼내거나 시스템을 종료하기 전에 PDF 저장 및 내보내기가 완료될 때까지 기다리세요. 진행률 표시줄이 움직이고 있다면 파일 작성이 아직 끝나지 않은 것입니다.
백업 유지
손상에 대비하는 가장 좋은 보험은 백업입니다. 버전 기록이 있는 클라우드 저장소, 자동 백업 또는 단순히 여러 위치에 복사본을 보관하는 습관을 가지세요.
반복적인 PDF 편집 피하기
편집과 저장을 반복할 때마다 구조적 문제가 발생할 가능성이 높아집니다. 수정 사항이 많다면 편집 가능한 형식(Word)으로 변환하여 모든 수정을 마친 후 마지막에 다시 PDF로 변환하세요.
신뢰할 수 있는 저장 장치 사용
플래시 드라이브와 SD 카드는 쓰기 횟수가 제한되어 있으며 배드 섹터가 발생할 수 있습니다. 중요한 파일은 신뢰할 수 있는 저장 장치를 사용하고 여러 매체에 복사본을 보관하세요.
FAQ
"파일이 손상되어 복구할 수 없습니다"라는 메시지가 뜨는 PDF도 복구할 수 있나요?
네, 가능한 경우가 많습니다. 해당 오류 메시지는 뷰어의 내장 복구 기능이 실패했음을 의미하지만, 전문 복구 도구는 더 강력한 복구 기술을 사용합니다. PDFSub의 PDF 복구 도구에 파일을 업로드해 보세요. 뷰어가 하지 못한 복구를 성공할 수도 있습니다. 하지만 내용 데이터 자체가 손상된 경우(구조적 메타데이터가 아닌 경우) 완전한 복구는 불가능합니다.
복구가 PDF의 내용을 변경하나요?
아니요. 복구 도구는 구조적 메타데이터(교차 참조 테이블, 헤더, 스트림 길이)를 수정할 뿐 실제 텍스트, 이미지 또는 페이지를 수정하지 않습니다. 복구된 파일의 내용은 원본에 있던 내용과 동일합니다. 내용이 누락되었다면 이는 복구 도구가 삭제한 것이 아니라 해당 데이터가 복구 불가능할 정도로 손상되었기 때문입니다.
PDF가 손상된 것인지 비밀번호로 보호된 것인지 어떻게 알 수 있나요?
오류 메시지에 따라 다릅니다. "비밀번호 필요" 또는 "이 문서는 보호되어 있습니다"는 파일이 암호화되어 비밀번호가 필요하다는 뜻이며 손상된 것이 아닙니다. "파일을 열 수 없음", "파일이 손상됨" 또는 뷰어가 멈추거나 충돌하는 경우는 손상을 의미합니다. 확실하지 않다면 웹 브라우저에서 파일을 열어보세요. 브라우저는 두 경우를 모두 처리하며 명확한 오류 메시지를 제공합니다.
손상된 파일을 복구를 위해 업로드해도 안전한가요?
PDFSub을 사용하신다면 안전합니다. 파일은 보안이 유지되는 격리된 환경에서 PDFSub Engine에 의해 처리됩니다. 파일은 오직 복구 작업을 위해서만 사용되며 영구적으로 저장되지 않습니다. 민감한 문서의 경우, 이 서버 측 처리는 모든 PDFSub Engine 작업과 동일한 보안 수준으로 관리됩니다.
클라우드 저장소에 저장된 PDF도 손상될 수 있나요?
드물지만 가능합니다. 동기화 충돌(두 기기에서 동시에 같은 파일 편집), 업로드 중단 또는 저장 서비스의 버그로 인해 손상이 발생할 수 있습니다. 버전 기록 기능을 제공하는 클라우드 서비스(Google Drive, Dropbox, OneDrive)를 사용하면 이전 버전으로 복원할 수 있으며, 이것이 가장 빠른 해결책입니다. 복구를 시도하기 전에 버전 기록을 먼저 확인하세요.
마무리
PDF 손상은 당혹스러운 일이지만 대개 해결 가능합니다. 대부분의 손상은 실제 내용이 아니라 교차 참조 테이블, 헤더, 스트림 메타데이터와 같은 파일의 내부 구조에 영향을 미칩니다. 복구 도구는 이러한 구조를 재구축하여 내용을 다시 표시해 줍니다.
현실적인 기대치를 갖는 것도 중요합니다. 파일의 내용 바이트가 덮어씌워졌거나 심하게 손상되었다면 어떤 도구도 잃어버린 데이터를 재구성할 수 없습니다. 하지만 불완전한 다운로드, 이메일 전송 오류, 저장 중단과 같은 일반적인 손상 유형에는 복구 도구가 매우 효과적입니다.
먼저 PDFSub의 PDF 복구 도구를 시도해 보세요. 그래도 해결되지 않는다면 다른 PDF 뷰어를 사용하거나, 파일을 다시 다운로드하거나, 백업을 확인해 보세요. 가장 좋은 전략은 예방입니다. 다운로드를 확인하고, 백업을 유지하며, 저장 중에 작업을 중단하지 마세요.