Някъде в този PDF има снимка, която ви трябва. Може би това е продуктова снимка от брошура, лого от медиен пакет на партньор, графика от изследователска статия или семейна снимка, вградена в сканиран документ. Изображението е точно там - виждате го на страницата - но PDF файлът не ви позволява просто да щракнете с десния бутон и да го запазите.

Това е едно от най-честите разочарования при работа с PDF файлове. Форматът е проектиран за последователно показване на документи, а не за изваждане на отделни елементи. Изображенията в PDF се вграждат като отделни обекти - съхраняват се в оригиналния си формат (JPEG, PNG или суров битмап) във вътрешната структура на PDF файла. За да ги извлечете, е необходим инструмент, който може да прочете тази структура и да извлече всеки обект с изображение поотделно.

Добрата новина: извличането на изображения от PDF е лесно с правилния инструмент, а извлечените изображения запазват оригиналната си резолюция и качество. Ето как да го направите.

How to extract images from a PDF - pull out photos, logos, and graphics at original quality

Извличане срещу Конвертиране: Важно Разграничение

Преди да продължим, си струва да се изясни какво всъщност означава "извличане на изображения", тъй като хората често го бъркат с "конвертиране в изображение".

Извличане на изображения изважда отделните обекти с изображения, вградени в PDF файла. Ако PDF файлът съдържа три снимки и едно лого, извличането ви дава точно тези четири файла - при каквато резолюция са били първоначално вградени. Получавате суровите изображения, а не скрийншоти на страниците.

Конвертиране на PDF в изображение рендира цели страници като изображения. Всеки елемент на страницата - текст, изображения, фонове, рамки - става част от едно изображение. Това е като да направите скрийншот на всяка страница.

Ако се нуждаете от цялата страница като картина (например за слайд в презентация), използвайте PDF към изображение. Ако се нуждаете от отделните снимки, лога или графики, извадени с оригиналното им качество, вие искате извличане на изображения - и това е, което този наръчник покрива.

Как се съхраняват изображенията в PDF файлове

Разбирането как PDF файловете съхраняват изображения помага да се обясни какво всъщност прави извличането и защо запазва качеството.

PDF файлът е по същество контейнер. Текстови инструкции казват на рендеръра къде да постави символите, какви шрифтове да използва и как да чертае векторни графики. Но изображенията се съхраняват по различен начин - те се вграждат като отделни бинарни обекти в структурата на препратките на PDF файла.

Всяко вградено изображение има свои собствени свойства:

Резолюция: Пикселните размери на оригиналното изображение (напр. 2400 x 1600 пиксела)
Цветово пространство: RGB, CMYK, сива скала или индексирани цветове
Компресия: JPEG, JPEG2000, Deflate (подобно на PNG), CCITT (тип факс за черно-бяло) или JBIG2
Дълбочина на бита: Обикновено 8 бита на канал, но може да бъде и по-висока за професионална работа

Когато създателят на PDF вгражда снимка, пълните данни на изображението отиват във файла. Дори ако оформлението на страницата мащабира изображението до миниатюра от 2 инча, оригиналното изображение с размери 4000 x 3000 пиксела все още е вътре в PDF файла. Извличането възстановява това изображение с пълна резолюция.

Ето защо извличането е толкова ценно - вие не правите скрийншот на страница с произволно избрано DPI. Вие възстановявате оригиналното изображение, както е било вградено, при неговата естествена резолюция.

Как да извлечем изображения с PDFSub

Инструментът Извличане на изображения на PDFSub обработва PDF файла на сървъра, използвайки PDFSub Engine, който чете вътрешната структура и извлича всеки вграден обект с изображение.

Инструкции стъпка по стъпка

Стъпка 1: Отворете инструмента. Отидете на pdfsub.com/tools/extract-images.

Стъпка 2: Качете вашия PDF файл. Плъзнете и пуснете файла или кликнете, за да го изберете. Файлът се качва на сигурните сървъри за обработка на PDFSub.

Стъпка 3: Стартирайте извличането. Кликнете бутона за извличане. PDFSub Engine сканира вътрешната структура на PDF файла, идентифицира всички вградени обекти с изображения и извлича всеки от тях.

Стъпка 4: Преглед и изтегляне. Ще видите визуализация на всяко извлечено изображение с неговия формат, размери и размер на файла. Изтеглете отделни изображения или ги вземете всички като ZIP файл.

Какво се извлича

Процесът на извличане намира всеки обект с изображение в PDF файла, включително:

Снимки: Вградени JPEG файлове с оригиналната им резолюция
Логота и икони: Често съхранявани като PNG с прозрачност
Диаграми и графики: Обикновено вградени като растерни изображения при експортиране от инструменти като Excel или Tableau
Фонове на сканирани страници: Всяка страница от сканиран PDF файл технически е едно голямо изображение
Вградени графики: Малки декоративни елементи, разделители и фонови шарки

Какво не се извлича

Векторните графики (чертани с PDF команди за пътеки) не са изображения - те са математически инструкции за чертане на форми. Текстът, рендиран като шрифтове, също не може да бъде извлечен като изображение. Тези елементи са част от инструкциите за чертане на PDF файла, а не вградени обекти с изображения.

Ако се нуждаете от векторни графики или текст като част от изображение, вместо това използвайте конвертиране на PDF в изображение, което рендира цялата страница.

Чести случаи на употреба

Възстановяване на снимки от документи

Клиент ви изпраща PDF брошура със продуктови снимки, които ви трябват за вашия уебсайт. Вместо да го молите да намери оригиналните файлове с изображения, извлечете ги директно от PDF файла. Изображенията излизат при каквато резолюция са били вградени - често 300 DPI или по-висока, което е повече от достатъчно за уеб употреба.

Повторно използване на лога и графики

Маркетинговите екипи често се нуждаят от лога от PDF файлове на партньори, медийни пакети или насоки за брандиране, които са били споделени като PDF документи. Извличането изважда логото при неговата вградена резолюция, често като PNG с запазена прозрачност.

Спасяване на изображения от стари документи

Имате PDF файл отпреди години, но оригиналните файлове с изображения отдавна ги няма. Може би дизайнерът, създал документа, вече не работи там, или файловете са били загубени при миграция. Извличането възстановява всяко изображение с оригиналното му качество - без деградация от процеса на вграждане в PDF.

Академична и изследователска употреба

Изследователите често трябва да се позовават на диаграми, схеми или фигури от публикувани статии. Извличането на тези изображения с оригиналната им резолюция дава по-ясни резултати от правенето на скрийншот на PDF четеца и избягва ограниченията на резолюцията при конвертиране.

Архивиране и каталогизиране

Организации с големи PDF архиви понякога трябва да индексират или каталогизират изображенията в тези документи - продуктови снимки от каталози, снимки от доклади за инспекция или произведения на изкуството от дизайнерски файлове. Масовото извличане прави това възможно.

Съображения за качеството

Оригиналното качество се запазва

Най-важното нещо, което трябва да разберете: извличането на изображения е без загуби по отношение на съхранените данни. Изображението излиза точно както е било съхранено в PDF файла. Ако е бил вграден JPEG файл с размери 3000 x 2000 пиксела, вие получавате същия JPEG файл обратно - същите пиксели, същата компресия, същия файл.

Въпреки това, това означава, че качеството зависи от това какво е било вградено първоначално. Ако създателят на PDF файла е компресирал изображенията силно преди да ги вгради, извлечените изображения ще показват същата компресия. Ако изображенията са били намалени до 72 DPI за PDF файл, оптимизиран за уеб, това ще получите. Извличането възстановява това, което е налично - то не подобрява или увеличава мащаба.

Изход JPEG срещу PNG

Изображенията се извличат в оригиналния им формат, когато е възможно. JPEG, вграден в PDF файла, излиза като JPEG. PNG излиза като PNG. Някои вътрешни формати (като суров битмап или компресия CCITT факс) се конвертират в PNG по време на извличане, тъй като нямат пряк еквивалент, подходящ за уеб.

Работа с CMYK изображения

Някои PDF файлове, предназначени за печат, вграждат изображения в CMYK цветово пространство. Те се извличат с intact CMYK цветове, което може да изглежда различно на екрана (мониторите показват RGB). Ако се нуждаете от изображенията за уеб употреба, може да искате да ги конвертирате в RGB след извличане, използвайки всеки редактор на изображения.

Съвети за най-добри резултати

Първо проверете качеството на изходния PDF файл

Преди да извлечете, увеличете изображенията във вашия PDF четец. Ако изглеждат пикселизирани при увеличение от 200-300%, те са били вградени с ниска резолюция - извличането няма да подобри това. Ако изглеждат остри при увеличение, ще получите висококачествен изход.

Големи PDF файлове с много изображения

Брошури, каталози и дизайнерски документи могат да съдържат десетки или стотици изображения. Процесът на извличане обработва тези ефективно, но полученият ZIP файл за изтегляне може да бъде голям. За каталог на продукти от 200 страници с висококачествени снимки, очаквайте извлечените изображения да бъдат общо няколкостотин мегабайта.

Сканирани PDF файлове са специален случай

Ако PDF файлът е създаден чрез сканиране на хартиени страници, всяка страница се съхранява като едно голямо изображение. Извличането на изображения от сканиран PDF файл ви дава едно изображение на страница - по същество суровия скан. Това е полезно за достъп до оригиналните данни от сканирането, но ако искате отделни снимки от сканирана страница, ще трябва да ги изрежете ръчно от извлеченото изображение на страницата.

Откриване на дублиращи се изображения

Някои PDF файлове реферират едно и също изображение многократно - например лого, което се появява на всяка страница. Процесът на извличане идентифицира тези дубликати и извлича изображението само веднъж, спестявайки ви сортирането на 50 копия на едно и също лого.

Често задавани въпроси

Мога ли да извлека изображения от сканиран PDF файл?

Да, но всяка сканирана страница се съхранява като едно голямо изображение. Ще получите едно изображение на страница - суровия скан на цялата страница, включително текст и полета. Ако трябва да изолирате конкретни снимки или елементи от сканирана страница, ще трябва да ги изрежете ръчно в редактор на изображения.

Ще намали ли извличането качеството на изображението?

Не. Изображенията се извличат при оригиналната им вградена резолюция и качество. Процесът на извличане чете директно съхранените данни на изображението - няма повторна компресия или загуба на качество. Това, което получавате, е точно това, което е било вградено в PDF файла.

Мога ли да извлека изображения от PDF файл, защитен с парола?

Ще трябва първо да отключите PDF файла. Ако има парола на собственика (ограничаваща печат/копиране, но позволяваща преглед), PDFSub обикновено може да извлече изображения, след като предоставите паролата. Ако има потребителска парола (необходима за отваряне на файла), трябва да въведете тази парола, преди да може да започне извличането.

Как това се различава от правенето на скрийншот?

Скрийншотът заснема това, което се показва на вашия екран при резолюцията на вашия екран (обикновено 72 или 144 DPI). Извличането на изображения възстановява оригиналното вградено изображение - което често е 300 DPI или по-висока, с размери много пъти по-големи от това, което се появява на екрана. За снимка, която се показва с ширина 3 инча на екрана ви, вграденото изображение може да бъде с ширина 3000 пиксела.

Работи ли извличането с всички видове PDF файлове?

Работи с всеки PDF файл, който съдържа вградени растерни изображения. Това включва повечето документи, създадени от текстообработващи програми, дизайнерски инструменти, софтуер за презентации и скенери. Единствените PDF файлове без извличаеми изображения са тези, които са изцяло съставени от векторни графики и текст - обикновено инженерни чертежи или документи само с текст.

Резюме

Извличането на изображения от PDF ви дава оригиналните вградени файлове - при тяхната естествена резолюция, в оригиналния им формат, без загуба на качество. Това е правилният подход, когато се нуждаете от отделни снимки, лога или графики, вместо от скрийншоти на цели страници.

От какво се нуждаете	Използвайте този инструмент
Отделни снимки/лога от PDF	Извличане на изображения
Цяла страница като едно изображение	PDF към изображение
Цялото текстово съдържание от PDF	PDF към текст

За повечето случаи на употреба - възстановяване на продуктови снимки, повторно използване на лога, спасяване на изображения от стари документи - извличането е най-бързият път от "Виждам го в PDF" до "Имам файла, който ми трябва".

Готови ли сте да извлечете? Опитайте инструмента за извличане на изображения на PDFSub - качете вашия PDF файл и получете всяко вградено изображение за секунди.

How to extract images from a PDF - pull out photos, logos, and graphics at original quality

Извличане срещу Конвертиране: Важно Разграничение

Как се съхраняват изображенията в PDF файлове

Всяко вградено изображение има свои собствени свойства:

Резолюция: Пикселните размери на оригиналното изображение (напр. 2400 x 1600 пиксела)
Цветово пространство: RGB, CMYK, сива скала или индексирани цветове
Компресия: JPEG, JPEG2000, Deflate (подобно на PNG), CCITT (тип факс за черно-бяло) или JBIG2
Дълбочина на бита: Обикновено 8 бита на канал, но може да бъде и по-висока за професионална работа

Снимки: Вградени JPEG файлове с оригиналната им резолюция
Логота и икони: Често съхранявани като PNG с прозрачност
Диаграми и графики: Обикновено вградени като растерни изображения при експортиране от инструменти като Excel или Tableau
Фонове на сканирани страници: Всяка страница от сканиран PDF файл технически е едно голямо изображение
Вградени графики: Малки декоративни елементи, разделители и фонови шарки

От какво се нуждаете	Използвайте този инструмент
Отделни снимки/лога от PDF	Извличане на изображения
Цяла страница като едно изображение	PDF към изображение
Цялото текстово съдържание от PDF	PDF към текст