Gdzieś w tym pliku PDF znajduje się potrzebne zdjęcie. Może to być zdjęcie produktu z broszury, logo od partnera w zestawie medialnym, wykres z artykułu naukowego lub zdjęcie rodzinne osadzone w zeskanowanym dokumencie. Obraz jest tam – widać go na stronie – ale PDF nie pozwala po prostu kliknąć prawym przyciskiem myszy i go zapisać.

Jest to jedno z najczęstszych utrudnień związanych z plikami PDF. Format ten został zaprojektowany do spójnego wyświetlania dokumentów, a nie do wyciągania poszczególnych elementów. Obrazy w pliku PDF są osadzane jako oddzielne obiekty – przechowywane w oryginalnym formacie (JPEG, PNG lub surowy bitmapowy) w wewnętrznej strukturze pliku PDF. Aby je uzyskać, potrzebne jest narzędzie, które potrafi odczytać tę strukturę i wyodrębnić każdy obiekt obrazu indywidualnie.

Dobra wiadomość: wyodrębnianie obrazów z pliku PDF jest proste dzięki odpowiedniemu narzędziu, a wyodrębnione obrazy zachowują oryginalną rozdzielczość i jakość. Oto jak to zrobić.

How to extract images from a PDF - pull out photos, logos, and graphics at original quality

Wyodrębnianie a konwersja: Ważne rozróżnienie

Zanim przejdziemy dalej, warto wyjaśnić, co właściwie oznacza „wyodrębnianie obrazów”, ponieważ ludzie często mylą to z „konwersją do obrazu”.

Wyodrębnianie obrazów pobiera poszczególne obiekty obrazów osadzonych w pliku PDF. Jeśli plik PDF zawiera trzy zdjęcia i logo, wyodrębnienie daje dokładnie te cztery pliki – w dowolnej rozdzielczości, w jakiej zostały pierwotnie osadzone. Otrzymujesz surowe obrazy, a nie zrzuty ekranu stron.

Konwersja PDF do obrazu renderuje całe strony jako obrazy. Każdy element na stronie – tekst, obrazy, tła, obramowania – staje się częścią jednego obrazu. Jest to jak zrobienie zrzutu ekranu każdej strony.

Jeśli potrzebujesz całej strony jako obrazu (na przykład do slajdu prezentacji), użyj PDF do Obrazu. Jeśli potrzebujesz wyciągnąć poszczególne zdjęcia, logo lub grafiki w ich oryginalnej jakości, potrzebujesz wyodrębniania obrazów – i tym właśnie zajmuje się ten przewodnik.

Jak obrazy są przechowywane w plikach PDF

Zrozumienie, jak pliki PDF przechowują obrazy, pomaga wyjaśnić, co właściwie robi wyodrębnianie i dlaczego zachowuje jakość.

Plik PDF jest zasadniczo kontenerem. Instrukcje tekstowe mówią rendererowi, gdzie umieścić znaki, jakich czcionek użyć i jak rysować grafiki wektorowe. Ale obrazy są przechowywane inaczej – są osadzane jako oddzielne obiekty binarne w strukturze odwołań krzyżowych pliku PDF.

Każdy osadzony obraz ma swoje własne właściwości:

Rozdzielczość: Wymiary w pikselach oryginalnego obrazu (np. 2400 x 1600 pikseli)
Przestrzeń kolorów: RGB, CMYK, skala szarości lub kolor indeksowany
Kompresja: JPEG, JPEG2000, Deflate (styl PNG), CCITT (styl faksu dla czarno-białych) lub JBIG2
Głębia bitowa: Zazwyczaj 8 bitów na kanał, ale może być wyższa w przypadku pracy profesjonalnej

Kiedy twórca pliku PDF osadza zdjęcie, pełne dane obrazu trafiają do pliku. Nawet jeśli układ strony skaluje obraz do miniatury o rozmiarze 2 cali, oryginalny obraz o rozdzielczości 4000 x 3000 pikseli nadal znajduje się w pliku PDF. Wyodrębnianie odzyskuje ten obraz w pełnej rozdzielczości.

Dlatego wyodrębnianie jest tak cenne – nie robisz zrzutu ekranu strony w dowolnej wybranej rozdzielczości DPI. Odzyskujesz oryginalny obraz w takiej postaci, w jakiej został osadzony, w jego natywnej rozdzielczości.

Jak wyodrębnić obrazy za pomocą PDFSub

Narzędzie Wyodrębnianie Obrazów PDFSub przetwarza plik PDF na serwerze przy użyciu PDFSub Engine, który odczytuje wewnętrzną strukturę i pobiera każdy osadzony obiekt obrazu.

Instrukcje krok po kroku

Krok 1: Otwórz narzędzie. Przejdź do pdfsub.com/tools/extract-images.

Krok 2: Prześlij swój plik PDF. Przeciągnij i upuść plik lub kliknij, aby go wyszukać. Plik zostanie przesłany na bezpieczne serwery przetwarzające PDFSub.

Krok 3: Rozpocznij wyodrębnianie. Kliknij przycisk wyodrębniania. PDFSub Engine skanuje wewnętrzną strukturę pliku PDF, identyfikuje wszystkie osadzone obiekty obrazów i wyodrębnia każdy z nich.

Krok 4: Przejrzyj i pobierz. Zobaczysz podgląd każdego wyodrębnionego obrazu z jego formatem, wymiarami i rozmiarem pliku. Pobierz poszczególne obrazy lub pobierz je wszystkie jako plik ZIP.

Co jest wyodrębniane

Proces wyodrębniania znajduje każdy obiekt obrazu w pliku PDF, w tym:

Zdjęcia: Osadzone pliki JPEG w oryginalnej rozdzielczości
Logotypy i ikony: Często przechowywane jako PNG z przezroczystością
Wykresy i diagramy: Zazwyczaj osadzane jako obrazy rastrowe po wyeksportowaniu z narzędzi takich jak Excel lub Tableau
Tła zeskanowanych stron: Każda strona zeskanowanego pliku PDF jest technicznie jednym dużym obrazem
Grafika wbudowana: Małe elementy dekoracyjne, separatory i wzory tła

Co nie jest wyodrębniane

Grafiki wektorowe (rysowane za pomocą poleceń ścieżki PDF) nie są obrazami – są to instrukcje matematyczne do rysowania kształtów. Tekst renderowany jako czcionki również nie jest możliwy do wyodrębnienia jako obraz. Te elementy są częścią instrukcji rysowania pliku PDF, a nie osadzonymi obiektami obrazów.

Jeśli potrzebujesz grafik wektorowych lub tekstu jako części obrazu, zamiast tego użyj konwersji PDF do obrazu, która renderuje całą stronę.

Typowe przypadki użycia

Odzyskiwanie zdjęć z dokumentów

Klient wysyła Ci broszurę w formacie PDF ze zdjęciami produktów, których potrzebujesz do swojej strony internetowej. Zamiast prosić o odnalezienie oryginalnych plików obrazów, wyodrębnij je bezpośrednio z pliku PDF. Obrazy wychodzą w rozdzielczości, w jakiej zostały osadzone – często 300 DPI lub wyższej, co jest więcej niż wystarczające do użytku w sieci.

Ponowne wykorzystanie logotypów i grafik

Zespoły marketingowe często potrzebują logotypów z plików PDF partnerów, zestawów prasowych lub wytycznych dotyczących marki, które zostały udostępnione jako dokumenty PDF. Wyodrębnianie pobiera logotyp w jego osadzonej rozdzielczości, często jako PNG z zachowaną przezroczystością.

Odzyskiwanie obrazów ze starych dokumentów

Masz plik PDF sprzed lat, ale oryginalne pliki obrazów dawno zaginęły. Być może projektant, który stworzył dokument, odszedł z firmy, lub pliki zostały utracone podczas migracji. Wyodrębnianie odzyskuje każdy obraz w oryginalnej jakości – bez degradacji spowodowanej procesem osadzania w PDF.

Użytek akademicki i badawczy

Badacze często muszą odwoływać się do wykresów, diagramów lub rysunków z opublikowanych artykułów. Wyodrębnianie tych obrazów w ich oryginalnej rozdzielczości daje czystsze wyniki niż robienie zrzutów ekranu z przeglądarki PDF i pozwala uniknąć ograniczeń rozdzielczości konwersji.

Archiwizacja i katalogowanie

Organizacje z dużymi archiwami PDF czasami muszą indeksować lub katalogować obrazy w tych dokumentach – zdjęcia produktów z katalogów, zdjęcia z raportów inspekcji lub grafiki z plików projektowych. Masowe wyodrębnianie czyni to wykonalnym.

Uwagi dotyczące jakości

Zachowana oryginalna jakość

Najważniejsza rzecz do zrozumienia: wyodrębnianie obrazów jest bezstratne pod względem przechowywanych danych. Obraz wychodzi dokładnie tak, jak został zapisany w pliku PDF. Jeśli osadzono plik JPEG o rozdzielczości 3000 x 2000 pikseli, otrzymujesz dokładnie ten sam plik JPEG – te same piksele, ta sama kompresja, ten sam plik.

Jednak oznacza to, że jakość zależy od tego, co zostało osadzone w pierwszej kolejności. Jeśli twórca pliku PDF mocno skompresował obrazy przed ich osadzeniem, wyodrębnione obrazy będą wykazywać tę samą kompresję. Jeśli obrazy zostały przeskalowane do 72 DPI dla zoptymalizowanego pod kątem sieci pliku PDF, to właśnie otrzymasz. Wyodrębnianie odzyskuje to, co jest dostępne – nie ulepsza ani nie przeskalowuje.

Wynik JPEG vs PNG

Obrazy są wyodrębniane w oryginalnym formacie, gdy jest to możliwe. Plik JPEG osadzony w pliku PDF wychodzi jako JPEG. Plik PNG wychodzi jako PNG. Niektóre formaty wewnętrzne (takie jak surowy bitmapowy lub kompresja faksu CCITT) są konwertowane do PNG podczas wyodrębniania, ponieważ nie mają bezpośredniego odpowiednika przyjaznego dla sieci.

Obsługa obrazów CMYK

Niektóre pliki PDF zorientowane na druk osadzają obrazy w przestrzeni kolorów CMYK. Te obrazy są wyodrębniane z zachowaniem kolorów CMYK, co może wyglądać inaczej na ekranie (monitory wyświetlają RGB). Jeśli potrzebujesz obrazów do użytku w sieci, możesz je przekonwertować do RGB po wyodrębnieniu za pomocą dowolnego edytora obrazów.

Wskazówki dotyczące najlepszych wyników

Najpierw sprawdź jakość oryginalnego pliku PDF

Przed wyodrębnieniem powiększ obrazy w przeglądarce PDF. Jeśli wyglądają na pikselowate przy powiększeniu 200-300%, zostały osadzone w niskiej rozdzielczości – wyodrębnianie tego nie poprawi. Jeśli wyglądają ostro po powiększeniu, otrzymasz wysokiej jakości wynik.

Duże pliki PDF z wieloma obrazami

Broszury, katalogi i dokumenty projektowe mogą zawierać dziesiątki lub setki obrazów. Proces wyodrębniania obsługuje je wydajnie, ale wynikowy plik ZIP do pobrania może być duży. W przypadku 200-stronicowego katalogu produktów z wysokiej rozdzielczości zdjęciami, oczekuj, że wyodrębnione obrazy będą miały łączny rozmiar kilkuset megabajtów.

Skanowane pliki PDF to szczególny przypadek

Jeśli plik PDF został utworzony przez skanowanie stron papierowych, każda strona jest przechowywana jako jeden duży obraz. Wyodrębnianie obrazów z zeskanowanego pliku PDF daje jeden obraz na stronę – zasadniczo surowy skan całej strony, w tym tekst i marginesy. Jeśli chcesz wyizolować konkretne zdjęcia lub elementy z zeskanowanej strony, będziesz musiał ręcznie przyciąć je z wyodrębnionego obrazu strony.

Wykrywanie zduplikowanych obrazów

Niektóre pliki PDF odwołują się do tego samego obrazu wielokrotnie – na przykład logotypu, który pojawia się na każdej stronie. Proces wyodrębniania identyfikuje te duplikaty i wyodrębnia obraz tylko raz, oszczędzając Ci sortowania przez 50 kopii tego samego logotypu.

Często zadawane pytania

Czy mogę wyodrębnić obrazy z zeskanowanego pliku PDF?

Tak, ale każda zeskanowana strona jest przechowywana jako jeden duży obraz. Otrzymasz jeden obraz na stronę – surowy skan całej strony, w tym tekst i marginesy. Jeśli potrzebujesz wyizolować konkretne zdjęcia lub elementy z zeskanowanej strony, będziesz musiał przyciąć wyodrębniony obraz strony w edytorze obrazów.

Czy wyodrębnianie zmniejszy jakość obrazu?

Nie. Obrazy są wyodrębniane w ich oryginalnej osadzonej rozdzielczości i jakości. Proces wyodrębniania odczytuje bezpośrednio zapisane dane obrazu – nie ma ponownej kompresji ani utraty jakości. To, co otrzymujesz, jest dokładnie tym, co zostało osadzone w pliku PDF.

Czy mogę wyodrębnić obrazy z pliku PDF chronionego hasłem?

Najpierw musisz odblokować plik PDF. Jeśli ma hasło właściciela (ograniczające drukowanie/kopiowanie, ale zezwalające na przeglądanie), PDFSub zazwyczaj może wyodrębnić obrazy po podaniu hasła. Jeśli ma hasło użytkownika (wymagane do otwarcia pliku), musisz wprowadzić to hasło przed rozpoczęciem wyodrębniania.

Czym to się różni od robienia zrzutu ekranu?

Zrzut ekranu przechwytuje to, co jest wyświetlane na ekranie w rozdzielczości ekranu (zazwyczaj 72 lub 144 DPI). Wyodrębnianie obrazu odzyskuje oryginalny osadzony obraz – który często ma rozdzielczość 300 DPI lub wyższą, z wymiarami wielokrotnie większymi niż to, co pojawia się na ekranie. W przypadku zdjęcia wyświetlanego na ekranie o szerokości 3 cali, osadzony obraz może mieć szerokość 3000 pikseli.

Czy wyodrębnianie działa ze wszystkimi typami plików PDF?

Działa z każdym plikiem PDF zawierającym osadzone obrazy rastrowe. Obejmuje to większość dokumentów utworzonych przez edytory tekstu, narzędzia projektowe, oprogramowanie do prezentacji i skanery. Jedynymi plikami PDF bez możliwych do wyodrębnienia obrazów są te składające się wyłącznie z grafik wektorowych i tekstu – zazwyczaj rysunki techniczne lub dokumenty zawierające tylko tekst.

Podsumowanie

Wyodrębnianie obrazów z pliku PDF daje oryginalne osadzone pliki – w ich natywnej rozdzielczości, w oryginalnym formacie, bez utraty jakości. Jest to właściwe podejście, gdy potrzebujesz poszczególnych zdjęć, logotypów lub grafik, a nie zrzutów całych stron.

Czego potrzebujesz	Użyj tego narzędzia
Poszczególne zdjęcia/logotypy z pliku PDF	Wyodrębnianie Obrazów
Cała strona jako pojedynczy obraz	PDF do Obrazu
Cała zawartość tekstowa z pliku PDF	PDF do Tekstu

W większości przypadków – odzyskiwanie zdjęć produktów, ponowne wykorzystanie logotypów, ratowanie obrazów ze starych dokumentów – wyodrębnianie jest najszybszą drogą od „widzę to w PDF” do „mam potrzebny plik”.

Gotowy do wyodrębnienia? Wypróbuj narzędzie Wyodrębnianie Obrazów PDFSub – prześlij swój plik PDF i uzyskaj każdy osadzony obraz w kilka sekund.