📎

Jak połączyć wiele plików PDF w jeden

Przewodnik krok po kroku po scalaniu PDF-ów - co faktycznie dzieje się technicznie, jak kontrolować kolejność stron i jak uniknąć typowych pułapek.

· 6min czytania

Scalanie PDF-ów to jedno z tych małych, ale dziwnie częstych zadań. Musisz połączyć podpisany kontrakt z załącznikami, zszyć zeskanowane strony, które zostały rozbite na osobne pliki, albo złożyć dokument referencyjny z kilku raportów. Zadanie brzmi banalnie - “sklej je razem” - i takie jest, ale jest kilka rzeczy, o których warto wiedzieć, żeby za każdym razem zrobić to dobrze.

Podstawowa idea

Plik PDF to kontener obiektów: stron, fontów, osadzonych obrazów, metadanych. Scalenie dwóch PDF-ów oznacza wzięcie stron z pliku A, stron z pliku B i stworzenie nowego PDF zawierającego oba zestawy stron w sekwencji.

To nie to samo co:

  • Konkatenacja surowych bajtów pliku - tworzy nieprawidłowy plik
  • Wydrukowanie obu do jednego PDF - to ponownie rasteryzuje tekst do obrazów, rozdyma rozmiar i niszczy przeszukiwalność
  • Robienie zrzutów ekranu - ten sam problem, tylko gorzej

Prawidłowe scalenie zachowuje tekst jako tekst, fonty jako fonty, osadzone obrazy jako osadzone obrazy. Wynik jest czysty, przeszukiwalny i mniej więcej tego samego rozmiaru co suma wejść.

Krok po kroku: standardowy workflow

W większości sytuacji:

  1. Zbierz pliki w jednym folderze
  2. Zdecyduj o kolejności - który idzie pierwszy, który ostatni
  3. Sprawdź ochronę hasłem na dowolnym z plików - musisz usunąć hasło przed scaleniem
  4. Otwórz narzędzie do scalania PDF
  5. Dodaj pliki w wybranej kolejności
  6. Pobierz scalony wynik
  7. Zweryfikuj, że wynik zawiera wszystkie oczekiwane strony w odpowiedniej kolejności

Do kroku 4 masz trzy kategorie narzędzi:

  • Oprogramowanie desktopowe (Acrobat, PDFsam lub open-source). Potężne, ale wymaga instalacji i licencji.
  • Usługi online. Szybkie, ale twoje dokumenty lądują na cudzym serwerze. Warto się zastanowić, czy to akceptowalne dla danej zawartości.
  • Narzędzia przeglądarkowe działające lokalnie. Bez instalacji, bez uploadu, bez serwera. To właśnie robi nasze narzędzie PDF Merge.

Opcja przeglądarkowa to właściwy punkt startowy dla większości ludzi - chyba że operujesz na skalę przemysłową.

Jak używać naszego narzędzia przeglądarkowego

  1. Otwórz stronę. Ładuje się w niecałą sekundę.
  2. Przeciągnij PDF-y na stronę lub kliknij Przeglądaj. Dodaj tyle plików, ile potrzebujesz.
  3. Zmień kolejność usuwając pliki i dodając je z powrotem w żądanej kolejności.
  4. Kliknij Scal PDF-y.
  5. Kliknij Pobierz.

Wszystko dzieje się w twojej przeglądarce przez WebAssembly. Pliki nigdy nie opuszczają urządzenia. Żadnego uploadu, żadnego tymczasowego przechowywania na cudzym serwerze, żadnego konta.

Ustawienie odpowiedniej kolejności stron

Kolejność stron scalonego PDF odpowiada kolejności plików na liście. Jeśli dodasz:

  1. contract.pdf (2 strony)
  2. appendix-a.pdf (5 stron)
  3. signatures.pdf (1 strona)

…wynik ma 8 stron dokładnie w tej kolejności.

Pułapki:

  • Wielkość liter: Appendix.pdf i appendix.pdf mogą sortować się inaczej niż oczekujesz.
  • Prefiksy numeryczne: jeśli nazwiesz pliki 1-intro.pdf, 2-body.pdf, 10-conclusion.pdf, posortują się alfabetycznie jako 1, 10, 2 - a nie 1, 2, 10. Używaj wiodących zer: 01, 02, 10.
  • Mieszane orientacje: jedno źródło pionowe, drugie poziome - scalenie respektuje oryginalną orientację każdej strony. To zachowanie poprawne.

PDF-y chronione hasłem

Jeśli któryś plik ma ochronę hasłem otwarcia, scalanie się nie powiedzie - narzędzie nie może odczytać stron bez odszyfrowania. Musisz albo usunąć hasło wcześniej (będziesz potrzebował hasła), albo poprosić o odblokowaną kopię od osoby, która ci plik wysłała.

Ochrona hasłem właściciela (ograniczająca edycję/kopiowanie, ale pozwalająca na wyświetlanie) jest zwykle OK dla scalania, zależnie od konkretnych ustawionych ograniczeń.

Co dzieje się z zakładkami, adnotacjami i polami formularzy

Różne narzędzia obsługują to różnie. Nasz scalacz przeglądarkowy skupia się na stronach i podstawowej zawartości:

  • Strony - zachowane
  • Tekst, obrazy, fonty - zachowane
  • Wymiary i orientacja strony - zachowane dla każdej strony
  • Zakładki - zwykle tracone
  • Adnotacje (komentarze, zakreślenia) - zwykle tracone
  • Pola formularzy - zwykle tracone lub spłaszczane
  • Podpisy cyfrowe - unieważnione (scalanie zmienia plik, co łamie podpis)
  • Szyfrowanie - niezachowane (wyjście jest nieszyfrowane)

Jeśli musisz zachować zakładki, adnotacje lub podpisy cyfrowe, użyj pełnofunkcyjnego edytora PDF na desktop.

Kwestie rozmiaru pliku

Naiwny scalacz konkatenujący strony bez deduplikacji zasobów może wyprodukować plik większy niż suma wejść - jeśli ten sam font jest osadzony w każdym źródle, pojawi się wielokrotnie w wyjściu. Dobre biblioteki PDF deduplikują współdzielone zasoby. Typowy wynik to scalony plik mniej więcej równy sumie wejść, może 10% mniejszy przy znacznym nakładaniu się fontów.

Jeśli twój scalony PDF wychodzi znacznie większy niż oczekiwałeś (powiedzmy - podwójny rozmiar sumy wejść), coś ponownie rasteryzuje strony. Zwykle dlatego, że narzędzie “drukuje do PDF” zamiast prawidłowo scalać. Zmień narzędzie.

Weryfikacja wyniku

Po scaleniu sprawdź:

  1. Łączną liczbę stron - powinna równać się sumie stron wejściowych
  2. Pierwszą i ostatnią stronę każdej sekcji - czy to właściwa zawartość?
  3. Czy tekst jest zaznaczalny - jeśli nie możesz zaznaczyć tekstu, który był zaznaczalny w źródle, wyjście zostało zrasteryzowane. To problem.
  4. Plik otwiera się w co najmniej dwóch przeglądarkach PDF - Adobe Acrobat, wbudowana przeglądarka Chrome, macOS Preview. Jeśli otwiera się wszędzie, jest prawidłowym PDF-em.

Typowe błędy

Wysyłanie poufnych PDF-ów do losowych narzędzi online. To zdecydowanie największe ryzyko. Zaskakująca liczba darmowych narzędzi online do PDF-ów istnieje, bo zatrzymuje i analizuje dokumenty. Kontrakty, dokumenty prawne, dokumentacja medyczna, zeznania podatkowe - nie wgrywaj tego nigdzie, chyba że dokładnie wiesz, kto stoi za usługą. Gdy masz wątpliwości, narzędzie lokalne w przeglądarce.

“Drukowanie” do PDF w celu scalenia. Niszczy warstwę tekstową (wszystko staje się obrazem), rozdyma rozmiar 5-10×, łamie przeszukiwalność. To ostateczność, nie workflow.

Scalenie i zapomnienie o weryfikacji. Nieudane scalenie czasem produkuje plik, który wygląda dobrze, ale brakuje w nim stron albo są w złej kolejności. Zawsze sprawdź łączną liczbę stron.

Zapomnienie o haśle. Jeśli chcesz wysłać scalony PDF chroniony hasłem, musisz dodać ochronę po scaleniu, osobnym narzędziem. Scalacz nie zachowa szyfrowania ze źródła.

Jeśli masz teraz zestaw PDF-ów do połączenia, przeciągnij je do naszego scalacza. Działa w całości w przeglądarce, radzi sobie z plikami dowolnego rozsądnego rozmiaru i nie wysyła niczego na żaden serwer. Większość scaleń kończy się w mniej niż sekundę po załadowaniu plików.

Jedna rzecz do zapamiętania: dla czegokolwiek poufnego - scalaj lokalnie.