Schritt-für-Schritt: PDF-Bookmarks mit TOCmaster setzen
Vom Drag & Drop bis zur fertigen Master-PDF — dieses Tutorial zeigt den vollständigen Workflow in TOCmaster anhand eines konkreten Beispiels. Inkl. Wizard, TOC-Editor und CLI-Variante.

Inhalt
Dieses Tutorial zeigt den kompletten Workflow von TOCmaster anhand eines konkreten Beispiels: 23 PDFs einer Projektdokumentation werden zu einem strukturierten Master-Dokument mit klickbarem Inhaltsverzeichnis zusammengeführt. Wir gehen jeden Schritt durch — Drag & Drop, Wizard, TOC-Editor, Speichern. Am Ende der gleiche Job per CLI als One-Liner.
Voraussetzungen
- TOCmaster auf Mac oder Windows installiert (Mac 10.15+, Win 10+).
- Eine Sammlung an PDFs in einem Ordner.
- 5–10 Minuten Zeit.
Schritt 1: PDFs einlesen
Öffne TOCmaster. Im Hauptfenster siehst du eine große Drop-Zone. Es gibt drei Wege, PDFs einzulesen:
- Drag & Drop ganzer Ordner in die App-Fenster.
- „Dateien hinzufügen”-Button mit Mehrfachauswahl im Datei-Dialog.
- Drag aus Finder/Explorer auf das Dock-Icon (macOS) oder Programm-Icon (Windows).
Sobald die Dateien drin sind, erscheinen sie in einer sortierbaren Liste. Per Drag im Listenelement änderst du die Reihenfolge.
Smart-Sort: TOCmaster erkennt automatisch Nummern und Datumsformate in Dateinamen. „chapter-1.pdf, chapter-2.pdf, …, chapter-12.pdf” wird korrekt nach Nummer sortiert (nicht alphabetisch — wo „10” vor „2” käme).
Schritt 2: Optionen im Wizard
Klick auf „Weiter” öffnet den Wizard mit den wichtigsten Einstellungen:
- Erkennungs-Modus: „Heuristik” (Standard, schnell) oder „Heuristik + OCR” (für eingescannte PDFs).
- Sprache: relevant für OCR und Schrift-Erkennung. Standard ist deine UI-Sprache.
- Duplikatsuche: an/aus. Empfohlen bei mehreren Versionen ähnlicher Dokumente.
- Gedruckte IV-Seite: zusätzliche Seite mit Inhaltsverzeichnis am Anfang? Praktisch für Print-Outs.
- Output-Datei: Pfad und Name für das Master-PDF.
Für unser Beispiel (Projektdokumentation, kein Scan): Heuristik, Deutsch, Duplikatsuche an, gedruckte IV-Seite an.
Schritt 3: Generierung
„Bookmarks generieren” startet den Prozess. Im Hintergrund passiert:
- Jedes PDF wird geöffnet, der Text-Layer extrahiert.
- Heuristik analysiert Schriftgröße, -gewicht und Position pro Seite.
- Cluster werden zu Heading-Levels zugeordnet (H1, H2, H3).
- Bei aktiviertem OCR werden Bild-PDFs vorab durch Tesseract geschickt.
- Duplikate werden über Inhalts-Fingerprint erkannt.
- PDFs werden in der gewählten Reihenfolge zusammengeführt.
- Bookmark-Hierarchie wird ins Master-PDF geschrieben.
Eine Status-Leiste zeigt den Fortschritt. Bei 23 Standard-PDFs (ca. 800 Seiten gesamt) dauert das ca. 30–60 Sekunden auf einem M-Chip.
Schritt 4: TOC-Editor
Nach der Generierung öffnet sich der TOC-Editor. Linke Seite: Bookmark-Baum. Rechte Seite: Vorschau der zugehörigen PDF-Seite.
Was du hier tun kannst:
- Hierarchie ändern: Bookmark per Drag unter ein anderes ziehen, um es zu verschachteln.
- Umbenennen: Doppelklick auf einen Eintrag, neuen Titel eingeben.
- Level verschieben: Tab/Shift+Tab promoting/demoting.
- Löschen: Cmd/Strg+Backspace entfernt ein Bookmark.
- Hinzufügen: rechts in der Vorschau eine Stelle markieren, „Bookmark hier” wählen.
Bei sauberen Eingangs-PDFs ist meist nichts zu tun. Bei eingescannten oder unstrukturierten PDFs lohnt sich ein kurzer Durchgang.
Schritt 5: Speichern
„Speichern” schreibt das Master-PDF an den im Wizard gewählten Pfad. Die Originaldateien bleiben unangetastet — TOCmaster hat während des gesamten Vorgangs auf einer geschützten Arbeitskopie gearbeitet.
Das Resultat:
- Ein PDF, das alle 23 Eingabe-PDFs enthält.
- Klickbare Bookmarks in der Seitenleiste, hierarchisch.
- Optional: Inhaltsverzeichnis-Seite am Anfang mit Seitenzahlen.
- Duplikate entfernt (in unserem Beispiel waren 4 Seiten doppelt).
Variante: CLI-Workflow
Für Power-User und Automatisierung gibt es den gleichen Workflow als CLI:
# Verzeichnis mit PDFs zu Master zusammenführen
tocmaster merge ~/projekt/docs/*.pdf \
--output ~/projekt/master.pdf \
--toc \
--dedupe \
--print-toc-page \
--lang deDas ist ideal für:
- CI/CD-Pipelines: bei jedem Doku-Commit ein neues Master-PDF generieren.
- Cron-Jobs: nächtliche Archiv-Zusammenführung.
- Skripte: Watch-Folder, der neue PDFs automatisch in ein Master einfügt.
Die CLI hat alle Optionen des Wizards plus zusätzliche für Output-Format, Verbose-Logging und Bookmark-Export als JSON. tocmaster --help listet alle Subcommands.
Häufige Workflows
Wöchentliches Update einer Akte. Statt jede Woche manuell neu zu mergen: Watch-Folder einrichten, der bei neuen PDFs automatisch ein neues Master generiert. Die alte Version bleibt erhalten (versionierter Output-Pfad).
Mehrsprachige Dokumentation. Bei einer DE/EN-Doku: zwei separate Master-PDFs erzeugen, jeweils mit der passenden OCR-Sprache. Per CLI in einer Schleife in unter einer Minute.
Sehr große Eingangs-Dokumente. Bei einer 4-GB-Forschungsdoku ist die GUI weniger praktisch als die CLI — RAM-Auslastung im Auge behalten, ggf. in Batches verarbeiten. TOCmaster hat einen Streaming-Modus für solche Fälle.
Fehlerbehebung
Bookmark-Hierarchie ist flach. Heuristik konnte keine klaren Heading-Levels erkennen. Im TOC-Editor manuell verschachteln, oder Quelldokumente mit konsistenten Heading-Stilen versehen.
Duplikate wurden nicht erkannt. Die Erkennung ist auf identischen Inhalt geeicht. Bei minimal abweichenden Versionen (anderes Datum im Footer) entscheidest du im Editor manuell.
OCR sehr langsam. Bei sehr großen Korpora dauert OCR Minuten. Das ist normal — Tesseract läuft auf der CPU. Bei wiederkehrenden Tasks: einmal OCR durchführen, das resultierende PDF abspeichern (mit Text-Layer), spätere Bookmark-Generierungen sind dann schnell.
Fazit
Der typische Workflow ist: Drag & Drop, Wizard durchklicken, generieren, ggf. im Editor nachjustieren, speichern. Bei einer Standard-Aufgabe (10 PDFs zu einem Master mit Bookmarks) dauert das ca. 2 Minuten. Per CLI ist es ein Einzeiler. Beides läuft komplett lokal auf Mac und Windows.