Inhaltsverzeichnis im PDF automatisch erstellen - der vollständige Guide

Inhalt

Outline vs. Inhaltsverzeichnis-Seite - der wichtigste Unterschied vorweg
Wo Bookmarks entstehen sollten - und wo sie tatsächlich fehlen
Zwei Wege, wenn manuell keine Option mehr ist
Cloud-Service mit KI-Analyse
Lokale Desktop-App
Was ist mit Adobe Acrobat?
Drei reale Workflows mit TOCmaster
Workflow A: Anwaltskanzlei, gemergte Mandantenakte
Workflow B: Dissertation, LaTeX-Export für die Bibliothek
Workflow C: Behördenakte aus gescannten Dokumenten
Wo automatische Erkennung an ihre Grenzen kommt
Entscheidungslogik in zwei Fragen
Fazit

Drei typische Situationen aus deutschen Büros: Eine Anwältin schickt eine 240-seitige Mandanten-Akte ans Gericht - ohne Bookmarks. Ein Doktorand exportiert seine Dissertation aus LaTeX nach PDF, das interne Inhaltsverzeichnis verlinkt sauber, aber die Reader-Sidebar bleibt leer. Eine Behörde mergt zwölf Word-Dokumente zu einem Verfahrensband - und wundert sich, warum Prüfer:innen über fehlende Sprungmarken meckern.

In allen drei Fällen ist das Problem dasselbe: Der Inhalt stimmt, nur die Navigation fehlt. Und genau die manuelle Bookmark-Erfassung ist der Schritt, den niemand machen will.

Dieser Guide ordnet das Thema technisch ein, zeigt zwei verbreitete Lösungswege und ihren Datenschutz-Footprint, und beantwortet die Frage: Lohnt sich ein lokales Tool, oder reicht der Browser?

Outline vs. Inhaltsverzeichnis-Seite - der wichtigste Unterschied vorweg

Wer „Inhaltsverzeichnis im PDF” sagt, meint meist eines von zwei Dingen - manchmal beides, oft ohne den Unterschied zu kennen:

Outline (Bookmarks): die Navigation in der Sidebar des PDF-Readers. Strukturiert, hierarchisch, klickbar. Technisch ein eigener Objekt-Baum im PDF-Katalog, unabhängig vom sichtbaren Seiteninhalt.
Gedruckte IV-Seite: eine reguläre Seite mit Kapiteltiteln und Seitenzahlen, meist vor dem ersten Kapitel. Visuell sichtbar, druckbar, kann zusätzlich klickbare Links tragen.

LaTeX produziert beim Export beides automatisch - Outline und IV-Seite. Word erzeugt eine IV-Seite, aber die Outline nur, wenn man die Heading-Styles konsequent durchzieht. Scans und gemergte Dokumente haben in der Regel weder das eine noch das andere. Genau hier setzt automatische Bookmark-Erzeugung an.

Wo Bookmarks entstehen sollten - und wo sie tatsächlich fehlen

Bevor wir über Tools reden, lohnt ein Blick auf die typische deutsche Dokumenten-Pipeline:

LaTeX → PDF: \tableofcontents plus hyperref erledigt Outline und IV-Seite in einem Lauf. Hier braucht es kein Zusatz-Tool - solange das Dokument aus einer einzigen Quelle gebaut wird.
Word → PDF: Über „Speichern als PDF” mit aktivierter Option „Lesezeichen erstellen anhand von Überschriften” wird die Outline mit übernommen. Die Praxis-Stolperfalle: Wer Überschriften per Hand fett macht statt die Heading-Styles zu nutzen, bekommt eine leere Sidebar.
PDF aus Scanner: Komplett ohne Text-Layer. Hier hilft nur OCR plus Heuristik - manuelle Erfassung ist bei Akten ab ~50 Seiten ökonomisch unsinnig.
Gemergtes PDF aus mehreren Quellen: Häufig im Rechts-, Behörden- und Verlagsumfeld. Selbst wenn jedes Einzeldokument Bookmarks hatte - beim Zusammenführen mit pdftk, qpdf oder einer GUI gehen sie meistens verloren oder werden inkonsistent verschachtelt.

Die ersten beiden Pipelines lassen sich in der Regel quellseitig fixen. Die letzten beiden sind genau die Fälle, in denen automatische Tools ihren Wert beweisen.

Zwei Wege, wenn manuell keine Option mehr ist

Cloud-Service mit KI-Analyse

Der Ablauf ist immer ähnlich: Datei hochladen, ein Modell analysiert Struktur, ein paar Sekunden später kommt das fertige PDF zurück. Bequem - solange das Dokument nicht vertraulich ist.

Für eine öffentlich zugängliche Bedienungsanleitung ist das unkritisch. Bei einer 180-seitigen Verfahrensakte mit Klarnamen, einer noch nicht eingereichten Dissertation oder einem Mandanten-Schriftsatz wird der Upload zum strukturellen Compliance-Problem: berufsrechtliche Verschwiegenheit (§ 43a BRAO, § 203 StGB), DSGVO-Auftragsverarbeitung, ggf. US-Cloud-Anbieter ohne saubere SCC-Kette. Nicht jeder Anbieter speichert Dokumente dauerhaft, aber Übermittlung allein reicht juristisch oft schon für ein Problem.

Subscription-Preise liegen typischerweise zwischen 19 und 49 USD pro Monat, Free-Tiers begrenzen Datei-Anzahl oder Dateigröße.

Lokale Desktop-App

Dieselbe Heuristik (Schriftgrößen, Position, Konsistenz, OCR für Scans) - nur auf deinem Rechner. Kein Upload, kein Cloud-Trail, kein Auftragsverarbeitungsvertrag nötig.

TOCmaster ist genau dafür gebaut: macOS- und Windows-App, die das PDF lokal analysiert, einen Bookmark-Vorschlag erzeugt und dir vor dem Speichern einen Editor zur Korrektur gibt. Preis-Modell: 29 € einmalig statt monatlich. Bei drei Dokumenten im Monat hat sich das gegenüber einer Cloud-Subscription nach dem ersten Quartal amortisiert.

Was ist mit Adobe Acrobat?

Acrobat Pro (DC) kann beides - manuell ist nach wie vor das Bookmark-Panel der Standard, automatisierte Erkennung ist über die „Strukturierte Lesezeichen”-Funktion möglich, aber mit Heading-Styles aus dem Quelldokument verknüpft. Bei reinen Scan-PDFs oder gemergten Dokumenten ohne Tags läuft sie ins Leere. Plus: ~23 € pro Monat im Abo.

Drei reale Workflows mit TOCmaster

Statt einer generischen Schritt-Liste - hier konkret, wie sich die drei Eingangs-Szenarien lösen lassen.

Workflow A: Anwaltskanzlei, gemergte Mandantenakte

Ausgangslage: Zwölf Einzel-PDFs (Schriftsätze, Anlagen, Gutachten), per pdftk cat zusammengeführt, 240 Seiten, keine Bookmarks. Briefing ans Gericht in zwei Tagen.

In TOCmaster: Datei reinziehen, der Wizard erkennt das ungetaggte PDF und startet die Layout-Heuristik. Nach ~10 Sekunden steht ein Vorschlag mit zwei Hierarchie-Ebenen (Schriftsatz-Titel, Anlagen-Nummerierung). Im Editor: drei Bezeichnungen umformulieren, eine Anlage manuell nachtragen, Reihenfolge per Drag & Drop bestätigen. Speichern als neue Datei - Original bleibt unverändert für die Beweiskette.

Workflow B: Dissertation, LaTeX-Export für die Bibliothek

Ausgangslage: Das aus LaTeX exportierte PDF hat zwar hyperref-Bookmarks, aber die Bibliothek will zusätzlich eine sichtbare IV-Seite mit klickbaren Sprungmarken - die hatte das LaTeX-Template so nicht vorgesehen.

Hier braucht es keine Heuristik, weil die Outline schon korrekt ist. TOCmaster liest sie aus, generiert daraus die gedruckte IV-Seite und fügt sie an der gewählten Position ein. Outline bleibt unverändert, die zusätzliche Seite ist verlinkt.

Workflow C: Behördenakte aus gescannten Dokumenten

Ausgangslage: 180 Seiten Scan, kein Text-Layer, gemischte Schriftarten je nach Ursprungsbehörde.

OCR läuft lokal über Tesseract, danach die übliche Heuristik. Ergebnis ist hier erwartbar nur ~80–85 % treffsicher - Stempel werden manchmal als Überschrift markiert, Aktendeckel-Kopfzeilen ebenfalls. Der Editor ist deshalb der eigentliche Wert: 5–10 Minuten Aufräumen, fertig. Bei vergleichbaren Akten lohnt sich danach ein gespeichertes Heuristik-Profil.

Gemeinsamer Nenner aller drei Workflows: die PDFs verlassen das Gerät zu keinem Zeitpunkt.

Wo automatische Erkennung an ihre Grenzen kommt

Damit hier keine falschen Erwartungen entstehen - drei Fälle, in denen jedes Tool, ob lokal oder Cloud, manuelle Nacharbeit verlangt:

Stempel und Faxköpfe in Behördenakten werden bei OCR oft als Überschrift gewertet, weil Schriftgröße und Position dafür sprechen. Lösung: einmal im Editor löschen, beim nächsten Aktentyp Heuristik-Profil anpassen.
Mathematik- und Formelsatz (TeX-Output, Gutachten mit Gleichungen): einzelne Display-Formeln liegen optisch oberhalb von Fließtext und werden gelegentlich als Section-Heading fehlinterpretiert. Im Zweifel die Heuristik auf Bold-Glyphen statt Größenwechsel umstellen.
Mehrsprachige Dokumente sind unproblematisch, solange das Layout konsistent bleibt - die Erkennung hängt am visuellen Muster, nicht am Sprachmodell.
Gemergte PDFs mit unterschiedlichen Schriftgrößen pro Modul: hier hilft nur Hierarchie-Normalisierung. Lokale Tools können das pro Modul tun, Cloud-Tools behandeln das Dokument meist als ein Stück.

Entscheidungslogik in zwei Fragen

Statt einer Tabelle: zwei Fragen, die in der Praxis meistens reichen.

Frage 1 - Darf das PDF einen fremden Server sehen? Bei berufsrechtlich geschützten Inhalten, internen Behördendokumenten, unveröffentlichter Forschung oder anwaltlicher Korrespondenz lautet die ehrliche Antwort fast immer Nein. Damit ist Cloud raus, unabhängig vom Komfort.

Frage 2 - Wie oft kommt das vor? Einmaliger Job mit unkritischem Inhalt: ein Free-Tier-Cloud-Service tut es. Mehrere Dokumente pro Monat, Mergen, Scans, Reproduzierbarkeit: lokales Tool ist nach kurzer Zeit günstiger und schneller, weil Upload-Wartezeit und Datei-Limits wegfallen.

In den meisten Praxis-Szenarien beantwortet schon Frage 1 die Wahl. Frage 2 ist eher Tiebreaker für die unkritischen Fälle.

Fazit

Bookmarks sind keine Nice-to-have-Kosmetik, sondern der Unterschied zwischen einem PDF, das jemand öffnet, und einem PDF, das jemand wirklich nutzt. Manuell sind sie ab ~30 Seiten Verschwendung - die Frage ist nicht, ob automatisiert werden soll, sondern wo.

Cloud-Lösungen sind komfortabel, aber für vertrauliche Dokumente strukturell ungeeignet. Lokale Software wie TOCmaster löst denselben Job ohne Compliance-Reibung und mit einer Einmal-Investition statt Subscription. Für Anwält:innen, Forschung, Behörden, Verlagsproduktion und alle, die regelmäßig mit gemergten oder gescannten PDFs arbeiten, ist das die robustere Wahl.

Mehr zu TOCmaster → · Vergleich mit Cloud-Tools →