Anleitung zur Übertragung eines TeX-Quellcodes zur Verwendung in einer herkömmlichen Textverarbeitung – und umgekehrt

v.1.18 vom 23.05.2026


Vorwort

Gelegentlich müssen Textdokumente konvertiert werden. Zum Beispiel könnte ein vorkommen, dass man ein TeX-Dokument weitergeben möchte an jemanden, der sich mit TeX nicht auskennt. Man konvertiert das Dokument dann zu einem Format wie .docx (MS Word) oder .odt (LibreOffice Writer).

Im einfachsten Fall benutzt man ein Plugin oder Programm für diese Aufgabe:

  • Der Parser Pandoc konvertiert die gängigsten (Text-)Formate, beispielsweise TeX-Quellcode zu Markdown oder HTML oder OpenDocument-Text; oder umgekehrt: ein Markdown- oder Word-Dokument zu TeX.
  • Der TeX-Editor TeXMaker bietet im Menü eine Funktion "Via TeX4ht exportieren".
  • Abiword bietet Export-Filter zu LaTeX.
  • Auch für LibreOffice gibt es Plugins, um nach TeX zu exportieren.

All das ist "ganz nett", denn es ist meiner Erfahrung nach "quick and dirty". In jedem Fall muss man sich das erzeugte Dokument noch einmal vornehmen und zahlreiche Nacharbeiten durchführen. Nicht selten werden automatisch Lesezeichen erzeugt, oder die Formatierung wird zu stark verschachtelt. Aus diesem Grund habe ich mir angewöhnt, die Konvertierung nach einer bestimmten Maßnahmenliste von Hand durchzuführen.

Textverarbeitung zu TeX

Vorbereitung

Im Quelltext (z.B. Word-Datei oder odt-Datei) ist der automatische Zeilenumbruch (Worttrennung) zu deaktivieren. Wenn notfalls der Text aus einem PDF kopiert wird, ist zu beachten, dass ggf. auch enthaltene Bindestriche am Zeilenende sowie die Seitennummern und (mehrfach) Kopfzeilen übertragen werden!

Erst jetzt wird der in ein leeres .tex-Dokument kopierte Text strukturiert und formatiert:

Dokumentstruktur

  • Einfügen der Dokument-Präambel sowie der notwendigen Umgebung \begin{document} und \end{document}.
  • Strukturierung des Dokuments, d.h. Festlegung der Gliederungseinheiten (z.B. section, subsection usw.). Hierbei ist darauf zu achten, daß die evtl. vorhandene ursprüngliche Gliederungsnummerierung entfernt werden muß. Aus "2.3 Methodik" wird "\subsection{Methodik}".
  • Kennzeichnung der Absätze: Nun werden die einzelnen Absätze deklariert. In einer Textverarbeitung wie Word oder Writer sind neue Absätze mit einem einfachen "Enter" erreicht. Beim Kopieren in den Quellcode liegen zwei nachfolgende Absatz-Blöcke demzufolge in nachstehenden Zeilennummern. In TeX werden einzelne Absätze allerdings durch mindestens eine leere Zeile gekennzeichnet. Also müssen die einzelnen Absätze im Quellcode von Hand mit einer zusätzlichen Leerzeile voneinander separiert werden.
  • Eventuell im Originaltext vorhandene Listen-Umgebungen oder Aufzählungen in der TeX-Syntax neu setzen. Beim Kopieren entsteht evtl. lediglich eine mit Original-Nummerierung versehene Auflistung, die gelöscht und z.B. durch eine enumate- oder itemize-Umgebung ersetzt werden muß.
  • Setzen fester Abstandsmarker, d.h. geschützter Leerzeichen und halber Leerzeichen (beide werden am Zeilenende nicht getrennt umgebrochen). Diese Aufgabe kann zügig mit Suchen & Ersetzen angegangen werden. Was geschützte und halbe Leerzeichen sind, und wo man sie anwendet, steht hier.
  • Abgesetzte Formeln ggf. neu in eine Formel-Umgebung einschließen, z.B. in die equation-Umgebung.

Formatierungen

  • Ersetzung von Auszeichnungen (die als unformatierter Text natürlich nicht mit in den TeX-Quellcode übertragen worden sind!), d.h. Kursivierungen, Fettschrift und anderes. Hierfür muß der ursprüngliche Text (am besten im Textverarbeitungsprogramm) nach bestimmten Formatierungen abgesucht werden. Das betreffende Wort (oder die Passage) wird dann mit der Suchmaske im Quellcode angesteuert und dort der TeX-Befehl für z.B. eine Kursivierung gesetzt. Dieser Arbeitsschritt kann bei umfangreichen Texten durchaus der intensivste von allen sein.
  • Ersetzen von Anführungszeichen. Syntax-Varianten und Wissenswertes stehen hier.
  • Ersetzung von Hoch- und Tiefstellungen: Üblicherweise werden hoch- und tiefgestellte Ziffern/Buchstaben in der TeX-Syntax gesondert deklariert, nämlich mit \textsuperscript (für Hochstellungen) und für Tiefstellungen: \textsubscript. Wenn es sich aber um chemische Formeln handelt, sollten spezielle Pakete dafür genutzt werden, siehe hier.
  • Alle Dezimaltrenner (Kommata) in Formel-Umgebungen müssen in eine geschweifte Klammer eingefaßt werden, weil sie sonst (wie ein Komma im Text) falsch spationiert werden. Wieso, warum, weshalb, siehe hier.
  • Tabelleninhalte müssen von Hand in die TeX-Tabellenstruktur überführt werden. Eine Anleitung siehe hier. Man kann die Tabelle auch nach Excel, LO Calc oder Gnumeric übertragen und von dort nach TeX exportieren und dann in den Quellcode kopieren.

Verlinkungen, Verweise

  • Entfernung evtl. vorhandener automatischer Listen, z.B. eines mit dem Textblock in den Quellcode hineinkopierten Inhaltsverzeichnisses. Der Block wird ersetzt mit \tableofcontents. Gleiches gilt für ein evtl. vorhandenes Abbildungs- und Tabellen-Verzeichnis.
  • Fußnoten: Die als Fußnote gedachten Textpassagen müssen in eine \footnote-Klammer eingeschlossen werden. Dabei sagt die Erfahrung, daß die ursprünglichen Fußnoten aus dem Original-Dokument beim Kopieren nicht erfaßt und in den TeX-Quellcode übertragen werden! Stattdessen wird nur die eventuelle Fußnoten-Zahl selbst übertragen und steht dann lose mitten im Quellcode. Der Fußnoten-Inhalt muß also von Hand aus dem Original-Dokument herauskopiert und übertragen werden.
  • Für jedes Bild bzw. Tabelle ggf. eine Gleitumgebung erstellen, und für diese einen eindeutigen Schlüssel festlegen.
  • Ersetzen von Literaturzitaten, ggf. eine separate Literaturdatenbank anlegen.

TeX-eigen

  • Ersetzen von Sonderzeichen
    • Geschützte Steuerzeichen (%, #, $, eckige Klammern u.a.) müssen maskiert werden, d.h. es wird ihnen üblicherweise ein Escape-Zeichen vorangestellt (\%, \#, \$ usw.)
    • Je nachdem, ob die Zeichencodierung auf Unicode eingestellt ist, müssen bestimmte ASCII-fremde Zeichen ersetzt werden. Falls etwas nicht funktioniert, wird das spätestens beim Kompilieren als Warnung oder Fehler kommentiert.
  • In deutschen Texten muß an Wortfugen ggf. die automatisch gesetzte Ligatur wieder aufgelöst werden.

TeX-Quellcode zu einem herkömmlichen Textdokument

Der Quellcode wird in ein neues Textdokument kopiert. Im Prinzip müssen nur die Präambel und die TeX-eigene Syntax entfernt und durch eine neue Formatierung/Strukturierung ersetzt werden.

  • Die meisten TeX-Kommandos beginnen mit dem Escape-Zeichen ( \ ). Darum ist es einfach, alle entsprechenden Dokumentstellen darüber zu finden.
  • Suche nach dem Dollar-Zeichen ( $ ), denn damit werden Formel-Umgebungen eingeleitet.
  • Suche nach der Tilde ( ~ ), die beispielsweise geschützte Leerzeichen maskiert.
  • Suche nach Anführungszeichen plus Bindestrich ( "- ), denn damit werden optionale Trennstellen im Wort markiert.
  • Suche nach doppelten Leerzeichen, denn die werden beim Kompilieren des Quellcodes ignoriert und fallen so im fertigen Dokument nicht auf.
  • Suche nach dem Prozent-Zeichen ( % ), denn damit werden im TeX-Quellcode Kommentare eingeleitet. Jetzt muss man entscheiden, ob man die (unsichtbaren) Kommentare beibehalten möchte oder z.B. in eine Kommenarbox an den Seitenrand verlegt.
  • Suche nach vereinzelten ASCII-Anführungszeichen ( " ).
  • Suche nach mehrfachen Bindestrichen ( -- oder ---) und Ersetzung durch den Gedankenstrich (–) oder Geviertstrich (—).

Je nach Quellcode-Vorlieben ist der Ursprungstext (TeX-Quellcode) am Zeilenende umgebrochen, d.h. alle 80 Zeichen beginnt eine neue Zeile. Das ist für den TeX-Quellcode irrelevant und sorgt für Übersicht. Wird der Quellcode aber SO in ein Textdokument kopiert, muss man auch noch all diese Umbrüche löschen. Das kann man vorher oder nachher am besten über die Suchen & Ersetzen-Funktion erledigen. Das Einblenden von Steuer- oder Absatzzeichen kann hilfreich sein.