Verglichen werden sollen die Ergebnisse eines TeX-Systems mit denen einer herkömmlichen Textverarbeitung. Im folgenden wird von TeX gesprochen, wenn LaTeX, XeTeX, LuaTeX und andere Varianten gemeint sind (im weiteren Sinne auch groff). Ein TeX-System besteht üblicherweise aus einer TeX-Distribution (Pakete-Sammlung, z.B. TeXLive) und einem beliebigen Text-Editor (WYSIWYM-Editor), idealerweise einem speziellen TeX-Editor (Anzeige der Dokumentstruktur, Syntax-Hervorhebung, Hilfe bei Verweisen etc.). Wo der Unterschied von Bedeutung ist, wird darauf hingewiesen.
Mit dem Ausdruck "herkömmliche Textverarbeitung" ist Software gemeint, die allgemein Bestandteil jeder Büro-Software-Suite ist: LibreOffice Writer, Microsoft Word, Calligra Words, Abiword, Lotus Words, Pages, Corel WordPerfect etc. Es handelt sich hierbei durchweg um WYSIWYG-Editoren. Wo der Unterschied von Bedeutung ist, wird darauf hingewiesen.
Es werden in diesen Vergleich keine DTP-Programme wie Adobe InDesign, Quark Xpress oder Scribus hinzugezogen. Dem Autor ist bekannt, daß mit diesen Programmen komplexer Textsatz (insbesondere mit hohem Bilder-Anteil, Zeitschriften) umgesetzt werden kann, zu dem herkömmliche Textverarbeitungen und auch TeX teilweise nur bedingt fähig sind. Ebenso unbeachtet bleiben in diesem Vergleich zahlreiche Programme für Spezialanwendungen, beispielsweise Editoren für Drehbuchautoren.
Mit diesem Vergleich wird beabsichtigt, die verbreitete Voreingenommenheit gegenüber der WYSIWYM-Arbeitsweise zu lösen, auch wenn die Erstellung kurzer Briefe bis hin zu umfangreichen Dokumenten mit einem GUI-Textverarbeitungsprogramm einfacher und schneller erscheint. Der häufigste Grund für die Ablehnung von WYSIWYM ist die Arbeit mit Quellcode, jenem mystischen Äther, der nur aus kryptischen Befehlen zu bestehen scheint. Es soll gezeigt werden, daß nicht nur die Arbeit mit dem Quellcode mehr Kontrolle bietet, sondern daß gerade bei umfangreich strukturierten Dokumenten (wissenschaftliche Abschlußarbeiten etc.) und bei Aspekten der Qualitätskontrolle Vorzüge bestehen, die ein gewöhnliches Textverarbeitungsprogramm nicht bieten kann.
Eine Textverarbeitung wie MS Word oder LO Writer ist ein sog. WYSIWYG-Editor. Das steht für what you see is what you get und heißt: Was ich über die Tastatur eingebe, erscheint am Bildschirm mit derjenigen Formatierung, wie sie später gedruckt oder veröffentlicht werden soll. Auf dem Weg zum Drucker oder zum PDF kann allerdings eine Abwandlung der gedachten Formatierung (Layout) nicht ausgeschlossen werden.
WYSIWYG-Editoren bieten normalerweise eine üppig ausgebaute GUI (Programmoberfläche) mit allen erforderlichen Buttons für die Strukturierung oder Formatierung des Textdokuments, darunter Schalter für die Farbwahl, Schriftgröße, Zeilenabstand und Zeichenformatierung (Kursivierung, Fette, Unterstreichung etc.). Diese scheinbare Bequemlichkeit ist eine der Ursachen, weshalb Nutzer unbewußt zu einer schlechten Typographie kommen: Ihnen wird professioneller Textsatz über Buttons zugetraut, ohne zu wissen, was dahintersteht oder wann eine solche Formatierung wirklich angewendet werden sollte. Nutzer stellen oft Seitenformate nach Augenmaß ein, oder strukturieren ihren Text, indem sie Kapitelnummern von Hand vergeben.
Selbstverständlich entscheidet letztlich das Auge darüber, ob ein Text gut gesetzt ist. Doch es gibt gewisse Regeln, die eingehalten werden sollten, um den Vorgaben guter Lesbarkeit zu entsprechen:
Der große Nachteil der WYSIWYG-Arbeitsweise ist, daß der Nutzer
permanent, d.h. noch während des Schaffensprozesses, in Layout
und Formatierung seines Textes eingreift, anstatt sich, wie es
sein sollte, auf den bloßen Inhalt zu konzentrieren.
Dieser Arbeitsweise stehen WYSIWYM-Editoren gegenüber. WYSIWYM steht für what you see is what you mean und bedeutet schlichtweg: Ich habe die volle Kontrolle über meinen Text und nur was ich an Formatierungsregeln vorgebe, das wird auch angewendet und umgesetzt. Ein im WYSIWYM-Editor geschriebener Text ("Quellcode") wird dann an den TeX-Compiler zum Setzen übergeben, der daraus das Endergebnis (meist PDF) erzeugt.
In einem WYSIWYM-Editor (= Texteditor beliebiger Wahl) findet man nur im Ausnahmefall Buttons für die Textformatierung. Schriftgröße und -art werden üblicherweise in den Optionen des Editors eingestellt. Der gesamte eingegebene Text erscheint in einer gleichen Schriftgröße und -art (meist eine nüchterne Monospace-Schrift), lediglich durch Syntax-Hervorhebungen unterlegt. Richtigerweise muß man ergänzen, daß es auch TeX-Editoren wie LyX gibt, bei denen zwar Quellcode bearbeitet, aber ein teilformatiertes Ergebnis angezeigt wird. Diese Arbeitsweise kommt TeX-Einsteigern entgegen.
Da es im Quellcode sonst keine besondere Hervorhebung für die Dokumentstruktur oder Textformatierungen gibt, kann sich der Autor ganz auf den Inhalt des Dokuments konzentrieren. Er überläßt das Formatieren und Strukturieren, das Setzen und Layouten dem TeX-System.
Der TeX-Compiler setzt den Quellcode nicht einfach nur in Wörter und Absätze um, sondern wendet eine Reihe interner Satzregeln an (siehe unten), um den Text in möglichst gut lesbarer und ästhetischer Weise zusammenzustellen.
Wenn der Anwender in einer herkömmlichen Textverarbeitung permanent das Layout mit den Augen prüft und verändert, erhöht sich auch die Chance, daß Absatzvorlagen nicht konsequent eingehalten werden: Wie auch unter TeX bietet eine herkömmliche Textverarbeitung wie LO Writer die Möglichkeit, den Text mithilfe von sog. Absatzvorlagen zu formatieren. So werden alle Überschriften derselben Ebene und auch der gesamte Brottext gleichartig (Schriftgröße, Schriftart, Farbe etc.) formatiert und wahlweise durchgängig numeriert. Problematisch wird es, wenn Absatzvorlagen ungenutzt bleiben oder das Fehlen ihrer Anwendung nicht bemerkt wird. Was sich im Fließtext vielleicht noch als unproblematisch erweist, könnte zu einer fehlerhaften Numerierung (auch im Inhaltsverzeichnis) der Überschriften führen. Möglich ist außerdem, daß verwaiste, also leere Absatzvorlagen zwischen den Absätzen stecken, z.B. eine Überschrift ohne Inhalt, so daß im Inhaltsverzeichnis eine leere Zeile generiert wird. Konzeptbedingt hat sich der Anwender in einer herkömmlichen Textverarbeitung um all diese Dinge selbst zu kümmern – kleine Erweiterungen wie der Pepito Cleaner (als Erweiterung für LibreOffice) prüfen abschließend das Dokument auf solche Unstimmigkeiten und geben eine Fehlerliste aus, die abgearbeitet werden kann.
Im Unterschied dazu sind derartige Fehler bei TeX ausgeschlossen, oder zumindest nur mutwillig herbeizuführen: Allein durch die Arbeitsweise mit einer Befehlssyntax wird spätestens beim Kompilieren deutlich, wo Fehler gemacht worden sind (nämlich durch Ausgabe eines Protokolls, das auf fehlerhafte oder unbekannte Befehlssyntax hinweist). Dementsprechend wird die Erstellung des Dokuments erst dann fortgesetzt, wenn alle Fehler behoben sind. Unvollständig angewendete Absatzvorlagen gibt es daher nicht; auch bei der Numerierung von Überschriften, Fußnoten, Abbildungen usf. wird niemals etwas durcheinanderkommen (können).
Wenn sowohl in TeX als auch in einer herkömmlichen Textverarbeitung Absatzvorlagen konsequent angewendet worden sind, ist es problemlos möglich, Formatierungsänderungen vorzunehmen: Alle Überschriften der 2. Ebene doch lieber in 16pt, kursiv und in Grün? Kein Problem. – Das wäre nicht möglich, wenn der Anwender sich sein Layout selbst bauen würde, indem er beispielsweise manuell seine Überschriften numeriert und direkt beim Eingeben derselben eine Schriftgröße und -art festlegt.
Zur Vollständigkeit sei auf Hybride wie Word Perfect verwiesen, das sich zunächst durchaus als herkömmliche Textverarbeitung bezeichnen läßt. Mithilfe eines Features namens reveal codes können allerdings neben dem WYSIWYG-Text sämtliche Formatierungscodes übersichtlich angezeigt, verstanden und manipuliert werden, die zum gegenwärtig sichtbaren Layout geführt haben.
Unter den herkömmlichen Textverarbeitungen gibt es kommerzielle und freie. Unter den kommerziellen ist MS Word sicherlich die bekannteste. Selbstverständlich zahlt man auch für jedes Upgrade und ggf. auch für jeden Arbeitsplatz. Außerdem gibt es Unterschiede im Umfang, je nach Anwender (Studenten-Lizenz, Professionell). Neuerdings gibt es von MS Office auch ein Abo-Modell, was wiederum von einer bestehenden Internetverbindung abhängig macht (sofern man die angebundenen Cloud-Dienste nutzen möchte).
Freie (quelloffene) Textverarbeitungen (LibreOffice, Calligra-Suite, Abiword) und auch TeX sind dagegen frei von Kosten zu beziehen, selbstverständlich auch alle Updates. Ebenso gibt es keine Einschränkungen hinsichtlich Anzahl der Arbeitsplätze oder ähnliches. Unter den WYSIWYM-Editoren (Texteditoren, TeX-Editoren) gibt es ebenfalls solche mit freier und kommerzieller Lizenz.
In dieser Kategorie wird angenommen, daß das Textverarbeitungssystem auf dem heimischen Computer (PC) betrieben werden soll. Für beide Lager (herkömmliche Textverarbeitungsprogramme und TeX) gibt es nämlich auch reine Online-Anwendungen, bei denen der Nutzer allein über den Browser auf seine Dokumente zugreift, und eine lokale Installation inklusive aller eventuellen Hardware-Fragen entfällt.
Diese Kategorie ist bei heutigen Festplattengrößen eigentlich kein Thema mehr. Dennoch eine kurze Ausführung:
MS Office belegt in seiner aktuellen Version nicht unter 1 GB Speicherplatz; andere Textverarbeitungen wie LibreOffice sind je nach Installationsumfang genügsamer. Einfache Textverarbeitungsprogramme wie Abiword belegen gerade einmal wenige Megabyte.
Den meisten Büro-Suiten ist gemein, daß sie sich modular installieren lassen, d.h. beim Installieren kann man die Komponenten der jeweiligen Office-Suite auswählen. Auch von einer aktuellen TeX-Distribution wie TeXLive wird wenigstens ein Gigabyte Speicherplatz belegt, je nachdem, wie umfangreich sie installiert wird.
Hier unterscheidet sich eine TeX-Distribution von einem herkömmlichen Office-Programm, denn sie läßt sich wesentlich modularer installieren; genau genommen kann man sich ein System mit nur denjenigen Komponenten zusammenstellen, die man wirklich benötigt. TeX läßt sich also (bei Kenntnis der erforderlichen Pakete) besser an die Bedürfnisse des Nutzers anpassen, und belegt damit nicht unnötig Speicherplatz (insbesondere auf älteren Systemen!).
Bei TeX kommt weiterhin ein Texteditor hinzu. Da es sich bei TeX-Quellcode um reine Textdateien (mit Syntax) handelt, ist die Wahl des Texteditors unerheblich. Der Nutzer kann sich seine Arbeitsumgebung also frei wählen.
Die meisten modernen Texteditoren verstehen die Syntax von TeX-Quellcode. Einige spezielle TeX-Editoren bieten auch gleich alles an, was man für die Bearbeitung von TeX-Dokumenten braucht, inklusive Anzeige der Dokumentstruktur bis hin zu Buttons für das Kompilieren. Andere Editoren (z.B. Atom/Zed, Visual Code oder Sublime) lassen sich mit Paketen nachrüsten, um das zu ermöglichen. Manche TeX-Editoren generieren synchron zum Quellcode eine Vorschau des Dokuments (was aber dem Prinzip von WYSIWYM entgegendrängt). Für einen Texteditor fallen jedenfalls selten mehr als 50 MB zusätzlicher Speicherplatz an.
Jede herkömmliche Textverarbeitung wie LO Writer oder MS Word hat den Nachteil, daß sie eine grafische Oberfläche (GUI) darstellt, und nicht, wie TeX, wahlweise auch im reinen Textmodus, z.B. im Terminal-Fenster, betrieben werden kann. Dementsprechend benötigen erstgenannte einen modernen Prozessor, nicht zu wenig Arbeitsspeicher und manchmal auch etwas Unterstützung von der Grafikkarte, wenn alles flüssig laufen soll. Besonders MS Office scheint von Version zu Version optisch aufgeblasener zu werden (Transparenz, Schatten, Animationen in der GUI). Je mehr dieser optischen Spielereien verbaut sind, desto mehr werden Systemressourcen verbraucht und desto träger wird die Eingabe oder Verarbeitung von Text sein.
Da, konzeptbedingt, Wortumbrüche und Layout bei herkömmlichen Textverarbeitungen während der Eingabe berechnet werden ("Live-Text") und nicht erst, wie bei TeX, während des Kompilierens, wird ebenfalls vermehrt Prozessorleistung beansprucht als bei TeX.
TeX-Quellcode läßt sich mit jedem beliebigen Computer öffnen und bearbeiten, und auf alten wie auf neuen Computern zu einem fertigen Dokument kompilieren (auch wenn es länger dauert). Eine bestimmte Abhängigkeit zu aktuellen Betriebssystemen besteht daher nicht.
Bekannt ist, daß die Abwärtskompatibilität bei MS Word keine Priorität zu haben scheint, weder was das Dateiformat betrifft, noch die Anwendung selbst. Ein modernes MS Office auf einem Windows 98 zu betreiben, ist unmöglich. Außerdem ist MS Office nicht für GNU/Linux verfügbar (kann aber emuliert werden). LibreOffice ist da einsichtiger und läßt sich auf nahezu jedem System mit grafischer Oberfläche installieren, ob nun Windows (ab XP), klassischem Desktop-Linux, BSD, Mac, Android, Solaris oder sonst etwas. Auch einige andere Textverarbeitungsprogramme wie Abiword sind plattformübergreifend verfügbar.
TeX kann ebenfalls auf den meisten Betriebssystemen ausgeführt werden (Windows, Apple, GNU-Linux, OS/2, MS-DOS, OpenVMS, BeOS, Amiga u.a.). Selbst wenn eine TeX-Distribution für ein bestimmtes Betriebssystem nicht verfügbar ist – der Quellcode läßt sich in jedem Fall bearbeiten.
Das von MS Word verwendete Format .doc (und sein XML-Luftballon .docx) gelten weithin als Standard-Dateiformat zum Austausch von Textdokumenten. Nur sind sie kein Standard und sollten niemals einer sein. Bekannt ist, daß Word-Formate gar nicht gut auf Abwärtskompatibilität zu sprechen sind; daß sich unter Word 95 erstellte Dateien mit modernen Word-Versionen mitunter gar nicht mehr öffnen lassen. Layout-Veränderungen sind selbst zwischen nachfolgenden Word-Versionen möglich. Das Word-Format ist kein Format für Dokumente, die auch in ferner Zukunft noch lesbar sein sollen.
Ein Standard ist dagegen das OpenDocument-Format. Textdokumente tragen die Dateierweiterung .odt. Es handelt sich um ein XML-basiertes und mit ZIP komprimiertes, offen dokumentiertes Format, das von einem internationalen Gremium (und nicht einem einzelnen Konzern) betreut wird. Es gilt mittlerweile als (berechtigter) Standard für die An- und Ablage von Textdateien. Im Gegensatz zum .docx-Format belegt es sogar geringfügig weniger Speicherplatz, da im .docx (das ebenfalls auf XML basiert) die XML-Syntax zwar technisch korrekt geschrieben, aber jedes einzelne Wort mit XML-Tags umklammert wird, anstatt, wie bei .odt, nur die Absätze. Das bläht dann die Dateigröße auf.
Das Dateiformat von TeX, also eine reine Textdatei mit der Endung .tex, ist das in diesem Vergleich vermutlich einfachste Dateiformat. Es kann mit jedem beliebigen Texteditor geöffnet und bearbeitet werden. Das gilt freilich auch für XML, das in .odt und .docx eingebettet ist!
Es ist zu bedenken, daß reine Textformate mitunter die ältesten Austauschformate für digitale Texte sind, d.h. ein in den 1980er Jahren erstellter .tex-Code läßt sich (mit wenigen Anpassungen, ggf. einer korrigierten Zeichencodierung) auch heute noch lesen, und er wird auch noch in Jahrzehnten lesbar sein.
Hinzu kommen zwei weitere Vorzüge reiner Textdateien:
Prinzipiell können sowohl herkömmliche Textverarbeitungen als auch TeX die auf dem System installierten Schriftarten verwenden. TeX selbst bringt Dutzende weitere Schriftarten mit, die über entsprechende Pakete eingebunden werden. Externe Schriftarten lassen sich mithilfe von XeTeX oder LuaTeX verwenden.
Die das TeX-Dokument betreffenden Einstellungen werden im Quellcode selbst hinterlegt; die Konfiguration des Texteditors wird separat in einer einfachen Text-Datei (config-Datei) gespeichert. Große Textverarbeitungen wie MS Word oder LO Writer verteilen ihre Programm-internen Einstellungen etwas unübersichtlich auf der Festplatte.
Soll für eine Anzahl von Dokumenten dieselbe Konfiguration zur Verfügung stehen, kann die TeX-Präambel in eine eigene Datei ausgelagert und in allen Dokumenten verlinkt werden. So modifiziert man sie nur noch an einer Stelle.
Komplexe Software wie LibreOffice oder MS Office enthalten selbstverständlich immer wieder Bugs, nicht umsonst gibt es Updates. Und ferner: Mit jeder neuen Version gibt es weitere Bugs und weitere Updates. Dieses ewige Hin und Her kennt jede Software. TeX dagegen hat den Ruf, daß Bugs nur selten gefunden werden. Selbstverständlich besteht eine TeX-Distribution aus vielen Paketen, die, selbstverständlich, auch hin und wieder von Bugs befreit oder mit neuen Funktionen ausgestattet werden. Sie entwickeln sich weiter oder veralten und sind dann nicht mehr mit anderen, aktuellen Paketen problemlos nutzbar. Wieder andere Pakete werden seit Jahren nicht mehr weiterentwickelt, ganz einfach, weil sie ausgereift und keine Bugs bekannt sind. Anwender, die einer Flut von Warnungen und Fehlern nach dem Kompilieren ihrer Dokumente gegenüberstehen, neigen gern dazu, auf Programmierfehler zu schließen. Üblicherweise handelt es sich aber um unachtsam gesetzten Code, d.h. Syntax-Fehler.
Der Bug-Anfälligkeit würde ich jedoch keine besondere Wertung in diesem Vergleich beimessen. Hier geht es um Funktionalität und Endergebnis, egal wie oft das Programm zwischendurch abstürzt.
Wie bereits angedeutet, kann man mit TeX ohne viel Eingreifen einen Text erzeugen, der harmonisch aussieht und gut lesbar ist. Das hat nicht nur damit zu tun, daß TeX die meisten Layout-Fragen selbst übernimmt (Satzspiegel-Größe etc.), sondern auch der Umbruch-Algorithmus anders funktioniert als bei einer Textverarbeitung wie MS Word oder LO Writer: Hier werden die Wörter nach Sprachvorgaben umgebrochen, die Zusammenstellung der Wörter und ihr Umbruch erfolgen meist auf Zeilenbasis, d.h. sobald ein Wort nicht mehr in die Zeile paßt, wird es umgebrochen oder auf die nächste Zeile verwiesen. Beim resultierenden Blocksatz können dann sehr unterschiedliche Ergebnisse herauskommen: Lücken reißende Wortabstände oder wenigstens ein unausgeglichener Grauwert der Seite sind keine Seltenheit.
Bei TeX geschieht der Wortumbruch auf Absatzbasis (was auch nicht weiter verwundert, denn schließlich schreibt man einen Absatz erst zu Ende, ehe man ihn setzt): Während des Kompilierens wird der Absatz "analysiert" und der Absatz so gesetzt (und umgebrochen), daß alle Wortabstände gleichmäßig (über den gesamten Absatz) verteilt sind. Daraus resultiert ein einheitlicher Grauwert und der Effekt, daß Testpersonen denselben Text schöner und harmonischer finden, wenn er mit TeX gesetzt worden ist.
Wer ein paar optische Vergleiche zwischen Word und LaTeX vorzieht, kann sich beispielsweise hier umsehen. Dort gibt es Beispiele für Ligaturen, Zurichtung, Kapitälchen und mehr, jeweils im Vergleich zu Word.
Durch Hinzuladen des microtype-Pakets kann man durch Aktivierung weiterer typographischer Feinheiten den Grauwert noch erhöhen. So ist es möglich, den sog. optischen Randausgleich zu nutzen, bei dem Buchstaben mit viel Fleisch (V, W) oder Bindestriche, sofern sie am Zeilenende stehen, ein wenig nach außerhalb des Satzblocks verschoben werden. Damit werden "lückige Stellen" aufgefüllt. Das genannte Paket kann außerdem Wortzwischenräume und Kegelbreiten der Buchstaben leicht variieren, so daß der Textblock noch ausgeglichener wirkt. Typisch sind solche Möglichkeiten für DTP-Programme, etwa das sog. hz-Programm, das heute in Adobe InDesign integriert ist.
Auch in Textverarbeitungen wie LibreOffice sind solche typographischen Optimierungen möglich, teilweise abhängig von der Schriftart (beispielsweise die Graphite-Version von Libertine, die den optischen Randausgleich unterstützt).
Ein bedeutender Unterschied findet sich, wenn man die Stabilität des Layouts betrachtet: Ein mit TeX-Quellcode geschriebenes Dokument wird, unabhängig vom Betriebssystem, der Hardware oder dem Drucker, zu jeder Zeit genau gleich aussehen. Das läßt sich von herkömmlicher Textverarbeitung nicht zwingend behaupten: Selbst das offene, gut dokumentierte OpenDocument-Format kann ein unterschiedliches Ergebnis liefern, je nachdem ob man dieselbe Datei mit LibreOffice, MS Office oder Calligra öffnet. Prinzipiell gelten OpenDocument-Dateien als "Layout-stabiler" im Vergleich zu Word-Dateien. Bei MS Word kommt dazu, daß das Layout des Dokuments vom installierten Druckertreiber abhängig sein kann, d.h. das gedruckte Dokument kann unterschiedlich aussehen, je nachdem, auf welchem Drucker es gedruckt wurde. Durch Kompatibilitätsprobleme kann es beim Öffnen mit anderen Textverarbeitung zum Verschieben von Bildern und Bildunterschriften oder einem anderen Wortumbruch kommen. Eine Lösung ist der Umweg über PDF.
Durch Ligaturen an entsprechender Stelle erhöht sich die Lesbarkeit eines Textes. Ligaturen werden üblicherweise automatisch gesetzt, sowohl von TeX als auch von herkömmlichen Textverarbeitungsprogrammen.
Für den Ligaturen-Satz gibt es Regeln, die es zu prüfen gilt. Ob eine Ligatur gesetzt wird (werden darf), hängt von folgenden Aspekten ab:
Mit einem lückenhaften Textblock hat man guter Typographie nicht unbedingt zugearbeitet.
Ob man Deutsch oder Englisch schreibt, welche Schriftart man verwendet, welche Textart man setzt (Antiqua, Serifenlose, Fraktur) und welcher typographischen Schule man folgt – Ligaturen bedeuten für den Setzer stets erhöhte Aufmerksamkeit und ggf. Nachbearbeitung des Textes.
Viele modern ausgebaute Schriften enthalten sog. OpenType-Features wie alternative Buchstabenformen, kontextsensitive Ersetzungen oder sogar weitere Ziffernsätze (Versalziffern vs. Mediävalziffern, Tabellenziffern vs. Proportionalziffern).
Unter TeX müssen solche Spielereien erst separat aktiviert werden. Das geht z.B. mit XeTeX und LuaTeX. Bei MS Word findet sich ab Version 2013 eine entsprechende Funktionserweiterung im Zeichen-Dialog. Unter LibreOffice können derartige Features aktiviert werden (Anleitung), indem man die entsprechenden OpenType-Kürzel an die Schriftart setzt. Außerdem gibt es für LO Writer eine Erweiterung namens Typography toolbar, welche eine Werkzeugleiste einblendet, über die sämtliche OpenType-Funktionalitäten einer Schriftart verfügbar werden (diese Erweiterung arbeitet nur mit der Graphite-Version einer Schriftart zusammen, z.B. Libertine.
Wie bei den Ligaturen gilt: Die Verwendung dieser Möglichkeiten muß abgewogen erfolgen und hängt ab von Textinhalt, Schriftart usf.
Je nach Schriftart sind im Glyphensatz echte Kapitälchen enthalten. Kapitälchen werden häufig und typographisch falsch durch Verkleinerung von Versalbuchstaben generiert: Herkömmliche Textverarbeitungen stellen diese Möglichkeit durch die Kapitälchen-Formatierung bereit, ohne darauf hinzuweisen, daß die verwendete Schriftart vielleicht gar keine Kapitälchen enthält. Werden Kapitälchen von TeX angefordert, die in der Schriftart nicht enthalten sind, wird dies beim Kompilieren mit einer Warnung protokolliert.
Was Unterstreichungen angeht, werden diese bei herkömmlichen Textverarbeitungen wie LO Writer durch die Unterlängen der Buchstaben gezogen. Obwohl Unterstreichungen für sich allein typographisch fragwürdig sind, ist die Durchschneidung der Unterlängen typographisch doppelt falsch. Je nach Paket werden Unterstreichungen bei TeX dagegen unterhalb der Unterlängen der Buchstaben gesetzt.
Die Rechtschreibprüfung (Orthographie) entspricht sowohl bei herkömmlichen Textverarbeitungen als auch bei Text-Editoren einfach einem Abgleich der Wörter mit einer whitelist. Ist das betreffende Wort nicht enthalten, wird es rot unterkringelt oder kann hinzugefügt werden. Der Umfang dieser whitelist ist wenig von der Textverarbeitung abhängig; im Internet können derartige Wörterbücher (dictionaries, Datei-Endung .dic) heruntergeladen und in den Editor oder die Textverarbeitung einbezogen werden.
Grammatikalische Unstimmigkeiten werden in einem Text-Editor üblicherweise nicht geprüft. Mithilfe eines Plug-Ins (z.B. LanguageTool) können sowohl in MS Word und auch LibreOffice die Wortstellung und -auswahl auf grammatikalische Richtigkeit geprüft werden. Auf eventuelle Beanstandungen ist allerdings kritisch einzugehen.
TeX ist bekannt für seinen exzellenten Formelsatz beliebig umfangreicher und komplexer Formeln; spezielle, auf unterschiedliche Formelebenen abgestimmte Glyphengrößen helfen beim Setzen einer insgesamt harmonisch aussehenden Formel-Struktur.
MS Word und LO Writer haben zwar auch eigenständige Formelsatz-Module, die aber v.a. bei großen und komplexen Formeln schnell an die Grenzen der ästhetischen Darstellung stoßen. Meistens werden für Hoch- und Tiefstellungen aller Art einfach die Glyphen der derzeitigen Schriftart skaliert, ohne daß sie auf gute Lesbarkeit in kleinen Größen optimiert sind; außerdem werden Zeichen oftmals enger zusammengepreßt als sie sollten. Da ich normalerweise keine komplexeren Formeln setze (außer durch Bruchstrich getrennte Terme), kann ich die Leistungsfähigkeit nur unzureichend beurteilen. Viele Anwender kritisieren auch eine auf amerikanische Maßstäbe getrimmte Formeldarstellung, die nicht immer allen Ansprüchen genügt. (Diesem Manko kann ggf. mit entsprechenden Paketen gegengesteuert werden.) Nicht unerwähnt soll sein, daß hochkomplexe Formeln im TeX-Quellcode zu einem Gewirr aus Buchstaben und Zahlen ausarten können, in denen schnell die Übersicht verlorengeht. Spezielle Formelmodule wie das von LibreOffice zeigen dagegen direkt das Endergebnis (oder wahlweise den dahinterliegenden Code, der dann TeX ähnelt), so daß man stets die Übersicht behält und auf Veränderungen leichter einwirken kann.
Was die Symbolvielfalt angeht, sind TeX und herkömmliche Textverarbeitungen vergleichbar. Beide greifen zurück auf einen Fundus von speziellen Symbol-Schriftarten (oder, im Falle von TeX, auf entsprechende Symbol-Pakete), so daß sich jedes nur erdenkliche Zeichen darstellen lassen kann.
TeX ist darüber hinaus in der Lage, mithilfe von Paketen musikalische Noten oder chemische Strukturformeln (mit optimalen Abständen) zu setzen; etwas, das ich von keiner herkömmlichen Textverarbeitung kenne.
Viele professionelle Schriftarten sind mit Tausenden Zurichtungspaaren ausgestattet, die den Textfluß bestimmter Buchstaben-Paare optimieren (z.B. die Unterschneidung der Buchstabenpaare T-a und V-o). In den meisten Textverarbeitungsprogrammen (LO, MS Office älter als 2010) sind nur ein Teil dieser Zurichtungstabellen ansprechbar. Mit der Nutzung von XeTeX oder LuaTeX kann dagegen der gesamte Umfang der OpenType-Schrift, darunter die vollständigen Zurichtungstabellen, ausgereizt werden. Eigene Tests (Zurichtungsvergleiche) zeigen, daß der Satz derselben Paare zuweilen besser in TeX aussieht als in LO Writer oder MS Word.
Selbstverständlich sind die Möglichkeiten der Zurichtung abhängig von der Anzahl programmierter Zurichtungspaare in der Schriftart. Eine schlecht zugerichtete Schriftart wird auch mit TeX schlecht zugerichtet aussehen.
TeX erreicht seinen überzeugenden Textsatz teilweise durch Anwendung mikrotypographischer Feinheiten, etwa der (fast nicht sichtbaren) Stauchung von Glyphen oder der Variation von Wortabständen, die in jeder Zeile geringfügig variieren kann.
Diese Features können beispielsweise durch Hinzuladen des microtype-Pakets (in seinen Standardeinstellungen) aktiviert werden. microtype gleicht den Text damit so aus, daß der Grauwert einer Seite erhöht wird. Abhängig von der verwendeten Schriftart und der Sprache (englischer Text mit kurzen Wörtern vs. deutscher Text mit langen, schlechter umbrechbaren Buchstabenschlangen) kann die Buchstabenstauchung mehr oder weniger auffällig sein und sollte dann deaktiviert werden (Option font expansion). Ich persönlich hielt das noch nie für notwendig und lade das Paket stets mit Standardoptionen in jedem Dokument.
Um in einer herkömmlichen Textverarbeitung ein ausgeglichenes Satzbild zu erzeugen, bleibt oft nur das manuelle Verteilen von sog. weichen Trennstellen, die zu den Standard-Trennstellen nach Wörterbuch dazukommen. Eine umständliche Angelegenheit bei langen Texten.
Die sog. Registerhaltigkeit ist ein in pdfLaTeX fehlendes und häufig nachgefragtes Thema. Darunter versteht man die identische Zeilenhöhe auf gegenüberliegenden Seiten eines Blattes Papier. Das heißt, wenn man ein Blatt gegen das Licht hält, sollten die Grundlinien der Zeilen genau deckungsgleich sein.
Nun ist es so, daß TeX ein harmonisches Satzbild (gleichmäßige Verteilung der Textblöcke, Überschriften, Bildelemente etc.) über die gelegentlich freizügige Dehnung der strikten Registerhaltigkeit erreicht. Texte, die mit pdfLaTeX gesetzt worden sind, können, müssen aber nicht registerhaltig sein.
Dieser Umstand kann mehr oder weniger auffällig sein. Für mich ist dieses "Manko" so unbedeutend, daß ich nie versucht habe oder versuchen werde, meine Texte strikt registerhaltig zu setzen. Wer dennoch diesen Anspruch erhebt, der kann Pakete wie grid oder gridset einbinden, oder gleich seinen Quellcode mit ConTeXt setzen.
Für alle, die nicht mit TeX arbeiten und sich dennoch der Registerhaltigkeit sicher sein wollen, müssen zu einer der großen DTP-Programme wie InDesign oder QuarkXPress greifen.
Beispiele für umfangreiche Dokumente gibt es viele: Handbücher, Abschlußarbeiten, Bücher, Zeitschriften mit separaten Beiträgen etc.
Nicht selten ist es sinnvoll, das Dokument in einzelne Kapitel aufzutrennen. Bei Verwendung einer herkömmlichen Textverarbeitung geschieht dies häufig durch Anlage einzelner Textdokumente. Das Endergebnis wird dann in einem gemeinsamen PDF zusammengeführt.
Handelt es sich aber um Abschnitte, die durch Querverweise, gemeinsame Literatur- und Indexlisten oder ein Inhaltsverzeichnis aufeinander aufbauen und voneinander abhängen, muß sich der Anwender um deren Konsistenz und Korrektheit selbst bemühen. Gleiches gilt für eine evtl. durchgängige Numerierung von Bildunterschriften, Seitenzahlen, Überschriften-Nummern usw.
Mit LibreOffice kann man dieser Problematik mit dem wenig bekannten "Globaldokument" (Dateiendung .odm) entgegnen, das als Header für beliebig viele Unterdateien fungiert, die z.B. als einzelne .odt-Dateien (Kapitel) in einem Ordner liegen. Jede der Dateien läßt sich einzeln bearbeiten, aber im Globaldokument sind alle zusammen sichtbar, mit einheitlicher Numerierung, Seitenzahl, gemeinsamen Inhaltsverzeichnis usw.
Mit TeX können auf dieselbe Weise Dokumente untereinander verkettet werden (Kommando input): Einzeln angelegte .tex-Dateien (= Kapitel) werden über eine globale .tex-Datei vereint. Beim Kompilieren werden die einzelnen Dateien zusammengefügt, Seitenzahlen, Abbildungsnumerierungen etc. korrekt gezählt und gesetzt. Die TeX-internen Zähler und Automatismen arbeiten dabei so effizient, daß man im Endergebnis sicher sein kann, daß alle Querverweise, Literaturzitate und sonstiges, das dynamische Felder gebraucht, fehlerfrei sind. Und bei Unstimmigkeiten würde man während des Kompilierens mit einer ausgegebenen Warnung darauf hingewiesen.
Diese Möglichkeit ist einer der Hauptgründe, weshalb ich die Arbeit mit einem TeX-System bevorzuge.
Einfacherweise werden bei illustrierten Textdokumenten die Bilder in die Datei eingebettet. Dadurch können die Dateien rasch eine Dateigröße annehmen, bei denen der Programmabsturz zu erwarten ist. Zumindest dürfte das Arbeiten mit dem Dokument stets träge reagieren. Hinzu kommt die Dauer für das Öffnen und Speichern der Datei. Sinnvoller ist hier das Verlinken der Bilder.
In TeX-Quellcode können, konzeptbedingt, Bilder nur verlinkt werden, denn es handelt sich um reine Textdateien, die keine Bilder aufnehmen können.
In beiden Fällen ist die Verlinkung eines Bildes sinnvoll, denn sie bewahrt die volle Kontrolle über die Bild-Dateien: Obwohl auch innerhalb der Textverarbeitungen wie MS Word oder LO Writer eine nachträgliche Korrektur (Farbstich, Kontrast, Zuschnitt etc.) möglich ist, sollten sie extern verwaltet und bearbeitet werden. Da sie verlinkt sind, werden sie im (schlankeren) Dokument aktualisiert, sobald sie verändert wurden.
Das hier über TeX Gesagte trifft weitgehend auch auf Typst zu. Typst kann als eine Art moderne Weiterentwicklung von TeX verstanden werden: genauso gut gesetzte Layouts mit viel einfacherer Syntax! Siehe hier.