Zeichencodierung


Die »richtige« Zeichencodierung

Zeichencodierungen für LaTeX gibt es eine ganze Menge, je nach Entwicklungsstand der Computer, Land und Betriebssystem. In Westeuropa ist vor allem latin1 verbreitet und wird demnach auch gerne in der Präambel seines LaTeX-Dokumentes verwendet:

\usepackage[latin1]{inputenc}

latin1 deckt die meisten Buchstaben, Umlaute, Akzente und Sonderzeichen der westeuropäischen Sprachen ab. Allerdings empfehle ich, stattdessen die Zeichencodierung utf8 zu verwenden, deckt sie doch noch weit mehr Sonderzeichen aus nicht-europäischen Sprachen ab und ist auf dem Weg zu einer sich global durchsetzenden und allgemein gültigen Zeichencodierung, um das Chaos der Dutzenden aktuell vorhandenen Zeichencodierungen abzulösen:

\usepackage[utf8]{inputenc}

Manche LaTeX-Editoren wie TeXMaker erlauben in ihren Voreinstellungen, neu angelegte Dokumente immer in einer bestimmten Zeichencodierung abzuspeichern. Ich empfehle in diesem Punkt, in den Einstellungen seines Lieblingseditors zu kramen und die Voreinstellung auf UTF-8 vorzunehmen.

 

Wer sich nicht sicher ist, kann sein TeX-Dokument in einem beliebigen Text-Editor öffnen. Unter »Datei | Speichern Unter« gibt es meistens eine Möglichkeit, die gewünschte Zeichencodierung anzugeben.

 

Die »klassische« Eingabeweise von Sonderzeichen im Plain-Text-kompatiblen Format kann als obsolet betrachtet werden. Gerade in deutschen Texten mußte man bei ASCII-konformem Code auf eine spezielle Eingabe-Methode zurückgreifen, um z.B. Umlaute darstellen zu können:

Aus der "übers"attigten L"osung f"allt Quarz aus.

Das hatte zwar den Vorteil, daß ein solcher Code tatsächlich auf jedem PC gelesen und kompiliert werden konnte, brachte aber auch zahlreiche Nachteile mit sich, insbesondere für jene, die in nicht-englischer Sprache schreiben und folglich eine Reihe von Umlauten und Sonderzeichen benötigen. Abgesehen von der umständlichen und zeitintensiven Eingabe dieser Zeichen versagt natürlich auch jede Rechtschreibprüfung bei so einem Code.

 

Glücklicherweise kann man, sofern man utf8 als Zeichencodierung gewählt hat (siehe oben), alle Sonderzeichen und Umlaute direkt im Quellcode eingeben.


Update

Mit der neuesten Version von LaTeX wurde die UTF-8-Zeichencodierung als Standard eingerichtet. Das heißt, die inputenc-Eingabe (siehe oben) ist nicht falsch, aber auch nicht zwingend notwendig.