Tips zur Dateiverwaltung


Datei- und Ordnernamen

… ein Thema, welches meiner Meinung nach viel zu selten angesprochen wird. Im folgenden will ich einiges über korrekte (vernünftige?) Datei- und Ordnernamen schreiben, weil das meiner Meinung nach eine wichtige Grundlage ist, um Dateien auch über viele Jahre hinweg nutzen zu können. Man mag jetzt fragen: »Was hat denn der Dateiname damit zu tun, wie lange ich eine Datei nutzen kann?« – Und ich antworte: »Wer’s gleich richtigmacht, hat später weniger Streß!«

 

Prinzipiell geht es um die Kompatibilität zwischen verschiedenen (großen) Betriebssystemen: in diesem Fall Windows und GNU/Linux. Und bei beiden sind die Konventionen für Datei- und Ordnernamen unterschiedlich, sodaß es zu Problemen kommen kann, wenn man z.B. eine mit GNU/Linux erstellte Datei auf Windows öffnen will.

 

Wie ich aus eigener Erfahrung gelernt habe, kann es beispielsweise sein, daß ich (abhängig vom Dateisystem) bei der Benennung einer Datei unter GNU/Linux Zeichen verwendet habe, die im Dateinamen bei Windows nicht zulässig sind. Die Folge ist, daß sich diese Datei mit einer prägnanten Fehlermeldung nicht mehr öffnen läßt.

 

Anderes Beispiel: eine Datei unter Linux steht unter einem Pfadnamen, der länger als 300 Zeichen ist, z.B. weil die Datei in etlichen Unterordnern liegt. Bei Windows ist jedoch nur eine maximale Pfadlänge von 255 Zeichen möglich, wodurch es geschehen kann, daß der Dateiname automatisch verkürzt wird! Zum Beispiel von

MeineUltra-langeDatei.odt

auf

MeineUl%534.odt

eben auf ein Überbleibsel, das das Kriterium von 255 Zeichen erfüllt.

 

Um all dem Unmut zu entgehen, habe ich hier einige Tips, die man beachten sollte, damit man auch in Zukunft etwas mit seinen Dateien anfangen kann:

Datei-Inhalte

In dieser Kategorie kann ich mich nur zu LaTeX-Dateien äußern: Dieses Thema ist komplex und von Software und den entsprechenden Dateitypen abhängig. Prinzipiell sei gesagt, daß Dateien mit einem Dateiheader (z.B. geschriebener Text ist der Inhalt der Datei und der Dateityp .odt enthält als Header alle Informationen, welcher Zeichensatz verwendet wurde usw.) unproblematisch auf anderen Betriebssystemen zu öffnen sind: Zum Beispiel bleiben geschriebene Umlaute in einem OpenDocument-Format auch Umlaute, selbst wenn man sie auf verschiedenen Betriebssystemen öffnet, da der Header des OpenDocument-Formats alle Informationen zum Zeichensatz enthält und entsprechend die Umlaute darstellt.

 

Anders sieht es bei reinen Text-Dateien aus, dazu zählen ja auch TeX-Quellcodes. Hier fehlt ein Datei-Header, der Inhalt der Datei ist ohne Umwege mit einem Text-Editor auslesbar, und unter GNU/Linux eingegebene Umlaute wie ä,Ö und ß verschwinden möglicherweise, wenn man die Datei unter Windows öffnet (abhängig von der eingestellten Zeichencodierung und den Fähigkeiten des Editors). Weiteres dazu steht hier.

Datei-Namen

Die Länge eines Dateinamens ist abhängig vom Betriebssystem und dem Dateisystem, z.B. unter Ubuntu (Standard-Dateisystem ext4) und bei Windows (Dateisystem NTFS) auf 255 Zeichen beschränkt. Das sollte man aber (wenn es sich verkneifen läßt) nicht ausreizen; es behindert ja auch die Übersichtlichkeit.

 

Die Beschränkung von 255 Zeichen ist darüber hinaus von der Verwendung der Zeichencodierung abhängig: »Normale« Buchstaben des lateinischen Alphabets (a, b, c, A, B, C usw.) belegen für gewöhnlich je 1 Byte, der Dateiname könnte also theoretisch aus 255 dieser Zeichen zusammengesetzt sein. Verwendet man dagegen Umlaute wie ä, ü und ö, werden schon 2 Byte pro Zeichen belegt. Die Verwendung beispielsweise asiatischer Schriftzeichen kann 3–4 Byte je Zeichen beanspruchen! Dementsprechend kann man weniger Zeichen für den Dateinamen schreiben. Da generell empfohlen wird, auf Umlaute im Dateinamen zu verzichten, empfehle ich auch hier, einen Dateinamen nur aus den Buchstaben des lateinischen Alphabets zu bilden und (u.a. deutsche) Umlaute entsprechend abzuwandeln, z.B.

HuebschUndSuess.odt

Um aus mehreren Wörtern zusammengesetzte Dateinamen übersichtlich zu trennen, empfehle ich entweder, jedes neue Wort mit einem Großbuchstaben zu beginnen (CamelCase-Schreibweise), oder dazwischen Unterstriche zu setzen:

MeineDatei.odt

auf

Meine_Datei.odt

Es sollte grundsätzlich darauf verzichtet werden, ein Leerzeichen zwischen den Wörtern zu lassen; Dateinamen sollten immer aus einem zusammenhängenden Fluß aus Zeichen bestehen (daher keine Leerzeichen).

 

Nur für Windows und GNU/Linux zulässige Dateinamens-Zeichen verwenden: Einer der Nachteile von Windows-Dateisystem ist, daß es eine ganze Reihe von Zeichen gibt, die man im Dateinamen nicht verwenden kann: < > | / \ * : ? " Bei GNU/Linux dagegen ist nur das Zeichen \ nicht erlaubt (+ das Null-Zeichen = Code-Position »0« im ASCII oder Unicode-Zeichensatz).

 

Benennt man unter Linux eine Datei zum Beispiel zu

MeineDatei?:VielleichtDoch?.odt

wird diese unter Windows nicht lesbar sein, selbst wenn ein .odt-Interpreter wie LibreOffice installiert ist! Daher mein Tip: Für Dateinamen nur Buchstaben des lateinischen Alphabets und arabische Ziffern verwenden, auch wenn theoretisch mehr Zeichen erlaubt wären.

 

Eine Sache noch, die nicht als Tip verstanden werden darf: GNU/Linux unterscheidet im Gegensatz zu Windows zwischen Groß- und Kleinschreibung des Dateinamens. Das bedeutet, daß es unter GNU/Linux im gleichen Ordner eine Datei Mein_Dokument.odt wie auch Mein_dokument.odt wie auch mein_dokument.odt geben darf. Bei Windows natürlich nicht. Manche Leute mögen sich das zunutze werden lassen, daß man dreimal eine Datei mit gleichem Namen im gleichen Ordner liegen hat, aber meiner Meinung nach stiftet das nur Verwirrung und ich empfehle, darauf zu verzichten.

Pfadnamen und -längen

Auch bei der maximal zulässigen Länge von Pfadnamen gibt es Unterschiede zwischen Windows und GNU/Linux: Während ab Windows 95 (im Dateisystem NTFS) die Länge von Pfaden maximal 247 Zeichen PLUS 255 Zeichen für den Dateinamen betragen darf, ist die Pfadlänge bei GNU/Linux (abhängig vom Dateisystem) auf 4096 Bytes beschränkt. Man sollte sich jedoch hüten, unter GNU/Linux eine Datei mit einer Pfadlänge von 3000 Bytes abzuspeichern (z.B. weil sie in Dutzenden Unterordnern liegt). Denn wenn man die Datei unter Windows wieder ansprechen will, dürfte es zu Fehlermeldungen kommen, weil hier die zulässige Pfadlänge überschritten wurde und Windows sich nicht erklären kann, wie der Nutzer das geschafft hat :D

 

Daher mein Rat: Es mit den Unterordnern nicht übertreiben, damit die Pfadlänge kurz bleibt.

Dateinamen per Stapelverarbeitung umbenennen

Soll der Dateiname zahlreicher Dateien nach einem Muster (Austausch einer Buchstabenfolge o.ä.) geändert werden, dem sei Software wie Métamorphose, Find & Replace oder gprename empfohlen. Eine Alternative für den KDE-Desktop heißt KRename.