Tipps zur Dateiverwaltung

Datei- und Ordnernamen

… ein Thema, welches meiner Meinung nach viel zu selten angesprochen wird. Im Folgenden will ich einiges über korrekte Datei- und Ordnernamen schreiben, weil das meiner Meinung nach eine wichtige Grundlage ist, um seine Dateien auch über viele Jahre hinweg nutzen zu können. Man mag jetzt fragen: »Was hat denn der Dateiname damit zu tun, wie lange ich eine Datei nutzen kann?« – Und ich antworte: »Wer’s gleich richtig macht, hat später weniger Stress!«

 

Prinzipiell geht es um die Kompatibilität zwischen verschiedenen (großen) Betriebssystemen: in diesem Fall Windows und GNU/Linux. Und bei beiden sind die Konventionen für Datei- und Ordnernamen unterschiedlich, sodass es zu Problemen kommen kann, wenn man z.B. eine mit GNU/Linux erstellte Datei auf Windows öffnen will.

 

Wie ich aus eigener Erfahrung gelernt habe, kann es beispielsweise sein, dass ich (abhängig vom Dateisystem) bei der Benennung einer Datei unter GNU/Linux Zeichen verwendet habe, die im Dateinamen bei Windows nicht zulässig sind. Die Folge ist, dass sich diese Datei mit einer prägnanten Fehlermeldung nicht mehr öffnen lässt.

 

Anderes Beispiel: eine Datei unter Linux steht unter einem Pfadnamen, der länger als 300 Zeichen ist, z.B. weil die Datei in etlichen Unterordnern liegt. Bei Windows ist jedoch nur eine maximale Pfadlänge von 255 Zeichen möglich, wodurch es geschehen kann, dass der Dateiname automatisch verkürzt wird! Zum Beispiel von

MeineUltra-langeDatei.odt

auf

MeineUl%534.odt

eben auf ein Überbleibsel, das das Kriterium von 255 Zeichen erfüllt.

 

Um all dem Stress zu entgehen, habe ich hier einige Tipps, die man unbedingt beachten sollte, damit man auch in Zukunft was mit seinen Dateien anfangen kann:

Datei-Inhalte

In dieser Kategorie kann ich mich nur zu LaTeX-Dateien äußern: Dieses Thema ist sehr komplex und natürlich von Software und den entsprechenden Dateitypen abhängig. Prinzipiell sei gesagt, dass Dateien mit einem Dateiheader (z.B. geschriebener Text ist der Inhalt der Datei und der Dateityp .odt enthält als Header alle Informationen, welcher Zeichensatz verwendet wurde usw.) unproblematisch auf anderen Betriebssystemen zu öffnen sind: Zum Beispiel bleiben geschriebene Umlaute in einem OpenDocument-Format auch Umlaute, selbst wenn man sie auf verschiedenen Betriebssystemen öffnet, da der Header des OpenDocument-Formats alle Informationen zum Zeichensatz enthält und entsprechend die Umlaute darstellt.

 

Anders sieht es bei reinen Text-Dateien aus, dazu zählen ja auch die .tex-Dateien für LaTeX. Hier fehlt der Datei-Header, der Inhalt der Datei ist direkt und ohne Umstände mit einem Text-Editor auslesbar, und unter GNU/Linux eingegebene Umlaute wie ä,Ö und ß verschwinden möglicherweise, wenn man die Datei unter Windows öffnet (abhängig von der eingestellten Zeichencodierung und den Fähigkeiten des Editors). Weiteres dazu steht hier.

Datei-Namen

Die Länge eines Dateinamens ist abhängig vom Betriebssystem und dem Dateisystem, z.B. unter Ubuntu (Standard-Dateisystem ext4) und bei Windows (Dateisystem NTFS) auf 255 Zeichen beschränkt. Das sollte man aber (wenn es sich verkneifen lässt) nicht ausreizen; es behindert ja auch die Übersichtlichkeit.

 

Die Beschränkung von 255 Zeichen ist darüber hinaus von der Verwendung der Zeichencodierung abhängig: »Normale« Buchstaben des lateinischen Alphabets (a, b, c, A, B, C usw.) belegen für gewöhnlich je 1 Byte, der Dateiname könnte also theoretisch aus 255 dieser Zeichen zusammengesetzt sein. Verwendet man dagegen Umlaute wie ä,ü und ö, werden schon 2 Byte pro Zeichen belegt. Die Verwendung beispielsweise asiatischer Schriftzeichen kann 3–4 Byte je Zeichen beanspruchen. Dementsprechend kann man weniger Zeichen für den Dateinamen schreiben. Da generell empfohlen wird, auf Umlaute im Dateinamen zu verzichten, empfehle ich auch hier, seinen Dateinamen nur aus den Grundbuchstaben des lateinischen Alphabets zu bilden und Umlaute entsprechend abzuwandeln, z.B.

HuebschUndSuess.odt

Um aus mehreren Wörtern zusammengesetzte Dateinamen übersichtlich zu trennen, empfehle ich entweder, jedes neue Wort mit einem Großbuchstaben zu beginnen, oder dazwischen Bodenstriche zu setzen:

MeineDatei.odt

auf

Meine_Datei.odt

Es sollte generell darauf verzichtet werden, ein Leerzeichen zwischen den Wörtern zu lassen, Dateinamen sollten immer aus einem zusammenhängenden Fluss aus Zeichen bestehen (daher keine Leerzeichen).

 

Nur für Windows und GNU/Linux zulässige Dateinamens-Zeichen verwenden: Einer der Nachteile von Windows-Dateisystem ist, dass es eine ganze Reihe von Zeichen gibt, die man im Dateinamen nicht verwenden kann: < > | / \ * : ? " Bei GNU/Linux dagegen ist nur das Zeichen \ nicht erlaubt (+ das Null-Zeichen = Code-Position »0« im ASCII oder Unicode-Zeichensatz).

 

Benennt man unter Linux eine Datei zum Beispiel zu

MeineDatei?:VielleichtDoch?.odt

wird diese unter Windows nicht lesbar sein, selbst wenn ein .odt-Interpreter wie LibreOffice installiert ist! Daher mein Tipp: Für Dateinamen nur Buchstaben des lateinischen Alphabets und arabische Ziffern verwenden, auch wenn theoretisch mehr Zeichen erlaubt wären.

 

Eine Sache noch, die nicht als Tipp verstanden werden darf: GNU/Linux unterscheidet im Gegensatz zu Windows zwischen Groß- und Kleinschreibung des Dateinamens. Das bedeutet, dass es unter GNU/Linux im gleichen Ordner eine Datei Mein_Dokument.odt wie auch Mein_dokument.odt wie auch mein_dokument.odt geben darf. Bei Windows natürlich nicht. Manche Leute mögen sich das zunutze werden lassen, dass man dreimal eine Datei mit gleichem Namen im gleichen Ordner liegen hat, aber meiner Meinung nach stiftet das nur Verwirrung und ich empfehle, darauf zu verzichten.

 

Übrigens gilt auch hier: Sollte man wirklich einmal dreimal eine Datei mit dem gleichen Dateinamen im gleichen Ordner haben, und öffnet dieses Verzeichnis unter Windows, wo solche Scherze nicht erlaubt sind… – habs noch nicht probiert, aber ich nehme an, es kommt zu irgendwelchen Fehlermeldungen oder so ;)

Pfadnamen und -längen

Auch bei der maximal zulässigen Länge von Pfadnamen gibt es Unterschiede zwischen Windows und GNU/Linux: Während ab Windows 95 (im Dateisystem NTFS) die Länge von Pfaden maximal 247 Zeichen PLUS 255 Zeichen für den Dateinamen betragen darf, ist die Pfadlänge bei GNU/Linux (abhängig vom Dateisystem) auf 4096 Bytes beschränkt. Man sollte sich jedoch hüten, unter GNU/Linux eine Datei mit einer Pfadlänge von 3000 Bytes abzuspeichern (z.B. weil sie in Dutzenden Unterordnern liegt). Denn wenn man die Datei unter Windows wieder ansprechen will, dürfte es zu Fehlermeldungen kommen, weil hier die zulässige Pfadlänge überschritten wurde und Windows sich nicht erklären kann, wie der User das geschafft hat ;)

 

Daher mein Tipp: Es mit den Unterordnern nicht übertreiben, damit die Pfadlänge kurz bleibt.

Dateinamen per Stapelverarbeitung umbenennen

Wer viele Dateien hat, wo bei allen Dateien auf die gleiche Weise etwas im Dateinamen geändert werden soll, z.B. die Endung oder als Präfix, der kann Software wie Métamorphose oder gprename nutzen. Eine Alternative für den KDE-Desktop heißt KRename.