Warum man GNU/Linux und andere freie Software/Formate in den Naturwissenschaften einsetzen sollte

Der Austausch von Informationen ist die Grundlage wissenschaftlicher Neuentdeckungen. Zum Beispiel könnte die digitale Bereitstellung aller Museumskataloge der Welt (mit Listen und Fotos) die überflüssige Neubenennung vieler Neotypen vermeiden. Und wäre jede jemals geschriebene wissenschaftliche Publikation im Internet frei verfügbar, könnte man Studien betreiben, ohne bereits von anderen gewonnene Aspekte zu übersehen!

 

Nun, GNU/Linux erfüllt nicht alle diese Wünsche, schafft aber mit seinen freien Standards und freier Software genau diese Grundlage, die zur Verbreitung neuen Wissens Voraussetzung ist.

Die Philosophie von OpenSource

Das Grundprinzip freier Software (Open Source) ist weniger, dass sie kostenlos ist, sondern dass sie frei ist. Frei hinsichtlich der Abhängigkeit von profitorientierten Firmen und nicht einsehbaren Code, frei hinsichtlich der beliebigen Erweiterung und Nutzung der Funktionalität. Bei der Nutzung freier Software erwartet niemand die Zahlung irgendwelcher Gebühren, es sind keine Hintertürchen im Quellcode eingebaut (besonders brisant bei Sicherheitssoftware) und es erfolgt auch keine Bevormundung hinsichtlich Funktionsumfang, Altersschutz oder Inhalt.

 

Es geht nicht darum, OpenSource – auch wenn sie manchen Leuten hin und wieder unausgereift erscheint – ‹eine Chance› zu geben, sondern sie deswegen zu nutzen, weil man sich damit wieder ein paar freiheitsbeschränkende Ketten mehr vom Körper nehmen kann! Es geht also auch um die eigene, persönliche Freiheit. Ich persönlich bevorzuge freie Software wie GNU/Linux daher aus Überzeugung.

 

Letztlich kann und sollte jeder Benutzer mit dem Betriebssystem arbeiten, mit dem er am besten zurechtkommt. Wer das Geld hat, um für einen angebissenen Apfel Tausende Goldstücke auszugeben, oder gerne eine Raubkopie von Windows nutzt und dann nachts noch ruhig schlafen kann, dann sei das so. Was mich aber wirklich aufregt, ist die Weitergabe unfreier Formate, siehe nächstes Kapitel.

Freie Software – freie Formate!

Unfreie Formate sind typischerweise von unfreier Software erzeugte Binärformate. Sie haben allein den Zweck, an eine bestimmte Software gebunden zu werden, für die man hin und wieder eine neue Version kaufen muss. Leider halten die meisten Personen den Versand (E-Mail oder Datenträger) unfreier Formate, ich nenne hier vor allem das .doc-Format, für einen gewöhnlichen Standard und ein in allen Kreisen und Institutionen grundsätzlich akzeptiertes Austauschformat. Diese Annahme ist falsch; das .doc-Format ist einfach nur weit verbreitet.

 

Nun, gereicht dieses Faktum nicht zu dessen Akzeptanz? Ist nicht sinnvoll, dasjenige Format zum Austausch einzusetzen, das auch am weitesten verbreitet ist? Doch wissen wir wirklich, dass es weit verbreitet ist, nur weil wir es standardmäßig mit der E-Mail auf Reise schicken? Vielleicht hat unser Gegenüber gar nicht den Primäreditor für das .doc-Format, namentlich MS Office Word! Vielleicht bringt der Versand des .doc-Formats unser Gegenüber in die Verlegenheit, sich nach einem Editor umzusehen, der das Format öffnen kann; gegebenenfalls nötigt man ihn dazu, sich für teuer Geld MS Office Word zu kaufen, weil er keine anderen Editoren kennt oder von seinen Kollegen diese Software als erstes genannt wird?! Vielleicht muss er sich auch erst diese Software neu kaufen, weil die alte Version das übersendete Format nicht fehlerfrei öffnen kann? Weshalb das .doc-Format nicht zum Austausch genutzt werden sollte, habe ich in einmal hier ausgeführt. (Auf dieser Seite steht auch Einiges, warum man Word nicht zum Dateiaustausch nutzen sollen.)

 

Als ich diese Problematik mehrfach angesprochen habe, insbesondere darauf hinwies, dass uns erstens der Einsatz unfreier Formate von bestimmten Firmen abhängig macht und zweitens (damit verbunden) wir unsere eigenen mit dieser proprioritären Software erzeugten Dateien gegebenenfalls in einigen Jahren nicht mehr öffnen können (der Konzern MS hat das mehrfach gezeigt), wurde mir manchmal etwas ruppig und eindeutig entgegnet: Excel gibt's doch immer! Man bedenke nur, wir hätten einen derartigen Dialog vor einem Jahrzehnt noch zur Frage der Verwendung von 3,5-Zoll-Disketten geführt! Wie wichtig einem die Verfügbarkeit seiner Daten in der Zukunft ist, wird im Abschnitt Freie Formate – unentbehrlich für die Wissenschaft beschrieben.

 

Ich möchte zusammenfassen, dass es für die austauschenden Personen offenbar am besten ist, sich auf ein Datenformat zu einigen, das mit kostenloser Software einfach gelesen werden kann. Für Dokumente (Text-Bilder-Mischung) eignet sich wohl am ehesten das PDF-Format.

 

In der Wissenschaftswelt dürfte es zu den häufigsten Tätigkeiten zählen, Textdokumente herumzuschicken, die Publikations-Manuskripten mit mehreren Autoren entsprechen. Word-Dateien werden standardmäßig für Publikationstext erzeugt und an die Co-Autoren verschickt, damit diese die Möglichkeit haben, den Text zu kommentieren oder zu ergänzen. Das Word-Dokument in seinem eigenen Word zu öffnen und den gewünschten Text ins Dokument hereinzutippen, mag seine Vorteile hinsichtlich der Einfachheit haben, aber ich halte dies nicht für den einzigen Weg, noch nicht einmal für einen professionellen (… weil wir nichts anderes kennen?).

 

Man stelle sich eine Publikation vor, an der sechs Autoren arbeiten, wovon einer als Haupt-Editor ausgewählt wurde, der quasi die letzte Instanz ist, die letzte Entscheidung trifft, welche Korrekturen wirklich in den Text einfließen. Man könnte das Word-File nun zu einem der Autoren schicken mit der Bitte, seine Kommentare und Ergänzungen zu machen und diese veränderte Datei dann an den nächsten Autor weiterzuleiten, damit der dasselbe tut und so weiter. Wie hält man auseinander, welcher der Autoren welche Kommentare gemacht hat? Nun, es gibt hierfür zwei Wege:

  • Jedem Autoren wird eine bestimmte Textfarbe zugewiesen. Sie identifiziert die Änderungen am Text, die von der betreffenden Person vorgenommen wurde. Was zunächst nach fragwürdigen Idee klingt, wird in der Tat sehr häufig in der Praxis angewendet. Resultat ist in jedem Fall ein bunter Text, aber nur, wenn jeder Autor auch darauf geachtet hat, seine ihm zugewiesene Farbe zu benutzen und weiterhin sie überhaupt zu benutzen, wenn eine Änderung vorgenommen wurde.
  • Man könnte die eingebaute Kommentar-Funktion von MS Word oder LibreOffice Writer benutzen: Dabei könnte man verschiedene Kommentar-Funktionen wie Markieren, Durchstreichen, Ersetzen usw. anwenden, jeweils mit dem Namenskürzel versehen, auf den diese Word-Version lizenziert ist (bzw. derjenige Name, der in den Einstellungen von LibreOffice vorgegeben wird). Der Haupt-Editor erhält anschließend das Dokument zurück und kann die Anmerkungen akzeptieren oder verwerfen. Er weiß genau, wo etwas von wem geändert wurde, ohne dass aus dem ursprünglichen Text ein Chaos entsteht.

Nun kann es allerdings zu Problemen kommen, wenn unterschiedliche Versionen von Word benutzt werdend, d. h. wenn der Haupt-Autor die Word-Datei im .docx-Format anlegt, aber Autor Nr. 4 nur Word 2002 hat. Der steht zunächst vor der Hürde, die Word-Datei überhaupt öffnen zu können, also geht die Anfrage an den Haupt-Editor, die Datei in einer für ihn lesbaren Form zu speichern: »Nicht lesbar? Haben Sie etwa kein Word? Hat doch jeder!«

 

Kommentare, die von einer Word-Version gespeichert wurden, müssen nicht zwangsläufig in einer kleineren Word-Version erscheinen; Beispiele sind dokumentiert:

 

»Warum haben Sie das verändert? Ich hatte doch ausdrücklich drangeschrieben, dass dieser Absatz OK ist!«

 

Aber auch wenn man sich auf eine niedere Word-Version geeinigt hat und nur mit Textfarben arbeitet, ist kein Gelingen garantiert: Der Haupt-Editor wird erstens seinen ursprünglichen Text nicht mehr wiedererkennen und damit nicht nachvollziehen können, welche Abschnitte sich nun wirklich geändert haben (das wäre sichtbar, wenn der Ursprungstext unangetastet erhalten bliebe und die Kommentare nur darüber liegen):

  • Rot hat zwei Sätze gelöscht und drei Wörter ergänzt. Leider vergaß er, den korrigierten Nebensatz einzufärben.
  • Grün hat nur einen gelöscht und dafür zwei Seiten geschrieben.
  • Gelb wiederum hat in den zwei Seiten von Grün mehrere Passagen verändert, die damit gelb gefärbt sind.

Das Resultat ist ein ziemlich bunter, unübersichtlicher Text, in dem außerdem Autor 5 hinzugefügte Passagen von Autor 4 gelöscht haben könnte, ohne dass dieser etwas davon mitbekommt. Nicht einmal der Haupt-Editor wüsste, ob Autor 4 nicht doch etwas geschrieben hat, das der Haupt-Editor vielleicht besser befunden hätte als Autor 5!

 

Für dieses Dilemma (ich rede jetzt allein von der Aufgabe, ein Dokument für Kommentare herumzuschicken, und zwar an Personen, die mit hoher Wahrscheinlichkeit verschiedene (auch unterschiedlich versionierte!) Texteditoren verwenden) gibt es meiner Meinung nach nur eine vernünftige Lösung: PDF. Dieses bewahrt den ursprünglichen Text unverändert im Dokument und lässt jeden Co-Autoren Kommentare und Ergänzungsvorschläge anbringen, ohne dass etwas durcheinanderkommt.

 

Das PDF kann von allen Co-Autoren gelesen werden, ebenso die eingebetteten Kommentare. Freie Software und sogar Adobes Reader für pdf's ermöglicht in seiner neuesten (kostenlosen) Version das Anbringen von Kommentaren! Jeder wird also das PDF öffnen und ‹bearbeiten› können, der Haupt-Editor erhält ein PDF zurück, in welchem übersichtlich alle Änderungsvorschläge aufgelistet sind und kann sie nach und nach in das ursprüngliche Manuskript einarbeiten.

 

Eine weitere Sache kommt dazu: Publikationsmanuskripte sind – und ich vermute, dabei handelt es sich in 90 % der Fälle bei Mehr-Autoren-Publikationen – nur rudimentär strukturierte und formatierte Texte. Etwas in einem Word-Manuskript zu formatieren (Autoren in Kapitälchen, taxonomische Namen in kursiv, Überschriften in fett und Größe 16, der Text in Arial …) ist reine Illusion und entspricht in keiner Weise dem Endergebnis! Jeder Verlag hat da seine eigenen Vorgaben und wird niemals einfach nur die eingesendete Word-Datei öffnen und den Text per Copy & Paste in sein DTP-Programm übernehmen! Das bedeutet wiederum, dass das Formatieren in seinem Manuskript Zeitverschwendung ist und zweitens man spätestens jetzt auf die Idee kommen müsste:

 

»Wenn hinterher sowieso alles anders ist, warum nehme ich dann Word?«

 

Und ich stelle die Frage in den Raum: Welches Feature bietet Word für einfach strukturierten und formatierten Text, den nicht auch das Writer-Modul von LibreOffice bietet? Wieso nicht gleich Writer und das hauseigene, offene .odt-Format nehmen?

 

Argumente der weiteren Verbreitung ziehen meiner Meinung nach nicht, weil man notfalls sein Writer-Dokument auch als .doc speichern könnte. Entscheidet man sich für die Nutzung des .odt-Formats, das mit einem Programm wie LibreOffice verarbeitet wird, sollte Folgendes beachtet werden: Sofern man die Writer-interne Kommentar-Funktion nutzt, sollte man vorher unter Extras|Optionen|Tab LibreOffice|Untertab Benutzerdaten wenigstens einen Vor- und Nachnamen eintragen. Setzt man dann ein Kommentar in den Text, steht dort der Name des Kommentators und bleibt auch beim Versand an den nächsten Co-Autoren erhalten.

 

Noch einfacher ist die Verwendung einer einfachen Textdatei, der man beispielsweise mit einer Syntax wie Markdown eine einfache Strukturierung und Formatierung mitgeben kann. Mit Markdown formatierte Textdateien können leicht ausgetauscht und mit einem beliebigen Texteditor geöffnet und bearbeitet werden (man braucht also noch nicht einmal eine Word- oder LibreOffice-Installation!); mit einem Parser wie Pandoc können sie außerdem ins Word- oder PDF-Format überstellt werden.

 

Zusammenfassend sei jene Reihenfolge notiert:

- Textdokumente für Manuskripte, bei denen rudimentäre Strukturierung (verschiedene Überschriften-Ebenen) und Formatierungen (Kursivierung, Fettschrift) ausreichen.

- Sind komplexere Funktionen notwendig (Formelsatz, Dokument-interne Verlinkungen, automatische Verzeichnisse, Kommentar-Funktion etc.) verwendet entweder LaTeX oder ein Binärformat wie .odt oder .docx. Je nachdem, ob man sich für das OpenDocument-Format oder das Word-Format entscheidet, sollte sichergestellt sein, dass jeder Co-Autor den jeweiligen Primäreditor dafür verwendet, d. h. der Austausch von .odt von LibreOffice zu Word und zurück kann im schlimmsten Fall dazu führen, dass Verschiebungen im Layout auftreten oder Formatierungen gelöscht werden.

- Am einfachsten ist es für eine große Gruppe von Co-Autoren, dass der Haupt-Editor ein aus dem Manuskript generiertes PDF erstellt, das nacheinander an die Co-Autoren weitergereicht wird. Diese Co-Autoren verheften jeweils die auf sie codierten Kommentare am Text.

 

Es sei auf jeden Falle zu betonen, dass es einen klaren Unterschied gibt, ob das erstellte Manuskript für den Satz und Druck bei einem Verlag gedacht ist, oder im privaten Bereich gedruckt werden soll. Denn davon hängt es ab, wie viel Mühe man sich überhaupt mit der Formatierung des Dokumentes machen muss: Schickt man letztlich den Text an einen Verlag, ist jede Formatierung sinnlos (Schriftart und -größe, Seitenlayout etc.), es muss lediglich klar erkennbar sein, welche Strukturebenen (Überschriften und Unterschriften) es gibt und welche Wörter eine spezielle Formatierung erwarten (Kursivierung, Fettschrift, Kapitälchen etc.); alles andere kann man sich sparen. Und unter dieser Annahme ist zu überlegen, ob für das Manuskript nicht auch ein Markdown-strukturiertes Textdokument ausreicht. Was den privaten Druck angeht, würde ich letztlich immer sofort mit LaTeX arbeiten; aber das gilt nur für mich, der LaTeX beherrscht. Alle anderen, die sich LaTeX nicht angewöhnen wollen oder können, sind dann gezwungen mit einer herkömmlichen Textverarbeitung wie Word ein möglichst gut aussehendes Dokument herzustellen. Spätestens bei einer umfangreicheren Arbeit (mit automatischen Listen, vielen Verlinkungen und Literaturverzeichnis) lassen sich die Vorzüge eines LaTeX aber auch nicht mehr wegreden.

 

Das hier Gesagte gilt zunächst nur für Textdokumente. Bei der Weiterreichung von Tabellendokumenten (Excel etc.) sollte natürlich kein PDF, sondern das Ursprungsformat versendet werden, denn ggf. möchte man die Formeln der Zellen einsehen können.

Freie Software – reicht die mir nicht?

»Was nehmen Sie für die Bildbearbeitung?« – »Photoshop natürlich!« Ach ja? Wieso eigentlich?

 

Was tut der Normal-Benutzer mit seinen Bildern? Kanten beschneiden und Kontrast anpassen, um 90° rotieren, Ebenen nutzen und als .jpg speichern? Wieso brauche ich dann ein teures Photoshop? Wieso kann der Normal-Benutzer dann nicht GIMP oder ein anderes freies Bildbearbeitungsprogramm nehmen, das nichts kostet, genau das gleiche kann und sogar noch ressourcenschonender läuft?

 

Das generelle Problem dahinter ist die Gewöhnung ans ‹Hören-Sagen›: Manche Wörter verbindet man einfach mit dem Inbegriff des Themas: Coca Cola, Milka-Schokolade, Photoshop für Bildbearbeitung, mp3 für Musik, Windows für Betriebssysteme, Word, Excel usw., obwohl es für all diese genannten Dinge eine Alternative gibt, die meistens sogar funktionsreicher, schneller und besser ist. Empfiehlt man als Kenner dann derartige Alternativen und ermutigt zum Wechsel, wird man häufig konfrontiert mit einer anderen Eigenart des Menschen: der Unwilligkeit zur Umstellung. Das Calc-Modus von LibreOffice kann im Prinzip alles wie Excel, aber einige Buttons sind an der anderen Stelle. GIMP kann wie Photoshop die Bilder zuschneiden, aber der Menüpunkt ist woanders eingeordnet.

 

Was eigentlich spricht noch gegen die Verwendung des GIMP? Sein Name? – Oder sind Sie Profi-Nutzer und wollen Farbkanäle mixen, mit dem Gaußschen Weichzeichner filtern, Ebenenmasken anwenden, Wolken und Flammen rendern oder gar eine Animation erstellen? – Ach, Moment! Das kann der GIMP ja auch!

 

Photoshop ist keinesfalls eine schlechte Bildbearbeitungssoftware! Sie macht mit ihrem Funktionsumfang jedoch nur Sinn für Profi-Anwender. Die wenigstens normalen Nutzer würden Photoshop je ausreizen; und die meisten normalen Nutzer wären mit einem GIMP ebenso zufrieden.

 

Warum nun also die moralische Ermahnung? An dieser Stelle möchte ich den Computer-Nutzer ermutigen, sich zu jeder Gelegenheit (und spätestens im Falle, wenn er davor steht, eine teure Software zu kaufen) nach Alternativen umzusehen, herumzuprobieren und zu lernen. Und letztlich ist es wirklich so, dass es für die meisten Kauf-Programme eine kostenlose (freie) Alternative gibt.

Freie Software – unentbehrlich für die Wissenschaft!

Die meisten Menschen glauben, dass so exotische Betriebssysteme wie Linux nicht sehr weit verbreitet sind. Das ist mit Sicherheit falsch. Selbst wenn Sie jetzt nach dem Begriff Linux googeln, weil Sie nicht wissen, wovon ich rede, verwenden Sie die auf Linux aufgesetzten Datenbankserver des Google-Konzerns. Gleiches gilt für das Nachschlagen des Wortes Linux in der Wikipedia – auch dann werden mit Linux aufgesetzte Server verwendet. Weiteres zur Verwendung von Linux findet der Leser hier.

 

In der Wissenschaft sind GNU/Linux und freie Formate weiter verbreitet als man denkt. Und das sollten sie auch! Denn hier geht es um die Auswertung und Speicherung wissenschaftlicher Daten, die vor allem auch in ferner Zukunft noch lesbar sein sollen (daher freie Formate!).

  • Astrophysiker nutzen beispielsweise das freie, von der NASA entwickelte FITS-Format zur Speicherung von Fotografien und Messwerten. Warum? Weil sie sich nicht von einer Firma abhängig machen und die Daten problemlos noch in achtzig Jahren lesen wollen!
  • Fast jeder Superrechner läuft auf einer Linux-Basis. Warum? Weil sie sich leichter skalieren lassen und nur die Berechnungen durchführen, die sie sollen.
  • Am Kernforschungszentrum CERN, am Fermilab und dem Teilchenbeschleuniger DESY kommt eine speziell angepasste Version von Scientific Linux zum Einsatz, die Tausende von Wissenschaftlern für die Auswertung ihrer Messreihen nutzen und einheitlich verbindet.
  • Museen und naturwissenschaftliche Universitätssammlungen nutzen immer häufiger freie Datenbanksysteme wie Specify zur Erfassung ihrer naturwissenschaftlichen Sammlung, um ihre Kataloge mit Daten aufzufüllen, international zu verbinden und Daten abzufragen.

 

Stellen wir uns als Wissenschaftler also die Frage: Wie wichtig ist der Erhalt wissenschaftlicher Daten? Wollen wir sie nicht auch auslesen können, wenn wir gerade mal kein Geld für eine Microsoft-Office-Lizenz haben? (Und wir Wissenschaftler wissen, dass es oft am Geld mangelt!) Gibt es bestimmte Firmen und damit Software in vielen Jahren noch, damit wir unsere damals mit dieser Software gespeicherten Informationen überhaupt noch auslesen können? – Ich denke, die einzige Antwort auf diese Frage ist: Nutzt freie Software und vor allem freie Formate! Sollte die betreffende Software wirklich einmal nicht mehr weiterentwickelt werden, ist zumindest der Quellcode verfügbar und kann zweckgebunden angepasst werden!

Freie Software und der Umweltgedanke

Neue Software-Versionen nötigen den Endanwender viel zu häufig dazu, sich den neuesten Computer mit beispielsweise der neuesten Grafikkarte zu kaufen. Das sollen sie aber nicht. PC-Spiele und neue Versionen von Windows erzwingen dies und die derzeitige Technik-Mode verführt dazu. Aber was ist wirklich neu?

 

Können wir nicht die natürlichen Ressourcen schonen und auf den Kauf der neuesten PC-/Handy-Generation verzichten? Freie Software wie GNU/Linux ermöglicht es uns stattdessen, den alten PC aus dem Keller zu einer brauchbaren Büro-Maschine aufzuarbeiten und den PC mit der gleichen (vielleicht veralteten Hardware-Konfigurationen) sehr viel länger zu nutzen als es ein Windows je gestatten würde.