Statistik und eindeutige Werte

Grundstatistik für Felder

Gelegentlich wird man um die statistische Auswertung von Geodaten gebeten. Wenn man die Daten vorher nicht kennt, gibt es Mittel und Wege, um sich zunächst einen statistischen Überblick zu verschaffen.

Angenommen, wir laden eine Geodaten-Quelle und stellen bei Besichtigung der Attributtabelle fest, dass es mehrere Zahlen-Felder gibt. Doch wie sind die Daten statistisch verteilt? Von welchem Bereich (zwischen Minimal- und Maximalwert) sprechen wir? Wie lautet der Mittelwert? etc.

Abbildung 1
Abbildung 1

In QGIS kann über den Menüeintrag "Vektor | Analyse-Werkzeuge | Grundstatistik für Felder" ein entsprechendes Werkzeug abgerufen werden (Abb. 1). Unter Eingabelayer wählt man die Datenquelle, darunter das betreffende Feld, für das die Auswertung vorgenommen werden soll.

Bei Standardeinstellung wird mit dem Start der Berechnung eine HTML-Datei erzeugt, die die Daten zusammengefasst enthält. Wer diesen Umweg nicht braucht und die Ergebnisse sofort sehen will, stellt die Ausgabe (Abb. 1, roter Pfeil) auf "Ausgabe überspringen". Im Protokollfenster werden dann alle Werte aufgelistet.

Statistik ermitteln (alternativer Weg)

Abbildung 2
Abbildung 2

In QGIS gibt es ein Bedienfeld mit dem Namen "Statistik" (in Windows unter "Ansicht | Bedienfelder | Statistik", im Linux unter "Einstellungen | Bedienfelder | Statistik"). Wer das öffnet, erhält ein zusätzliches Programmfenster, in dem lediglich das Eingabelayer und das betreffende Feld ausgewählt werden. Über die Einstellungen (Abb. 2, roter Pfeil) können die zu berechnenden Statistik-Felder ausgewählt werden.

Eindeutige Werte auflisten

Noch etwas gehört zum Thema "Überblick verschaffen": Bei sehr vielen Datensätzen kann der Überblick verloren gehen, welche eindeutigen Werte es in einem bestimmten Feld gibt.

Beispiel: Eine Tabelle über einen Baumbestand listet in einem Feld "Status" den Zustand eines einzelnen Baumes. Man sieht Werte wie "befallen", "gesund" und "Astschnitt notwendig". Aber waren das wirklich alle möglichen Werte?

Abbildung 3
Abbildung 3

Ein entsprechendes Werkzeug findet man unter QGIS-Menü "Vektor | Analyse-Werkzeuge | Eindeutige Werte auflisten". Im folgenden Dialog (Abb. 3) legt man wieder die Quelle (Eingabelayer) sowie das Zielfeld fest (Button mit drei Punkten). Als Ausgabe wird ein Temporärlayer erzeugt (Abb. 3, schwebendes Fenster auf rechter Seite), der alle eindeutigen Werte übersichtlich auflistet. Auch hier kann die Ausgabe direkt ins Protokoll umgeleitet werden ("Ausgabe überspringen" anstatt "Temporärlayer erzeugen"), doch das ist nicht so übersichtlich. Zusätzlich wird wieder eine temporäre HTML-Datei erzeugt, die alle Werte enthält.