Transformer: 2. Rohdaten formatieren.

Menue-Formatieren.png

Als nächstes wollen wir jeden Datensatz in einer einzigen Zeile zusammen fassen, denn die Rohdaten sollen Schritt für Schritt in ein Tabellenformat gebracht werden, wo jeder Datensatz in einer Zeile und die Werte jedes Datensatzes in aufeinander folgenden Spalten stehen. Im vorliegenden Fall (Abb.2) sollen also jeweils vier aufeinander folgende Zeilen eines Datensatzes in einer Zeile vereinigt werden. Wollte man das 'per Hand' erledigen, bzw. jedes unsichtbare Zeilen­end­zeichen (\n) in den drei ersten Zeilen eines Datensatzes mit der Maus anklicken und löschen, dann wäre das ein ziemlich langwieriges und ermüdendes Unterfangen. Denn vor uns liegen 12000 Zeilen, die der Datalogger während eines einzigen Fluges produziert hat. Außerdem wollen wir ziemlich viele Flüge auswerten und in Karten visualisieren. Wir vergessen also hier Hand anzulegen, denn es geht viel einfacher und schneller mit dem Menü Daten formatieren.



Das Hilfsfenster: Quelldaten neu strukturieren

Hilfsfenster Formatieren
Es erscheint das nebenstehende Hilfsfenster Quelldaten neu strukturieren

Wir wählen Jede neue Zeile beginnt mit folgender Zeichenfolge und geben ein, dass jeder Datensatz mit der Zeichenfolge AC beginnt. Nach einem Mausklick auf die Schaltfläche Anwenden schreibt Transformer jeden Datensatz in eine Zeile.



Die neu formatierten Datensätze

Formatiert.png
Neu formatierte Rohdaten: Jetzt steht jeder Datensatz in einer Zeile
Wir schreiben als Titel den Flug HE 05.2015 ind die Titelleist ganz oben und löschen dann die erste Datenzeile, die nicht in das Schema der Datensätze passt. Die formatierten Daten sichern wir unter einem passenden Namen z.B, HE-05-15-form.txt

Bevor wir weitere Schritte durchführen, z.B. Spalten auswählen und beschriften, sollten wir die Daten prüfen. Insgesamt haben wir 12000 Datensätze in der Datei und da kann es vorkommen, dass der eine oder andere Datensatz Fehler enthält, die bereits im Datalogger, durch die Datenübertragung oder nachträgliches Editieren der Rohdaten entstanden sind. Wenn wir diesen wichtigen Punkt überspringen laufen wir Gefahr, dass wir Datenmüll produzieren nach dem Muster: Garbage in -> garbage out. Wir gehen also zum nächsten Schritt und prüfen die Daten.