Ausreißerkennung von Testdaten
Betreuer: B.Sc. Tobias Rumpel
Vortragender: Bernhard Drescher
Problemstellung: Es sollen große Datensätze effektive bearbeiten werden können. Als Vorbereitung dafür müssen diese jedoch zuerst strukturiert werden, sodass diese von Ausreißern bzw. Rauschen bereinigt werden. In der Statistik versteht man unter einem Ausreißer einen Wert, welcher sich stark von den übrigen Werten unterscheidet. Diese Anomalien lassen oft auf fehlerhafte Bauteile schließen und müssen deshalb erkannt und als potentiell fehlerhaft markiert und ausgeschlossen werden. Ebenso mindern Ausreißer die Qualität der folgenden Clusterung und sind auch deshalb zu entfernen.
Problemlösung: Für die Ausreißererkennung gibt es mehrere Verfahren. Diese sollen als Pythonprogramm geschrieben und implementiert werden. Die Ausreißer sollen identifiziert, markiert und entsprechend entfernt werden.
Durchführung:
Gegeben sei eine Datenbank mit Messdaten:
- Einarbeitung in Python
- Programmierung der Ausreißererkennung (grafisch, statistik-, distanz- und dichte-basierte Verfahren)
- Vergleich der Ergebnisse
Termin: 30.01.2020 09:00 Uhr