LZS

  • Increase font size
  • Default font size
  • Decrease font size
E-Mail Drucken

Clustererkennung via DBSCAN-Varianten

Betreuer: M.Sc. Tobias Rumpel

Vortragender: Philipp Heitz

Problemstellung: Es sollen große Datensätze effektive bearbeiten werden können. Als Vorbereitung dafür müssen diese jedoch zuerst strukturiert werden, sodass Messdaten mit ähnlichen Eigenschaften in sogenannte Cluster gruppiert werden. Für die Clusterung gibt es eine Vielzahl von verschiedenen Methoden, jedoch erweisen sich dichtbasierte Verfahren oft als die bessere Wahl. Zu diesen dichtebasierten Verfahren zählt auch DBSCAN (Density-Based Spatial Clustering of Applications with Noise), welcher dem Dichteverlauf der Messdaten folgt und somit die Cluster bildet. Die richtige Wahl der Parameter für einen neuen Datensatz, kann sich jedoch als schwierig erweisen.

Problemlösung: Neben DBSCAN gibt es noch andere Verfahren, welche nach ähnlichem Prinzip arbeiten oder schlicht Erweiterungen des Algorithmus sind. Es soll ein Programm in Python geschrieben werden, welches die Messdaten clustert und einen Vergleich der Algorithmen miteinander erlaubt.

Durchführung:
Gegeben sei eine Datenbank mit Messdaten:

  • Einarbeitung in Python
  • Programmierung der Clusterverfahren (DBSCAN, OPTICS, DENCLUE, HDBSCAN)
  • Vergleich der Ergebnisse

 

 

Suche

LZS-Intern