Data Mining

Dr. Michael Möhring und Prof. Dr. Frieder Stolzenburg - Sommersemester 2008 - Hochschule Harz in Wernigerode

Allgemeines

Data Mining bezeichnet ein aktuelles, stark expandierendes Forschungs- und Anwendungsfeld, das sich mit der Entwicklung und Anwendung von Methoden und Softwaresystemen zur Extraktion von Informationen aus großen Datenmengen befasst:

Data Mining is the exploration and analysis by automatic or semiautomatic means of large quantities of data in order to discover meaningful patterns and rules. (Berry/Linoff, 1997)

Hintergrund hierfür ist das starke Anwachsen digital verfügbarer Daten, verursacht insbesondere durch den hohen Anstieg automatisierter Datenerfassung von elektronisch unterstützten Transaktionen in Wirtschaft, Wissenschaft und Verwaltung (z.B. Kundenverwaltung, POS-Daten, Telekommunikationsprotokolle). Die Aufbereitung und Extraktion "nützlicher" Informationen aus diesen sehr großen Datenmengen für dispositive Zwecke, d.h. zur Entscheidungsunterstützung bei Planungs- und Kontrollaufgaben, hat insbesondere zur Entwicklung neuer Analysemethoden und -werkzeuge geführt, wie zum Beispiel aus dem Bereich des maschinellen Lernens (Neuronale Netze, Entscheidungsbäume etc.), mit denen die klassischen Methoden der Statistik (Clusteranalyse, Diskriminanzanalyse etc.) ergänzt und erweitert werden.

Ausgehend von Prozessmodellen für die Durchfhrung vollständiger Data Mining Projekte im betrieblichen Umfeld, liegt der Schwerpunkt der Veranstaltung in der Vorstellung und Diskussion grundlegender Techniken des Data Mining und ihre beispielhafte Anwendung an konkreten Datensätzen unter Einsatz des Data Mining Werkzeugs Clementine.

Organisatorisches

Die Veranstaltung hat ihren Platz im Bachelorstudiengang Informatik (B.Sc.) im 6. Semester (Wahlblock Datenmanagement). Sie wird gleichzeitig als Wahlpflichtfach angeboten mit 3 CP (Credit Points) bei 1+1+1 SWS (Semesterwochenstunden). Sie findet in 4-stündigen Blöcken zusammengefasst statt. Vorlesung und Übung wird von Dr. Michael Möhring (Universität Koblenz-Landau) durchgeführt, das Labor von Prof. Dr. Frieder Stolzenburg.

Termine


Gliederung