🏠 » Business Intelligence » Data Mining Grundlagen » Data Mining

Data Mining - Was ist Data Mining?

Data Mining ist die Anwendung statistischer Methoden auf besonders große und komplexe Datenmengen mit dem Ziel neue Muster zu erkennen.

Zum Beispiel ist es mittels Data Mining möglich, das Kaufverhalten von bestimmten Kundengruppen zu erkennen und auszuwerten. Ein bekanntes Beispiel soll das Ziel von Data Mining verdeutlichen:

Das Data Mining konnte die Cross Selling-Methode deutlich verbessern. Im Einzelhandel hat man zum Beispiel festgestellt, dass junge Väter beim Kauf von Windeln oft auch Bier kaufen. Daraufhin hat der Einzelhandel die Kombination von Windeln und Bier analysiert und kam zum folgenden Ergebnis.

Die Data Mining-Methoden ergaben, dass junge Väter besonders unter Stress stehen und deswegen neben den Windeln auch gerne einen Kasten Bier kaufen, um am Abend eine Flasche zu genießen.

Was ist mit Data Mining möglich und was nicht?

Data Mining ist ein leistungsfähiges Verfahren, das Muster und Beziehungen innerhalb von Daten aufdecken kann. Aber Data Mining funktioniert nicht von selbst. Es wird nicht die Notwendigkeit beseitigen, dass Unternehmen lernen müssen ihre Daten richtig zu verstehen und zu deuten. Data Mining kann verborgene Informationen in Daten aufdecken, aber es kann Ihnen nicht sagen, wie werthaltig diese Informationen sind.

Damit aussagekräftige Data Mining-Ergebnisse gewährleistet werden können, muss ein Unternehmen seine Daten verstehen. Data Mining-Algorithmen reagieren oft sehr empfindlich auf bestimmte Eigenschaften in den Daten, wie zum Beispiel bei:

  • Ausreißer (Datenwerte, die sehr verschieden von den typischen Werten in der Datenbank sind),
  • irrelevant Spalten, also Spalten, die zusammen variieren (wie Alter und Geburtsdatum),
  • Datencodierung,
  • und Daten, die ein- oder ausgeschlossen werden

Das Data Mining kann durch den ausgewählten Algorithmus viel von der Datenaufbereitung automatisch ausführen. Aber einige der Methoden sind sehr spezifisch aufgebaut und passen nicht für jeden Verwendungszweck. Auf jeden Fall muss ein Unternehmen seine Daten verstehen, damit Modelle gebaut und die Ergebnisse am Ende richtig interpretiert werden können.

Auf den folgenden Seiten werden wir euch erklären, wie die oben genannten Beispiele funktionieren und weitere Data Mining-Methoden und deren Ergebnisse erläutern.

Weiterführende Artikel