🏠 » Lexikon » C » Clusteranalyse

Clusteranalyse

Die Clusteranalyse wird im Rahmen des Data Mining verwendet. Das Clustern dient der Ermittlung von ähnlichen Strukturen bzw. Informationen.

Es ist eines der bekanntesten Verfahren der Datenanalyse und wird häufig zu Marketingzwecken eingesetzt, um Kundengruppen (bzw. Kundencluster) zu ermitteln, wodurch Kunden gezielt angesprochen werden können.

Die Clusteranalyse kann durch zwei verschiedene Verfahren realisiert werden, um das gewünschte Ergebnis zu erzielen.

Aufbau der Clusteranalyse

Bei der Clusteranalyse von Daten geht es darum, Objekte mit ähnlichen oder denselben Eigenschaften in einer Gruppe zusammenzufassen. Es gibt mehrere Verfahren beim Clustern der Daten. Die zwei bekanntesten sind das partitionierende und das hierarchische Verfahren.

Partitionierendes Verfahren

Die Aufteilung der Objekte in bestimmte Cluster bzw. Gruppen erfolgt anhand eines zuvor quantitativ festgelegten Bereiches. Das Verfahren wird iterativ auf die Objekte angewandt, um möglichst homogene Gruppen zu erstellen.

Hierarchisches Verfahren

Dieses unterteilt sich weiter in das agglomerative Verfahren, bei dem eine Vielzahl an Clustern bzw. Klassen zu einigen wenigen zusammengefasst werden. Des Weiteren gibt es das divisive Verfahren, bei dem ein Cluster herangezogen wird, um dieses feingranularer auf mehrere Cluster zu verteilen. Die einzelnen Cluster stehen dabei in einer hierarchischen Beziehung zueinander.

Die dabei entstehende Gruppenbildung unterscheidet überlappende (ein Objekt in mehreren Gruppen), nicht-überlappende (ein Objekt in nur eine Gruppe) und Fuzzy-Gruppen (ein bestimmter Teil eines Objektes gehört zu einer Gruppe).

Vorgehensweise beim Clustern

Zunächst werden Objekte hinsichtlich ihrer übereinstimmenden und nicht-übereinstimmenden Merkmalsausprägungen überprüft. Hierfür wird das Proximitätsmaß (nominales oder metrisches Ähnlichkeitsmaß) verwendet.

Anschließend erfolgt die Bildung von Gruppen, indem Objekte, mit einem bestimmten Ähnlichkeitswert, zusammengefasst werden. Da es bei der Clusterbildung zu einer Vielzahl an Clustern kommen kann, muss entschieden werden, ob die Anzahl an Clustern verringert wird, um nicht zu feingranular zu gruppieren, oder erhöht werden soll, um zu unspezifische Cluster zu vermeiden.

Vorgehensweise bei der Clusteranalyse | Datenbank Lexikon

Die dabei ermittelten Cluster können anschließend bei einer fachlichen Analyse auf ihre Relevanz und Qualität überprüft werden.

Einsatzbereiche der Clusteranalyse

Das Verfahren findet überall dort Anwendung, wo es darum geht, neue Erkenntnisse aus den Daten zu gewinnen. Das vorangestellte Ziel der Clusteranalyse ist das Auffinden neuer Cluster, also neuer Gruppen mit homogenen Objekten. Im Unternehmen werden diese Gruppen genutzt, um für die Produktentwicklung, das Marketing, den Kundenservice oder den Vertrieb die Kundenwünsche und Erwartungen zu berücksichtigen.

Besonders beliebt ist der Einsatz der Clusteranalyse im Marketing. Hierdurch kann bereits eine personalisierte Ansprache stattfinden, um den Kunden innerhalb einer Kundengruppe nur mit den Produkten und Services anzusprechen, die ihn auch wirklich interessieren und einen Mehrwert darstellen.

Welche Präferenzen ein Kunde hat, kann über die Kombination einzelner Kundenmerkmale bei einer Clusteranalyse ermittelt werden.

Clusteranalyse - Definition & Erklärung - Zusammenfassung

Im Zusammenhang mit dem Lexikoneintrag Clusteranalyse sollte man sich folgende Punkte merken:

  • Die Clusteranalyse wird im Rahmen des Data Mining verwendet. Das Clustern dient der Ermittlung von ähnlichen Strukturen bzw. Informationen.
  • Die Clusteranalyse kann durch zwei verschiedene Verfahren (partitionierendes/hierarchisches Verfahren) realisiert werden, um das gewünschte Ergebnis zu erzielen.
  • Die Clusteranalyse ist besonders im Marketing sehr beliebt, da die personalisierte Ansprache zielgerichtet auf einen Kunden oder auf eine Kundengruppe durchgeführt werden kann.