Startseite » Datenbank Lexikon » Explorative Datenanalyse

Explorative Datenanalyse

Die explorative Datenanalyse wird auch als explorative Statistik bezeichnet und bildet ein Teilgebiet der Statistik. Es werden Daten analysiert, zu denen kaum oder sogar keine bekannten Zusammenhänge bestehen.

Dabei besteht das Ziel der explorativen Datenanalyse darin, einen Überblick über die vorliegenden Daten zu erhalten, um diese besser einschätzen und bewerten zu können. Erst im Rahmen der Analyse fallen Regelmäßigkeiten, Abhängigkeiten oder besondere Zusammenhänge zwischen scheinbar vollkommen ungleichen Daten auf.

Wurden ausreichend Muster und Zusammenhänge entdeckt, um eine Aussage zu treffen, wird anschließend gezielt nach Ausreißern in dieser Masse gesucht. Die einzelnen Ausreißer werden wiederum analysiert, um zu entscheiden, ob sie aus dem Datenpool entfernt werden können oder sogar die Analyse noch weiter verfeinert werden muss.

Fehlende Werte werden ebenfalls analysiert. Diese weisen auf mögliche Probleme während der Datenerhebung hin.

Vor- und Nachteile einer explorativen Datenanalyse

Vorteile einer explorativen Datenanalyse

  • Durch die wiederholte Analyse werden die Zusammenhänge der Daten immer wirklichkeitsgetreuer dargestellt.
  • Die explorative Datenanalyse eignet sich besonders gut als Lern- oder Erkenntniswerkzeug.
  • Es können viele Informationen zugleich transportiert und transparent gemacht werden.

Nachteile einer explorativen Datenanalyse

  • Der Analytiker benötigt einen umfassenden Erfahrungsschatz, um realistische Zusammenhänge abzubilden.
  • Die selektive Wahrnehmung des Analytikers spielt in jeder explorativen Datenanalyse eine Rolle.
  • Die Fragestellungen sind für manche Personen unter Umständen nicht sinnvoll und können daher nur schwer aussagekräftig bewertet werden

Beispiel einer explorativen Datenanalyse

Ein Beispiel für eine explorative Datenanalyse ist die Ermittlung der weltweiten Lebenserwartung des Menschen und die Gründe für eine steigende oder fallende Lebenserwartung je nach Region.

Dazu werden als zugrundeliegende Daten die Bevölkerungszahlen der einzelnen Staaten, die Geburts- und Sterbedaten der Personen und eventuell das Geschlecht der Personen verwendet. Anhand des erreichten Alters der Personen kann über die Jahre hinweg pro Staat ein Abbild der steigenden oder fallenden Lebenserwartung erzeugt werden.

Die explorative Datenanalyse setzt ein, wenn diese Daten mit anderen Kriterien in Zusammenhang gebracht werden. Die Lage von Fabriken oder umweltbeinflussende Faktoren könnten als weitere Daten in die Analyse mit einbezogen werden. Ebenso können aber auch die Anzahl von Krankenhäusern, die Qualität des Wassers oder der Luft oder viele weitere Daten erfasst werden. Während der Analyse wird versucht Zusammenhänge zwischen allen Daten zu erkennen und darzustellen.

Die explorative Datenanalyse wird in jedem Fall nur so genau ausfallen, wie Sorgfalt auf die in Frage kommenden Daten gelegt wurde. Was dem Analytiker nicht bekannt ist, kann folglich auch nicht ausgewertet werden.

Weiterführende Artikel

Autor: Kristina
4 Bewertungen 1 Stern2 Sterne3 Sterne4 Sterne5 Sterne
Loading...
0