Data Science - Was ist Data Science?
Der Begriff Data Science ist nicht neu und stammt aus den Anfängen der Datenhaltung und Datenanalyse, die bis in die 1960er Jahre zurückgehen.Mit dem Trendthema „Big Data“ rückte die Wissenschaft der Daten wieder in den Fokus von Unternehmen und Öffentlichkeit. Der Schwerpunkt der Data Science liegt - entgegen vieler Meinungen - nicht bei den Daten (also „Data“) selbst, sondern bei der Art und Weise wie die Daten verarbeitet, aufbereitet und analysiert werden.
Bei Data Science steht eine zweckorientierte Datenanalyse und die systematische Generierung von Entscheidungshilfen und -grundlagen, um ökonomische Wettbewerbsvorteile erzielen zu können. Dabei ist es wichtig zu berücksichtigen, dass eine Datenanalyse nur erfolgreich sein kann, wenn sich diese auf eine konkrete Fragestellung bezieht.
Data Science - Historie und Ausblick
In den Anfängen der Datenanalyse lag der Schwerpunkt der Betrachtung auf der Auswertung von Statistiken. Die Datenanalyse entwickelte sich, durch das Aufkommen computergestützter Datenauswertung, zu einer neuen wissenschaftlichen Disziplin. John W. Tukey schrieb in seinem Buch The Future of Data Analysis (1962) seine Gedanken hierzu nieder.
In den 1970er Jahren wurde der Begriff Data Science erstmals näher definiert und über (neue) Methoden der Datenverarbeitung öffentlich diskutiert.
Seit dem Jahr 1989 wurde das Thema Data Science und Datenanalyse immer wieder aufgegriffen. Dabei wurden Ansätze und das enorme Potenzial einer systematischen Datenauswertung für Marketing- und Unternehmensstrategien aufgezeigt. Der Begriff Date Science rückte zeitweise in den Hintergrund und lebt erst seit Big Data wieder auf.
Grund für das erneute Interesse an diesem Thema sind neuartige technologische Entwicklungen im Bereich analytischer Datenbanken und Analyse-Tools, die eine Datenauswertung erst ökonomisch sinnvoll machen. Lange Zeit war die Datenanalyse nur Thema der Forschung und großer Unternehmen und Konzerne, da die Kosten und Aufwände enorm waren.
Kleine und mittelständische Unternehmen konnten diese Möglichkeiten nicht ausschöpfen. Sie waren weiterhin auf manuelle Analysen und begrenzte Möglichkeiten durch Tabellenkalkulationsprogramme angewiesen. Durch das Cloud Computing, Software-as-a-Service und die zunehmende Entwicklung von Open Source Lösungen bei Datenbanken und Analyse Software, gab es einen neuen Impuls für die Data Science.
Data Science - Strukturierung und Auswertung von Unternehmensdaten
Die Ansätze zur Anwendung der Data Science sind vielfältig. Sie spielt besonders in der explorativen Suche nach korrelierenden Dateneigenschaften eine große Rolle. Dabei sind Verfahren des Data Mining und des Text Mining sehr beliebt geworden. Bei diesen findet eine automatisierte Analyse von Datenbeständen statt, diese generiert Antworten auf eine bestimmte Fragestellung. Das Entdecken neuer und noch unbekannter Zusammenhänge steht im Vordergrund.
Ein weiterer, immer bedeutenderer Ansatz ist der Einsatz der Datenanalyse bei der Erstellung von Prognosen, Stichwort Predictive Analytics, bestimmter Unternehmens- und Umweltkennzahlen (z. B. Absatzprognose, Konsumentenverhalten). Hier ist es die Aufgabe des Data Scientist die Entwicklungen im Unternehmensumfeld frühzeitig mittels Extrapolation von bekannten Daten zu erkennen.
Weiterführende Artikel
- Data Science Prozess