Archive | Oktober 2013

Data Scientist – eine neue Rolle ?

Neben Big Data als technologischen Ansatz wird auch die Rolle des Data Scientist immer wieder als neu und cool genannt.

Ich möchte an der Stelle eine Diskussion zur Begrifflichkeit des Data Scientist beginnen. Darum bitte ich, meine folgenden Aussagen nicht als Absolutum, sondern als Startpunkt einer hoffentlich interessanten Diskussion zu sehen.

Zwei Aspekte aus vielen, welche noch folgen werden, sind es heute, die ich ansprechen möchte: Zum einen die Frage, was an der Rolle so neu ist (Business Intelligence, die etablierten Prozesse und die entsprechenden Rollen gibt es ja bereits längere Zeit) und zum anderen die Überlegung ob es sich bei Data Science um eine einzelne Rolle handeln kann.

Bei Data Science handelt es sich nach meinem Empfinden um eine Disziplin, die aus vier einander ergänzenden Rollen besteht. Je nach Unternehmensgröße wird eine Person eine, mehrere oder alle dieser Rollen übernehmen. Ich finde es aber sehr wichtig immer unter der übergeordneten Prämisse von Data Science zu bleiben, selbst wenn man nur eine Rolle inne hat muss man die anderen Rollen tief verstehen. Bei den Rollen handelt es sich um:

  • Data Manager: Das ist eine sehr technische Aufgabe und umfasst es Lösungen zum Sammeln, Transformieren, Speichern, bereinigen und Analysieren von Daten bereitzustellen. Die Veränderung zu bestehenden Aufgaben resultiert aus der technologischen Weiterentwicklung in Form neuer Produkte (z.B. Hadoop, NoSQL, HANA) bzw. der funktionalen Erweiterung bestehender Analysesysteme. Die technischen Möglichkeiten wo/wann analytische Schritte gesetzt werden hat sich erweitert als dass einzelne Schritte im eigenen Rechenzentrum oder aber in der Cloud durchgeführt werden können. So muss der Inhaber dieser Rolle den besten Weg finden, diese Aufgaben effizient, zeitnahe, ohne die Poduktionssysteme zu beeinträchtigen und kostengünstig abzudecken. Das ist also keine neue Rolle sondern eine bestehende Rolle mit einer deutlich angewachsenen Bandbreite.
  • Data Analyst: Der Inhaber dieser Rolle hat als Aufgabe Einsichten in die Daten zu schaffen. Die Aufgabe ist es, die richtigen Fragestellungen mit passenden Methoden, Algorithmen, Mustererkennung und Big-Data Methoden in Verbindung zu bringen. Diese Rolle ist nötig, weil sich das professionelle Umfeld verändert hat. Bis dato wusste der Fachbereich in klassischer Business Intelligence was er wie ausgewertet braucht. Heute, nicht erst mit Big Data ist es so, daß dem Fachbereich vielmehr ein Problem oder eine Frage bewusst ist, für die eine Lösung aus dem umfangreichen Methodenschatz benötigt wird. Das ist eine neue Rolle, die gebraucht wird. Wer aber bisher ein guter BI-Analytiker war, und den Blick über den Tellerrand hatte nimmt die Rolle bereits ein, auch wenn sie noch nicht den Namen hatte.
  • Data Artist ist im Kontext der Analytik eine neue Rolle. Spätestens seit den ersten Big-Data Darstellungen war klar, dass der analytische Output nicht immer ein Report ist. Der Data Analyst hilft dabei aus einem weiten Feld der technisch-optisch möglichen Darstellungsmöglichkeiten die beste für die offenen Fragen zu finden. Im Business Intelligence Bereich beschränkte sich das Thema der Darstellung häufig darauf Reports oder Dashboards schöner erscheinen zu lassen – diese Rolle geht deutlich darüber hinaus.
  • Data Establisher ist eine Rolle, die bestehende Aufgaben erweitert. Der Business Analyst oder Requirements Engineer kennt jetzt schon die Prozesse, das Business sehr gut, häufig aber abgegrenzt auf die konkrete analytische Aufgabe. Aber echte Data Science ist umfangreicher und eine 2-Weg Aufgabe. Einerseits ist darin gefordert in die tiefe der Prozesse zu gehen, sie umfassend zu verstehen aber auch Erkenntnisse der Analytik wieder zurück in den Prozess zu bringen.  Es ist also eine klare Weiterentwicklung einer bestehenden Rolle.

Data Science als Ganzes ist eine neue Disziplin, die aus neuen und erweiterten Rollen unter einem umfassenden Paradigma besteht.

Advertisements