Archive | Juni 2014

zurück zu den Data-Science Wurzeln

Im Bereich der Data Science beschäftigen wir uns mit Methoden und Ansätzen Muster zu finden, die Zukunft zu prognostizieren oder Einsicht in die Daten zu gewinnen. Dabei denken wir an Technologien wie Data Mining, Big Data und Pattern Detection oder Algorithmen und Modelle.

Aber heute möchte ich einmal auf eine extrem wichtige Thematik eingehen, an die man in diesem Kontext nur selten denkt.

Und zwar geht es um ein umfassendes (business) Metadata Management. Ein Thema das Sie sicher schon oft gehört haben und das auch in vielen größeren Unternehmen (meist als akademische Funktion) umgesetzt wurde. Bei genauerer Betrachtung ist es jedoch so, daß genau diese Arbeit den Erfolg oder Misserfolg jeder BI/Analytik Initiative maßgebend mitbestimmt. Darum ist dieses Metadatenmanagement für JEDES Unternehmen welches analytische Lösungen plant oder betreibt unerlässlich ist.

Warum das so ist und wie umfangreich dieses Thema ist möchte ich nun darstellen. Bei der Begriffskombination Metadaten und Analytik denken wir üblicherweise an KPIs o.Ä. – aber diese sind eigentlich die Spitze der Pyramide.

Die Bedeutung dieses Themas für die gesamte Analytik beginnt bei einem eindeutigen Vokabular. Damit sind nicht (nur) die Begriffe und Objekte, welche ausgewertet werden gemeint sondern die in dem Umfeld verwendeten Begriffe mit verschiedener Belegung. Beispielsweise erlebte ich die Situation in welcher ein bereich einen Definitionsunterschied zwischen Vorschau und Forecast machte während ein anderer bereich des gleichen Unternehmens die beiden Begriffe synonym verwendete.

Das führt weiter zu einer klaren Festlegung der Report-Items. Damit meine ich die Objekte, auf welche reportet bzw. analysiert wird. Wie ist Objekt x definiert und abgegrenzt, was ist enthalten, was nicht und wie passt sich das alles in eine Begriffshirarchie ein. Wenn von einem Objekt gesprochen wird sollten alle Beteiligten das Gleiche darunter verstehen – denkt man. Ich selbst habe bei einem Aviation-Projekt unter dem begriff Landezeitpunkt eines Flugzeuges vier verschiedene Definitionen vorgefunden. Neben der klaren Definition und Abgrenzung im Unternehemen sollte an der Stelle auch weiter geblickt werden und Standards, Best Practices o.Ä, herangezogen werden um einen firmenübergreifende Vergleichbarkeit sicherzustellen (Benchmarking).

Zu guter Letzt möchte ich auf die Metriken eingehen. Egal ob es sich um PI, KPI, RI, KRI,.. handelt (dieses Thema werde ich einem der folgenden Blogs aufarbeiten) gilt es sicherzustellen, dass die Formeln, Filterungen, Einheiten, Aggregationen etc. klar festgelegt sind und im Unternhemen bzw. über Unternehmensgrenzen hinweg die neutrale Vergleichbarkeit sicherstellen.

Zusammengefasst – klare Metadaten im analytischen Bereich sind die unerlässliche Basis für vertrauenswürdige und vergleichbare analytische Ergebnisse. Aus diesem Grund sollte das Metadatenmanagement nicht als Randthema gesehen werden sondern zum integralen Bestandteil der Analytik werden.

Advertisements