Meta-Data Management

Unter dem Begriff Meta -Data Management (dt. Metadaten), versteht man Daten, die wichtige Informationen über andere Daten enthalten. Dabei enthalten sie jedoch nicht die Daten selbst. Die sogenannten Metadaten können verschiedenster Art sein. Dazu gehören zum Beispiel Datenbanken und Dateien in Form von Büchern oder Dokumenten. Die Angaben über ein Einzelnes Objekt, wie die Personennamen, werden als Metadaten bezeichnet.

Um ein explizites Beispiel zu nennen, kann man zum Beispiel die Datei eines Buchs in Augenschein nehmen. Die typischen Metadaten dabei wären: der Autor, das Erscheinungsjahr, die Auflage, die ISBN und der Verlag. Einer Computerdatei können folgende Metadaten zugeordnet werden: der Dateiname, das letzte Änderungsdatum und die Zugriffsrechte.

Verwendung von Meta-Daten

Die Verwendung von Metadaten ist oft mit der Speicherung und Findung dieser verbunden. In einigen Fällen findet jedoch keine genaue Trennung zwischen der Objekt und der Metaebene der Daten statt. Die Nutzung der Metadaten sollte eng mit der Kopplung zwischen den Nutzdaten verlaufen. Die untrennbaren Bestandteile der Daten sind hierbei das wichtigste im System.

Im Allgemeinen kann zwischen den Metadaten und den Daten unterschieden werden. Dabei wird der Begriff Zweck benötigt. Um in der Lage sein zu können den Zweck für bestimmte Daten zu bestimmen, braucht man Kenntnisse über den Zweck. Damit so ein bestimmtes Ereignis erreicht werden kann, braucht man die Metadaten. Metadaten können auch Teil des Ergebnisses sein.

Zur Veranschaulichung kann wieder das Beispiel des Buchs herangezogen werden: Es wird nach allen Orten des bestimmten Buches eines bestimmten Autoren gesucht. Metadatei ist der Name des Autors. Ergebnis ist die Signatur (Standort).

Gerade in der Transformation zur Digitalisierung in Unternehmen ist es besonders wichtig, den Lebenszyklus von Daten nachvollziehen und steuern zu können. Im Digital Enterprise Management gilt es also gezielt  die Steuerung von Daten mittels Metadaten zu implementieren.

 

 

Data-Lineage

Datenherkunft – Klarheit im Zeitalter der Digitalisierung

Wenn von Data-Lineage gesprochen wird, dann ist damit die Datenherkunft von bestimmten Datensätzen gemeint. Genauer gesagt geht es hierbei darum, wie die vorherigen Datensätze, von denen die aggregierten Datensätzen in einem Datenlager bzw. „Data-Warehouse-System abstammen, ausgesehen haben oder besser gesagt diese ursprünglichen Datensätze generell zu ermitteln.

Data-Lineage – Der etwas andere Weg

Im Regelfall läuft es so ab, dass aus einem Datenlager Daten von verschiedenen Herkunftsorten extrahiert werden. Anschließend werden diese gewonnen Daten nach einem vorgegebenen Prozess transformiert und abschließend für eine Analyse bereitgestellt.
Beim Data-Lineage läuft es allerdings so ab, dass die andere „Fahrtrichtung“ eingeschlagen wird, um von den Ergebnissen der Analyse die Herkunftsorte ermitteln zu können. Hierbei werden die, vorher bereits erwähnten, Transformationen auf mathematische Art modelliert und dadurch werden die passenden Eingabewerte bestimmt, die zu den gegebenen Ausgabewerten einer Transformation gehören.

Diese erwähnten Transformationen lassen sich in drei Kategorien einteilen. Es wird zudem angenommen, dass diese Transformationen deterministisch und stabil sind. Das bedeutet, dass die Ausgabe konstant ist und keine neuen Ausgabeobjekte entwickelt werden.

Die drei Arten der Transformation

Eine Art der Transformation ist die sogenannte „Blackbox“. Über diese lassen sich keine speziellen Eigenschaften angeben.Jede Komponente der Ausgabe kann von jeder beliebigen Komponente der Eingabe abhängen. Bei einer Blackbox handelt es sich also um eine Funktion, die die Abweichung vom Mittelwert einer beliebigen Zahl einer Menge angibt.

Bei einem „Dispatcher“ handelt es sich um eine Transformation, die alle Komponenten einer Eingabe behandelt. Dabei sind diese Komponenten bzw. Elemente völlig unabhängig voneinander. Es können unendlich viele Ausgabeelemente erzeugt werden und zwar von jedem Eingabeelement.

Eine weitere Art der Transformation ist der „Aggregator“. Hierbei ist jedes Eingabeelement an einem oder auch mehreren Ausgabeelementen beteiligt. Zusätzlich lässt sich die Eingabe in disjunkte Partitionen aufteilen. Dadurch wird je eine Partition für ein bestimmtes Ausgabeelement verantwortlich.

 

Schreibe einen Kommentar