Alles, was Sie schon immer über Data Lineage wissen wollten
Guillaume Bodet - CEO - Zeenea
Entdecken Sie alle Geheimnisse und Best Practices des Data Lineage und laden Sie unseren kostenlosen Leitfaden herunter: "Alles, was Sie schon immer über Data Lineage wissen wollten".
Overview
Data Quality usually refers to a company’s ability to ensure the longevity of its data. At Zeenea (a data catalog provider), we believe Data Quality is ensured through the 9 following dimensions - all essential to extract value to your company:
🔸 Completeness
🔸 Accuracy
🔸 Validity
🔸 Uniqueness
🔸 Consistency
🔸 Timeliness
🔸 Traceability
🔸 Clarity
🔸 Availability
We will detail these dimensions with the help of a simple example in part one. We will then elaborate on how Data Quality management is an important challenge for organizations seeking to extract maximum value from their data.
We will also draw parallels between these different Data Quality dimensions and the different risk management phases to overcome - identification, analysis, evaluation, and processing. This will enable you to hone your risk management reflexes by tying in Data Quality improvement processing to a company objective (and evaluating the ROI on each quality dimension).
Once we have established the main features of an enterprise Data Quality management tool, we will detail how a Data Catalog - though not a Data Quality tool - can contribute towards Data Quality improvement (through the clarity, availability, and traceability dimensions mentioned above).
Vorstellung
Als CEO und Director of Product Management bei Zeenea, einem Datenkatalog-Anbieter der neuesten Generation, spreche ich oft mit Kunden, Interessenten oder Partnern über ihre Erwartungen an das Metadaten-Management.
In unseren Diskussionen kommt ein Thema immer wieder zur Sprache: Data Lineage.
Das Thema scheint allgegenwärtig zu sein. Ganz egal in welcher Branche wollen die Beteiligten einer Datenorganisation wissen, woher die Daten kommen (Upstream Lineage) und wohin sie gehen (Downstream Lineage). Und das aus gutem Grund.
Lineage ist eines von vielen Metadaten und sollte daher ein wesentlicher Bestandteil jeder Metadaten-Management-Lösung bzw. jedes Datenkatalogs sein. Doch wie so oft verbirgt sich hinter einer einfachen Frage eine komplexe Welt, die nur schwer zu erfassen ist.
Diese Komplexität ist meines Erachtens auf mehrere Faktoren zurückzuführen
💡 Erstens ist die Frage zwar immer dieselbe, aber die erwartete Antwort fällt je nach Gesprächspartner sehr unterschiedlich aus.
💡 Der zweite Punkt ist eher operativ - Wie können wir die enorme Menge an Lineage-Informationen erfassen, pflegen und aktualisieren?
💡 Ein letzter Punkt ist ergonomischer Natur - Wie kann diese Menge an Informationen bekömmlich und stichhaltig dargestellt werden?
Auf jene Aspekte möchte ich im weiteren Verlauf dieses Papers eingehen, wobei ich jedes Mal die von uns bei Zeenea verfolgten Ansätze erläutern werde.