E-BOOK

Glossaire Métier : composant essentiel du Data Catalog des entreprises data fluents

"Un bon outil de Data Catalog doit proposer une solution pour administrer les concepts métier, permettre de les lier aux assets techniques qui implémentent ces concepts, et ainsi ouvrir l’utilisation du catalogue à l’échelle de l’entreprise."

business-glossary-data-sheet-FR

Overview

Data Quality usually refers to a company’s ability to ensure the longevity of its data. At Zeenea (a data catalog provider), we believe Data Quality is ensured through the 9 following dimensions - all essential to extract value to your company:

🔸 Completeness

🔸 Accuracy

🔸 Validity 

🔸 Uniqueness

🔸 Consistency

🔸 Timeliness

🔸 Traceability

🔸 Clarity

🔸 Availability


We will detail these dimensions with the help of a simple example in part one. We will then elaborate on how Data Quality management is an important challenge for organizations seeking to extract maximum value from their data.

We will also draw parallels between these different Data Quality dimensions and the different risk management phases to overcome - identification, analysis, evaluation, and processing. This will enable you to hone your risk management reflexes by tying in Data Quality improvement processing to a company objective (and evaluating the ROI on each quality dimension).

Once we have established the main features of an enterprise Data Quality management tool, we will detail how a Data Catalog - though not a Data Quality tool - can contribute towards Data Quality improvement (through the clarity, availability, and traceability dimensions mentioned above).

Présentation

Lorsqu’on met en place un data catalog, la première étape est généralement de connecter ce catalogue à une ou plusieurs sources de données, aux systèmes physiques sur lesquels sont stockés les actifs et d’en faire l’inventaire. Cet inventaire constitue l’étape nécessaire pour obtenir un premier niveau d’informations : système de stockage, emplacement, modalités d’accès, formats, types, etc.

Grâce à des solutions d’automatisation, un certain nombre d’informations sont ainsi récupérées et permettent d’obtenir assez souvent une documentation technique détaillée de ce que contient le système d’information. Les solutions standards de data catalog permettent ensuite à des utilisateurs avertis de compléter cette documentation en y ajoutant des attributs de classification, afin de décrire plus spécifiquement l’écosystème technique de l’entreprise.

Cependant, si ces informations permettent de répondre à certaines questions des interlocuteurs les plus techniques (ingénieurs, architectes, etc.), elles restent généralement obscures pour une population croissante de consommateurs du patrimoine de données dans l’entreprise. En effet, ces consommateurs ne peuvent ni exploiter, ni gouverner efficacement ces données.

Pour apporter tout le contexte nécessaire à la consommation de ces données, les utilisateurs ont besoin de différents types d’informations : organisationnelles, statistiques, conformité, etc.

 

En particulier, la documentation technique doit s’accompagner d’informations dites sémantiques. C’est l’objectif de l’implémentation d’un glossaire métier.

Ils nous font confiance


et bien d'autres encore...