Demo Support
English
Header Background Shapes Blue

Retour aux bases : Explications des Différents Types de Données de Référence

Par FX Nicolas, Directeur Produit chez Semarchy

La gestion des données est simple… à condition d’en avoir une vision globale !

Cet article donne un aperçu de la classification des données, décrit les différentes catégories de données de référence (élaboration de rapports, transactionnelles, données maîtresses, de référence et métadonnées), et explique l’impact des types de données de référence sur les décisions commerciales. Il explique également pourquoi les données maîtresses et de référence ont une importance critique au sein de cette organisation.

Les Catégories de Données

La classification suivante des données est communément acceptée dans le domaine de la gestion des données. Nous l’avons vue sous forme de bâtons, de pyramide, ou même de diamant, comme représenté ci-dessous. Peu importe la forme, la liste des éléments reste la même.

Jetons un coup d’œil à ces différentes catégories de données.

Les Données Transactionnelles

Les données transactionnelles décrivent les événements commerciaux. C’est le plus grand volume de données au sein d’une entreprise. Les exemples d’événements commerciaux incluent :

  • l’achat de produits auprès de fournisseurs,
  • la vente de produits aux clients,
  • l’expédition d’articles vers les sites clients,
  • l’embauche d’employés, la gestion de leurs vacances ou le changement de leurs postes.
Ad Banner - Manage Your Diverse Data With Ease

Vous gérez des données transactionnelles tous les jours ! Elles font tourner le monde de l’entreprise.

Les Données Transactionnelles sont généralement traitées dans des applications opérationnelles connues sous les acronymes CRM, ERP, SCM, RH, et autres.

Les données transactionnelles peuvent être très détaillées et forment le fondement de nombreux processus analytiques, offrant des aperçus précieux sur le comportement des clients, les opérations commerciales et les flux de revenus.

Les Données de Référence ( master data )

Les Master Data ou données de référence sont des informations commerciales clés qui supportent les transactions.

Les données « maîtres » ou de référence décrivent les clients, produits, pièces, employés, matériaux, fournisseurs et sites impliqués dans les transactions. Elles sont communément désignées comme Lieux (emplacements, géographie, sites), Parties (personnes, clients, fournisseurs, employés) et Choses (produits, articles, matériaux, véhicules).

Les données de référence ( master data ) existent déjà et sont utilisées dans les systèmes opérationnels, avec certains problèmes. Les master data dans ces systèmes sont :

  • des données de qualité médiocre,
  • éparpillées et dupliquées ;
  • pas réellement gérées.

Les Données de référence sont généralement créées et utilisées par les processus commerciaux existants de manière naturelle, au cours des opérations. Malheureusement, ces processus commerciaux opérationnels sont conçus pour un cas d’utilisation « spécifique à l’application » de ces master data et, par conséquent, manquent d’atteindre les exigences globales d’entreprise qui sont nécessaires dans l’utilisation commune des données de référence avec les applications disposant de standards de haute qualité et d’une gouvernance partagée.

Les Données de Référence ( Master Data en anglais )

Il s’agit de données qui sont référencées et partagées par plusieurs systèmes. La plupart des données de référence se rapportent à des concepts qui impactent soit les processus commerciaux – par exemple, le statut de commande (CRÉÉ | APPROUVÉ | REJETÉ | etc.) – soit sont utilisées comme une sémantique standardisée supplémentaire qui précise davantage l’interprétation d’un enregistrement de données – par exemple, la position professionnelle d’un employé (JUNIOR | SENIOR | VP | etc.).

Certaines données de référence peuvent être universelles ou standardisées (par exemple, Pays – ISO 3166-1). D’autres données de référence peuvent être « convenues » au sein de l’entreprise (statut des clients) ou d’un domaine commercial donné (classifications des produits).

Le logiciel de gestion des données de référence peut apporter les normes et règles essentielles pour garantir la cohérence et l’exactitude des données dans l’ensemble de l’organisation. Il facilite l’intégration des données et l’interopérabilité en offrant un cadre de classification harmonisé.

Les Données de Reporting

Les données de rapport sont, en un mot, des données organisées dans le but de dresser des rapports et d’en tirer de l’intelligence économique. Les données pour les rapports opérationnels, ainsi que les données pour les rapports d’entreprise (hautement agrégées), appartiennent à cette catégorie.

Les données de rapport sont créées à partir des données transactionnelles, des master data et des  Golden Data (ou également « points de vérité »). Elles offrent aux parties prenantes des aperçus précieux sur la performance commerciale, l’efficacité opérationnelle et les tendances du marché – en guidant donc les décisions stratégiques, en identifiant les insuffisances et en repérant les opportunités de croissance.

Les Métadonnées

Les Métadonnées sont des données qui décrivent d’autres données ; c’est la définition ou description sous-jacente des données, qui précise le contexte, le sens et l’utilisabilité. Des exemples de métadonnées incluent les propriétés d’un fichier multimédia : leur taille, leur type, leur résolution, leur auteur et leur date de création. Les applications logicielles, les documents, les feuilles de calcul et les pages web sont tous des exemples qui ont généralement des métadonnées associées. Les master data, les données de référence et les données de journal ont toutes des métadonnées liées.

Les métadonnées sont cruciales pour les activités de gestion des données telles que l’intégration, l’intendance (stewardship) et la gouvernance.

Le Big Data  

Le Big Data a de nombreuses définitions, mais la plus courante nous vient de Doug Laney de chez Gartner. Il a caractérisé le « big data » par 3Vs : volume, variété et vitesse. Par nature, le big data ne peut pas être maintenu efficacement avec les technologies traditionnelles. Tout simplement, il combine les quatre types de données précédents : les fichiers journaux ou logs, les données transactionnelles, les données de référence, les données de base.

Les Données Non Structurées

Les Données Non Structurées sont des données qui n’ont pas de structure prédéfinie. Ce type de données se réfère principalement aux données textuelles. Par exemple, un document PDF entre dans cette catégorie. Des domaines tels que le l’exploration de texte (Text Mining) peuvent extraire des données pertinentes et structurées à partir de documents non structurés.

Les Types de Master Data et leur Influence sur les Décisions Commerciales

Certaines catégories de données ont une grande importance et une influence majeure en façonnant directement les opérations et les décisions commerciales. Vous pouvez y voir des sortes de piliers qui soutiennent la structure commerciale et guident ses stratégies. Parmi celles-ci, trois types spécifiques de MDM – données clients, données produits et données financières – sont fondamentaux. Ils sont le fondement de toute organisation, et offrent des informations cruciales sur le comportement des clients, la performance des produits et la santé financière. Comprendre ces types de données et leurs utilisations au sein d’une entreprise est essentiel pour accéder à de nouvelles opportunités et stimuler la croissance commerciale.

  • Données Clients : Cette catégorie de données maîtres comprend des informations relatives aux clients telles que les coordonnées, l’historique d’achat et les préférences. Elle joue un rôle vital dans les ventes et le marketing, le service client et les analyses. De nombreuses entreprises utilisent des logiciels de Gestion des Données de Référence Clients pour contrôler cette information vitale.
  • Données Produits : Cette catégorie comprend des détails complets sur les produits et services, y compris les descriptions, les spécifications, les prix et la disponibilité. Elle est essentielle pour la gestion des stocks, les ventes, le marketing et les opérations de la chaîne d’approvisionnement (supply chain) – il est donc judicieux d’utiliser un logiciel de Gestion de Données de Référence de Produits.
  • Données Financières : Ce type concerne les transactions financières d’une entreprise, les comptes et les rapports. Le logiciel de Gestion de Données de Référence Financières aide les entreprises à garder le contrôle de leur santé financière et à respecter les exigences réglementaires.
  • Données Employés : Cela inclut les détails relatifs aux employés au sein d’une organisation, y compris les informations personnelles, l’historique de carrière, les compétences et les qualifications. Les données des employés sont cruciales pour la gestion RH, le traitement des salaires, le développement des compétences et la mise en conformité. De nombreuses entreprises utilisent des logiciels de Gestion de Données de Référence des Employés pour maintenir un registre du personnel précis et actualisé.
  • Données de Localisation : Cette catégorie concerne les détails sur différents emplacements géographiques pertinents pour une organisation, y compris les adresses, les coordonnées et les informations spécifiques des sites. Essentiel pour la logistique, la gestion des locaux et l’analytique basée sur la localisation, le logiciel de Gestion de Données de Référence de Localisation est un outil précieux.
  • Données sur les Actifs : Ce type de données comprend des détails sur les actifs détenus ou exploités par une entreprise, y compris les descriptions, les spécifications, les calendriers de maintenance et les valeurs d’amortissement. Ces données sont essentielles pour le suivi des actifs, la planification de la maintenance et la comptabilité financière, en utilisant un logiciel de Gestion de Données de Référence d’Actifs.
  • Données sur les Matériaux : Cette catégorie de données de référence comprend des informations liées aux matériaux ou ressources utilisés dans les opérations d’une entreprise, y compris les descriptions des matériaux, les propriétés, les quantités, les fournisseurs et les coûts. Le logiciel de Gestion de Données de Référence de Matériaux peut gérer efficacement ce type de données.
  • Données sur les Fournisseurs ou Vendeurs : Cela concerne toutes les informations associées aux fournisseurs ou vendeurs engagés par une entreprise, y compris les coordonnées, les termes contractuels, l’historique des performances et les certifications. Le logiciel de Gestion de Données de Référence de Fournisseurs peut gérer ce type de données aisément.

Des types de Master Data comme ceux-ci sont essentiels pour prendre les décisions commerciales en offrant des aperçus complets et précis sur des aspects essentiels de l’entreprise.

Alors, quel est le problème avec les Master Data (ou données de base) ?

Comme indiqué plus tôt, les données de référence sont souvent générées (créées) et utilisées dans des systèmes opérationnels mais ne sont pas toujours assez précises et complètes pour répondre à tous les besoins.

Par exemple, un processus (ou application) de commande de dispositif téléphonique irait probablement au-delà de la simple collecte de données liées à la commande. Les adresses de facturation et d’expédition de la partie passant la commande seraient également fournies. Mais l’adresse e-mail, étant donné qu’elle n’intervient pas dans ce processus, ne serait probablement pas créée. Un processus d’inscription web se concentrerait sur la qualité de l’adresse e-mail, mais ne garantirait pas la qualité du numéro de téléphone, etc. Les données saisies dans ces applications sont en effet adaptées à chaque scénario et cas d’utilisation spécifique à chaque application. Mais au niveau de l’entreprise, de telles données maîtresses de clients devraient inclure des adresses de facturation/expédition précises ainsi qu’une adresse e-mail et un numéro de téléphone valides.

Dans l’organisation des données, les données transactionnelles et de rapport dépendent des données de base (et de référence). Par conséquent, des « mauvaises master data » transparaissent directement dans des rapports non fiables et une inefficacité opérationnelle.

Les Points de Vérité (Golden Data)

Maintenant, imaginez une base de données hébergeant des dossiers de clients (ou produits, employés, sites) avec :

  • Toutes les informations pertinentes (agrégées à partir des diverses sources opérationnelles),
  • Uniquement des informations valides (pas d’adresses incorrectes ou d’e-mails non délivrés),
  • Pas de doublons.

Cette base de données constituerait les Point de Vérité (Golden Data). Les points de vérité sont une version nettoyée, dédoublonnée, consolidée et validée des Master Data originales. Certaines personnes les appellent la « Version Unique de Vérité » ou la « Vue à 360° du Client ».

Comme vous pouvez l’imaginer, ces points de vérité ont une valeur énorme pour les applications (BI, opérationnelles ou autres). Elles révèlent également d’autres défis, qui seront abordés dans de futurs articles.

Réunissez le tout : Plateforme Unifiée Semarchy Data Platform

La Plateforme Unifiée Semarchy Data Platform rassemble des informations qui existent dans l’ensemble des applications de sorte qu’elles puissent être gouvernées, maîtrisées et gérées de manière centralisée, compréhensible et non disruptive.

Pour en savoir plus sur la façon dont le Data Hub répond aux défis de la gouvernance collaborative des données, de la maîtrise et de la référence des données de l’entreprise, téléchargez la fiche technique du Hub Intelligent.

Fiche Technique du Data Hub