l’Importance de la gourvenance des données dans l’entreprise

Ce premier quart du XXIe siècle se définit comme la consécration d’un monde ou les informations sont omniprésentes. Les données constituent le socle de base de toute cette information. Aujourd’hui les entreprises sont submergées par les données venant de sources diverses et à production rapide et volumétrique de données, il peut s’agir de caractère alpha numérique, d’image, de vidéo, de lien hypertexte et divers autres format numérique de données. Comment tirer parti de ce monde changeant dans les entreprises et les organisations ? Comment allez au-delà du simple département informatique pour avoir une compréhension holistique en terme de données au niveau global ? 

Qu’est-ce qu’on entend par la gouvernance des données ?

La gouvernance des données est un ensemble de politique prise de manière consciente et méthodique par une organisation pour aboutir à l’exploitation optimale des données dans le but de faciliter une meilleure performance de l’institution. D’un autre côté, il faut préciser que la gouvernance des données ne se réduit nullement à des systèmes de gestion de données mais plutôt à un ensemble de bonnes pratiques, de règles et de procédures que les normes soient respectées au quotidien au sein de l’organisation. Ainsi la gouvernance des données peut être vu comme un Framework permettant d’appréhender les données de l’entreprise ou de l’organisation.

Il est important de souligner dans cette mise en contexte que la gouvernance des données commence déjà à montrer des résultats clairs au niveau des entreprises. D’après un rapport de Capgemini Research Lab en 2020, 39% des chefs d’entreprises utilisent des informations basées sur les données pour avoir un avantage durable sur la concurrence. Bien que le fait d’utiliser les données soit minoritaire il est néanmoins important de souligner que d’après le même rapport les entreprises qui utilisent les données pour prendre des décisions ont connu une croissance supérieure de 22% en moyenne par rapport aux autres.

Comment comprendre les données au sein d’une entreprise ?

Depuis les années 1980, il devient presqu’une évidence d’avoir un département informatique au sein d’une entreprise, car avec l’avènement du micro-ordinateur un nombre croissant d’entreprise décide d’informatiser leur base de données et aussi d’automatiser certaines opérations comme les ventes, les commandes de matières première ou de tout autres marchandises. Mais aujourd’hui le flux des données devient plus important car il couvre l’ensemble des départements de l’entreprise. Une illustration simple permet de mieux appréhender comment l’entreprise peut suivre un vendeur par exemple : Un vendeur peut être suivi pour sa performance de vente par le département des ventes, ce département peut croiser ses données avec celles des ressources humaines pour suivre l’historique de la ponctualité, des jours de congés et d’autres informations pertinentes sur l’employé. Aujourd’hui, avec l’explosion des réseaux sociaux le département des ventes peut faire des corrélations entre la performance du vendeur et son style de vie social, il est même possible à l’entreprise de cibler directement les amis et connaissances du vendeur par le marketing social. Pour arriver à ce niveau de connexion il est essentiel d’avoir une gouvernance des données bien établi qui capture les informations essentielles pour arriver à ce niveau de performances. Il est donc nécessaire d’établir un flux de données qui répond de manière judicieuse au besoin en terme de croissance ou de performances de l’entreprise ou de l’organisation.

Etablir le flux des données qui répond aux exigence et au besoin de l’entreprise ou l’organisation en terme de croissance est essentiel pour profiter des avancées technologiques actuelles qui permet de croiser un nombre important de source de données différentes. L’établissement du flux de données est un élément de base dans le processus de la gouvernance des données.

Que requiert la gouvernance des données en terme de technologie de base ?

La gouvernance des données requiert l’utilisation d’un ensemble d’outils technologiques de la collecte des données à la visualisation de ces dernières en passant par la définition des données (Metadata) et la définition des rôles pour la production et la consommation des données.

Outils d’acquisition et de stockage de données

Suivant la taille de l’entreprise, la collecte des données peut aller de simple tableur (Excel par exemple) à des applications dans le monde infonuagiques (Cloud) ou des alimentations automatiques via les emails ou les réseaux sociaux. Une fois l’acquisition de données défini et les types de donnée qui intéresse l’entreprise pour sa bonne marche sont établi il convient de stocker les données. Aujourd’hui le stockage des données se délocalise de plus en plus dans les nuages à travers diverses plateformes, dont les plus connues : AWS d’Amazon, Azure cloud de Microsoft et GCP de Google. Le stockage est un élément clé de la gouvernance des données car le stockage assure la pérennité et l’accessibilité des données. Hors de cadre de cet article de faire le plaidoyer pour le stockage en cloud mais cette méthode de stockage va se trouver plus avantageux pour toute organisation qui veut tirer profit de manière optimale des données, en considérant que divers types de données de la plupart des organisations sont déjà de manière inhérente disponible depuis le cloud (Les emails et les informations des réseaux sociaux pour ne citer qu’elles) il est donc de plus en plus important pour la bonne gouvernance de données de prioriser le cloud sur les serveurs de stockage sur site.

Assignation des droits, des rôles sur le flux de données et système de gestion de données.

Désormais, le département informatique n’est plus le seul roi dans la jungle des données ; de plus en plus les autres départements d’une entreprise sont dépendant des données pour prendre les décisions il est clair qu’il faut bien penser à assigner des rôles de gestionnaires de données et de visualisation des données bien au-delà du département informatique. Dans le cadre actuel, il est important de noter que les données ne sont pas du tout stockées dans un système de gestion de base de données unique, dans la réalité les données seront éparses et distribuées sur des plateformes multiples et dans des formats variés.

L’un des défis de la gouvernance des données est de pouvoir prendre des décisions se basant sur des données sans nécessairement changer le flux d’acquisition de données de l’organisation d’où la notion de ETL, qui signifie pour les non-initiés (Extract, Treat, Load) : Extraire, traiter et charger les données dans des entrepôts de données dans le but de pouvoir les utiliser plus tard pour les opérations de d’Intelligence de Business (BI). Un outil propriétaire comme PowerBI et le langage DAX sont des outils essentiels du processus ETL.

Avoir une base de données décisionnelle est aussi un outil important de la gouvernance des données car c’est le point d’arrivée des données nettoyées et recoupé qui va permettre la prise de décision sur basant sur les données réellement existantes au sein de l’entreprise. Ce travail c’est l’affaire des développeurs BI. Avoir des développeurs BI en entreprise est une étape déterminante dans le processus d’établir une gouvernance de données efficace.

Mise en place de la gouvernance des données

Quelques soit la taille de l’entreprise ou de l’organisation, il est essentiel de mettre en place une structure pour la gouvernance des données. Le responsable de la gouvernance de données d’une entreprise se nomme Chief Data Officer (CDO). Le CDO est rattaché directement au CEO ou la Direction Générale de l’organisation, son rôle est de diriger la gouvernance des données de l’entreprise. Dans le cas de PME ou de petite organisation le CDO peut cumuler d’autres poste dans l’organisation soit au sein du département informatique ou ailleurs. Le CDO a la responsabilité de la stratégie sur l’équipe de gestionnaire/développeur de données mais au-delà de l’informatique il est aussi dans l’élaboration des règles et des politiques de circulation des données de l’organisation. En général son équipe stratégique de collaborateur comprend :

– Les développeurs et intégrateurs de données

– Les développeurs BI

– Les chefs des divers départements de l’organisation

Les avantages de la gouvernance des données

L’un des avantages les plus évidentes de la gouvernance des données c’est de permettre des prises de décision basé sur les statistiques ou sur le machine Learning. Il s’agit d’éviter de plus en la navigation à vue des CEO lors des conseils de direction sur les stratégies à mettre en place pour l’avenir de l’entreprise. D’un autre coté une bonne gouvernance de données permet une gestion plus rationnels des ressources de l’entreprise. Tout le monde y gagne, meilleurs produits ou services pour les consommateurs, meilleurs ambiance de travail pour les collaborateurs et meilleurs retour sur investissement pour les investisseurs.

Nouveau monde

Nous sommes dans un monde nouveau, ou les informations nous entoure et nous sommes nous-même devenus des données. Ce monde est régi par de nouvelles règles et normes que nous ne pouvons plus ignorer en entreprises, organisation ou dans notre vie quotidienne. Ce monde c’est le monde du numérique, de la quantification de toute choses, même de nos émotions (ce sera probablement le titre d’un prochain article) alors bienvenue pour une nouvelle gouvernance basée sur les données.

Jean Came POULARD