skip to content

Qu'est-ce que la gouvernance des données et pourquoi est-elle importante ?

Nicolas Verlhiac : photo de l'auteur de l'article
Nicolas Verlhiac
Gérez vos données pour une meilleure fiabilité et sécurité. Notre guide sur la gouvernance des données complet sur la gouvernance des données.

La gouvernance des données (ou Data Governance - DG) est le processus de gestion de la disponibilité, de la facilité d’utilisation, de l’intégrité et de la sécurité des données dans les systèmes d’entreprise.

Une gouvernance des données efficace garantit que les données sont cohérentes et dignes de confiance et qu’elles ne sont pas mal utilisées.

Elle est de plus en plus importante, car les entreprises doivent faire face à de nouvelles réglementations en matière de confidentialité des données et s’appuient de plus en plus sur l’analyse des données pour optimiser les opérations et prendre des décisions commerciales.

Un programme de gouvernance des données bien conçu comprend généralement une équipe de gouvernance, un comité de pilotage qui fait office d’organe directeur, et un groupe de responsables des données. Ils travaillent ensemble pour créer les normes et les politiques de gouvernance des données, ainsi que les procédures de mise en œuvre et d’application qui sont principalement exécutées par les responsables des données. Idéalement, les cadres et autres représentants des activités commerciales d’une organisation y participent, en plus des équipes informatiques et de gestion des données.

Si la gouvernance des données est une composante essentielle d’une stratégie globale de gestion des données, les organisations doivent se concentrer sur les avantages commerciaux attendus d’un programme de gouvernance pour qu’il soit couronné de succès.

Ce guide complet sur la gouvernance des données explique plus en détail ce qu’elle est, comment elle fonctionne, les avantages commerciaux qu’elle procure, les meilleures pratiques et les défis de la gouvernance des données. Vous trouverez également un aperçu des logiciels de gouvernance des données et des technologies connexes qui peuvent contribuer au processus de gouvernance.

Pourquoi la gouvernance des données est-elle importante ?

Sans une gouvernance efficace des données, les incohérences des données dans les différents systèmes d’une entreprise risquent de ne pas être résolues. Par exemple, les noms des clients peuvent être répertoriés différemment dans les systèmes de vente, de logistique et de service à la clientèle. Cela peut compliquer les efforts d’intégration des données et créer des problèmes d’intégrité des données qui affectent la précision des applications de veille stratégique (BI), de reporting d’entreprise et d’analyse. En outre, les erreurs de données peuvent ne pas être identifiées et corrigées, ce qui affecte encore plus la précision de la BI et des analyses.

Une mauvaise gouvernance des données peut également entraver les initiatives de conformité réglementaire. Cela pourrait poser des problèmes aux entreprises qui doivent se conformer au nombre croissant de lois sur la confidentialité et la protection des données, comme le GDPR de l’Union européenne et le California Consumer Privacy Act (CCPA). Un programme de gouvernance des données d’entreprise comprend généralement le développement de définitions de données communes et de formats de données standard qui sont appliqués dans tous les systèmes d’entreprise, ce qui renforce la cohérence des données pour les utilisations commerciales et de conformité.

Objectifs et avantages de la gouvernance des données

L’un des principaux objectifs de la gouvernance des données est de supprimer les silos de données dans une organisation. Ces silos se forment généralement lorsque des unités commerciales individuelles déploient des systèmes de traitement des transactions distincts sans coordination centralisée ni architecture de données d’entreprise. La gouvernance des données vise à harmoniser les données de ces systèmes par le biais d’un processus collaboratif, auquel participent les parties prenantes des différentes unités commerciales.

Un autre objectif de la gouvernance des données est de garantir que les données sont utilisées correctement, à la fois pour éviter d’introduire des erreurs de données dans les systèmes et pour bloquer l’utilisation abusive potentielle de données personnelles sur les clients et d’autres informations sensibles. Cela peut être réalisé en créant des politiques uniformes sur l’utilisation des données, ainsi que des procédures pour surveiller l’utilisation et appliquer les politiques en permanence. En outre, la gouvernance des données peut aider à trouver un équilibre entre les pratiques de collecte des données et les mandats de protection de la vie privée.

Outre des analyses plus précises et une meilleure conformité réglementaire, les avantages de la gouvernance des données comprennent l’amélioration de la qualité des données, la réduction des coûts de gestion des données et l’amélioration de l’accès aux données nécessaires pour les spécialistes des données, les autres analystes et les utilisateurs professionnels. En fin de compte, la gouvernance des données peut contribuer à améliorer la prise de décision en fournissant aux dirigeants de meilleures informations. Idéalement, cela conduira à des avantages concurrentiels et à une augmentation des revenus et des bénéfices.

Qui est responsable de la gouvernance des données ?`

Dans la plupart des organisations, plusieurs personnes sont impliquées dans le processus de gouvernance des données. Il s’agit notamment des dirigeants d’entreprise, des professionnels de la gestion des données et du personnel informatique, ainsi que des utilisateurs finaux qui connaissent les domaines de données pertinents dans les systèmes de l’organisation. Voici les principaux participants et leurs principales responsabilités en matière de gouvernance.

Directeur des données (Chief data officer). Le directeur des données (CDO) - s’il y en a un - est souvent le cadre supérieur qui supervise le programme de gouvernance des données et assume une responsabilité de haut niveau quant à son succès ou son échec. Le rôle du CDO consiste notamment à obtenir l’approbation, le financement et la dotation en personnel du programme, à jouer un rôle de premier plan dans sa mise en place, à suivre son évolution et à le défendre en interne. Si une organisation ne dispose pas d’un CDO, un autre cadre de la C-suite fera généralement office de sponsor exécutif et assumera les mêmes fonctions.

Responsable et équipe de la gouvernance des données (Data governance manager and team). Dans certains cas, le CDO ou un cadre équivalent - le directeur de la gestion des données d’entreprise, par exemple - peut également être le responsable pratique du programme de gouvernance des données. Dans d’autres cas, les organisations désignent un responsable ou un chef de la gouvernance des données spécialement chargé de gérer le programme. Dans tous les cas, le responsable du programme dirige généralement une équipe de gouvernance des données qui travaille à plein temps sur le programme. Parfois plus officiellement appelé bureau de gouvernance des données, il coordonne le processus, dirige les réunions et les sessions de formation, suit les mesures, gère la communication interne et effectue d’autres tâches de gestion.

Comité de gouvernance des données (Data governance committee). Cependant, l’équipe de gouvernance ne prend généralement pas de décisions en matière de politique ou de normes. C’est la responsabilité du comité ou du conseil de gouvernance des données, qui est principalement composé de dirigeants d’entreprise et d’autres propriétaires de données. Le comité approuve la politique fondamentale de gouvernance des données, ainsi que les politiques et règles associées concernant des éléments tels que l’accès aux données et leur utilisation, ainsi que les procédures de mise en œuvre. Il résout également les litiges, tels que les désaccords entre différentes unités commerciales sur les définitions et les formats de données.

Responsables des données (Data stewards). Les responsabilités des gestionnaires de données comprennent la supervision des ensembles de données afin de les maintenir en ordre. Ils sont également chargés de veiller à ce que les politiques et les règles approuvées par le comité de gouvernance des données soient mises en œuvre et que les utilisateurs finaux s’y conforment. Les personnes ayant une connaissance de certains actifs et domaines de données sont généralement désignées pour assumer le rôle de gestionnaire de données. Il s’agit d’un poste à temps plein dans certaines entreprises et d’un poste à temps partiel dans d’autres. Il peut également y avoir un mélange de responsables des données informatiques et commerciales.

Les architectes de données, les modélisateurs de données et les analystes et ingénieurs chargés de la qualité des données font également partie du processus de gouvernance. En outre, les utilisateurs professionnels et les équipes d’analyse doivent être formés aux politiques de gouvernance des données et aux normes en la matière, afin qu’ils puissent éviter d’utiliser les données de manière erronée ou inappropriée.

Composants d’un cadre de gouvernance des données.

Un cadre de gouvernance des données comprend les politiques, les règles, les processus, les structures organisationnelles et les technologies qui sont mis en place dans le cadre d’un programme de gouvernance. Il définit également des éléments tels que l’énoncé de la mission du programme, ses objectifs et la manière dont son succès sera mesuré, ainsi que les responsabilités décisionnelles et les obligations de rendre compte des diverses fonctions qui feront partie du programme. Le cadre de gouvernance d’une organisation doit être documenté et partagé en interne, afin que toutes les personnes concernées sachent clairement - dès le départ - comment le programme fonctionnera.

Sur le plan technologique, un logiciel de gouvernance des données peut être utilisé pour automatiser certains aspects de la gestion d’un programme de gouvernance. Bien que les outils de gouvernance des données ne soient pas un composant obligatoire du cadre, ils prennent en charge la gestion du programme et du flux de travail, la collaboration, l’élaboration de politiques de gouvernance, la documentation des processus, la création de catalogues de données et d’autres fonctions. Ils peuvent également être utilisés en conjonction avec des outils de qualité des données, de gestion des métadonnées et de gestion des données de référence (MDM).

Mise en œuvre de la gouvernance des données

La gouvernance des données doit être une initiative stratégique pour les organisations. Voici une série d’étapes à suivre, dont les points à faire suivants :

  • Identifier les actifs de données et les processus de gouvernance informels existants;
  • Améliorer les connaissances et les compétences des utilisateurs finaux en matière de données;
  • Décider comment mesurer le succès d’un programme de gouvernance.

Avant de mettre en œuvre un cadre de gouvernance des données, une autre étape consiste à identifier les propriétaires ou les gardiens des différents actifs de données dans l’entreprise et à les impliquer - ou à désigner des substituts - dans le programme de gouvernance. Le CDO, le responsable exécutif ou le responsable de la gouvernance des données prend ensuite la tête de la création de la structure du programme, en travaillant à la constitution de l’équipe de gouvernance des données, en identifiant les responsables des données et en formalisant le comité de gouvernance.

Une fois la structure en place, le véritable travail de gouvernance des données commence. Les politiques de gouvernance des données et les normes de données doivent être développées, ainsi que les règles qui définissent comment les données peuvent être utilisées par le personnel autorisé. En outre, un ensemble de contrôles et de procédures d’audit sont nécessaires pour assurer la conformité permanente aux politiques internes et aux réglementations externes et pour garantir que les données sont utilisées de manière cohérente dans toutes les applications. L’équipe de gouvernance doit également documenter l’origine des données, leur lieu de stockage et la manière dont elles sont protégées contre les abus et les attaques de sécurité.

Les initiatives de gouvernance des données comprennent généralement aussi les éléments suivants :

  • Cartographie et classification des données. La cartographie des données dans les systèmes permet de documenter les actifs de données et la façon dont les données circulent dans une organisation. Les différents ensembles de données peuvent ensuite être classés en fonction de facteurs tels que la présence d’informations personnelles ou d’autres données sensibles. Les classifications influencent la manière dont les politiques de gouvernance des données sont appliquées aux différents ensembles de données.
  • Glossaire métier. Un glossaire métier contient les définitions des termes et des concepts utilisés dans une organisation, par exemple, ce qui constitue un client actif. En aidant à établir un vocabulaire commun pour les données d’entreprise, les glossaires métier peuvent contribuer aux efforts de gouvernance.
  • Catalogue de données. Les catalogues de données collectent les métadonnées des systèmes et les utilisent pour créer un inventaire indexé des ressources de données disponibles qui comprend des informations sur l’historique des données, des fonctions de recherche et des outils de collaboration. Les informations sur les politiques de gouvernance des données et les mécanismes automatisés pour les appliquer peuvent également être intégrés aux catalogues.

Meilleures pratiques pour gérer les initiatives de gouvernance des données

Parce que la gouvernance des données impose généralement des restrictions sur la façon dont les données sont traitées et utilisées, elle peut devenir controversée dans les organisations. Les équipes informatiques et de gestion des données craignent souvent d’être considérées comme la “police des données” par les utilisateurs s’ils dirigent des programmes de gouvernance des données. Pour favoriser l’adhésion des entreprises et éviter toute résistance aux politiques de gouvernance, les responsables expérimentés de la gouvernance des données et les consultants du secteur recommandent que les programmes soient axés sur l’entreprise, que les propriétaires des données soient impliqués et que le comité de gouvernance des données prenne les décisions relatives aux normes, politiques et règles.

La formation et l’éducation sur la gouvernance des données est un élément nécessaire des initiatives, en particulier pour familiariser les utilisateurs professionnels et les analystes de données avec les règles d’utilisation des données, les mandats de confidentialité et leur propre responsabilité pour aider à maintenir la cohérence des ensembles de données. Une communication permanente avec les dirigeants d’entreprise, les responsables opérationnels et les utilisateurs finaux sur les progrès d’un programme de gouvernance des données est également indispensable, par le biais de rapports, de bulletins d’information électroniques, d’ateliers et d’autres méthodes de sensibilisation.

La communication et la formation font partie d’un ensemble de sept meilleures pratiques de gouvernance des données décrites par Farmer dans un second article. Parmi les autres, citons l’application des règles de sécurité et de confidentialité des données aussi près que possible du système source, la mise en place de politiques de gouvernance appropriées à tous les niveaux d’une organisation et la révision régulière des politiques de gouvernance.

Nous recommandons une approche adaptative de la gouvernance des données qui applique des politiques et des styles de gouvernance différents aux différents processus d’entreprise. Voici la liste des sept fondements pour une gouvernance réussie des données et des applications analytiques :

  • un accent sur la valeur commerciale et les résultats organisationnels ;
  • accord interne sur la responsabilité des données et les droits de décision ;
  • un modèle de gouvernance fondé sur la confiance qui s’appuie sur le lignage et la conservation des données ;
  • une prise de décision transparente et conforme à un ensemble de principes éthiques ;
  • la gestion des risques et la sécurité des données sont des composantes essentielles de la gouvernance ;
  • une éducation et une formation continues, assorties de mécanismes permettant de contrôler leur efficacité ; et
  • une culture de collaboration et un processus de gouvernance qui encouragent une large participation.

Les défis de la gouvernance des données

Souvent, les premières étapes des efforts de gouvernance des données peuvent être les plus difficiles car les différentes parties d’une organisation ont généralement des vues divergentes sur les entités de données clés, telles que les clients ou les produits. Ces divergences doivent être résolues dans le cadre du processus de gouvernance des données - par exemple, en convenant de définitions et de formats de données communs. C’est pourquoi le comité de gouvernance des données doit disposer d’une procédure claire de résolution des conflits.

Voici d’autres défis courants auxquels les organisations sont confrontées en matière de gouvernance des données.

Démontrer sa valeur commerciale. Sans documentation préalable des avantages commerciaux attendus d’une initiative de gouvernance des données, il peut être difficile de la faire approuver, financer et soutenir. Les dirigeants d’entreprise veulent savoir ce qu’ils peuvent en retirer dès le début d’un programme de gouvernance.

« Si vous ne pouvez pas répondre à cette question d’une manière qui les intéresse vraiment et qui leur soit bénéfique, ils ne seront tout simplement pas intéressés »

En permanence, la démonstration de la valeur commerciale nécessite le développement de mesures quantifiables, en particulier sur les améliorations de la qualité des données. Il peut s’agir du nombre d’erreurs de données résolues sur une base trimestrielle et des gains de revenus ou des économies de coûts qui en résultent. D’autres paramètres courants de qualité des données mesurent l’exactitude et les taux d’erreur dans les ensembles de données et les attributs connexes, tels que l’exhaustivité et la cohérence des données. En savoir plus sur les liens étroits entre la gouvernance des données et la qualité des données, ainsi que sur les autres types de mesures qui peuvent également être utilisées pour démontrer la valeur d’un programme de gouvernance.

Soutenir l’analyse en libre-service. Le passage à la BI et à l’analyse en libre-service a créé de nouveaux défis en matière de gouvernance des données en mettant les données entre les mains d’un plus grand nombre d’utilisateurs dans les organisations. Les programmes de gouvernance doivent veiller à ce que les données soient exactes et accessibles aux utilisateurs en libre-service, mais aussi à ce que ces utilisateurs - analystes commerciaux, cadres et scientifiques de données citoyens, entre autres - n’utilisent pas les données à mauvais escient ou n’enfreignent pas les restrictions en matière de confidentialité et de sécurité des données. Les données en continu utilisées pour des analyses en temps réel compliquent encore ces efforts.

Gouverner le big data. Le déploiement de systèmes de big data entraîne également de nouveaux besoins et défis en matière de gouvernance. Les programmes de gouvernance des données se concentraient traditionnellement sur les données structurées stockées dans des bases de données relationnelles, mais ils doivent désormais gérer le mélange de données structurées, non structurées et semi-structurées que contiennent généralement les environnements big data, ainsi qu’une variété de plateformes de données, notamment les systèmes Hadoop et Spark, les bases de données NoSQL et les magasins d’objets en nuage. En outre, les ensembles de big data sont souvent stockés sous forme brute dans des lacs de données, puis filtrés selon les besoins pour des utilisations analytiques, ce qui complique encore la gouvernance des données.

Principaux piliers de la gouvernance des données

Les programmes de gouvernance des données sont sous-tendus par plusieurs autres facettes du processus global de gestion des données. Plus particulièrement, ces facettes sont les suivantes :

  • L’intendance des données. Comme nous l’avons vu précédemment, un responsable des données est chargé d’une partie des données d’une organisation. Il contribue également à la mise en œuvre et à l’application des politiques de gouvernance des données. Il s’agit souvent d’utilisateurs professionnels qui connaissent bien les données et sont des experts dans leur domaine. Les gestionnaires de données collaborent avec des analystes de la qualité des données, des administrateurs de bases de données et d’autres professionnels de la gestion des données. Ils travaillent également avec les unités opérationnelles pour identifier les besoins et les problèmes liés aux données.
  • Qualité des données. L’amélioration de la qualité des données est l’un des principaux moteurs des activités de gouvernance des données. L’exactitude, l’exhaustivité et la cohérence des données entre les systèmes sont des caractéristiques essentielles des initiatives de gouvernance réussies. Le nettoyage des données, également connu sous le nom d’épuration des données, corrige les erreurs et les incohérences, et permet également de corréler et de supprimer les instances en double des mêmes éléments de données afin d’harmoniser la façon dont les clients ou les produits sont répertoriés dans différents systèmes. Les outils de qualité des données offrent ces capacités grâce à des fonctions de profilage, d’analyse et de mise en correspondance des données, entre autres.
  • Gestion des données de référence. La GDR est une autre discipline de gestion des données étroitement associée aux processus de gouvernance des données. Les initiatives de GDR établissent un ensemble de données de référence sur les clients, les produits et d’autres entités commerciales afin de garantir la cohérence des données dans les différents systèmes de l’entreprise. Par conséquent, le MDM s’accorde naturellement avec la gouvernance des données. Comme les programmes de gouvernance, cependant, les efforts de GDR peuvent créer une controverse dans les organisations en raison des différences entre les départements et les unités d’affaires sur la façon de formater les données de base. En outre, la complexité du MDM a limité son adoption, par rapport à la gouvernance des données. Mais la combinaison des deux a conduit à une évolution vers des projets GDR à plus petite échelle motivés par des objectifs de gouvernance des données.

La gouvernance des données est également liée à la gouvernance de l’information, qui se concentre plus largement sur la manière dont l’information est utilisée de manière générale dans une organisation. À un niveau élevé, la gouvernance des données peut être considérée comme une composante de la gouvernance de l’information, mais elles sont généralement considérées comme des disciplines distinctes ayant des objectifs similaires.

Cas d’utilisation de la gouvernance des données

Une gouvernance efficace des données est au cœur de la gestion des données utilisées dans les systèmes opérationnels, ainsi que dans les applications de BI et d’analyse alimentées par les entrepôts de données, les marts de données et les lacs de données. C’est aussi un élément particulièrement important des initiatives de transformation numérique, et elle peut aider à d’autres processus d’entreprise, tels que la gestion des risques, la gestion des processus opérationnels et les fusions et acquisitions.

À mesure que les utilisations des données continuent de se développer et que de nouvelles technologies émergent, la gouvernance des données est susceptible de connaître une application encore plus large. Par exemple, des efforts sont en cours pour appliquer les processus de gouvernance des données aux algorithmes d’apprentissage automatique et autres outils d’IA. En outre, les violations de données très médiatisées et les lois telles que le RGPD ont fait de l’intégration des protections de la vie privée dans les politiques de gouvernance des données un élément central des efforts de gouvernance.

Fournisseurs et outils de gouvernance des données

Les outils de gouvernance des données sont disponibles auprès de différents fournisseurs. Il s’agit des principaux fournisseurs informatiques, tels qu’Oracle, et SAP . Ainsi que des spécialistes de la surveillance des données clients tels qu’Ostraca. Dans la plupart des cas, les outils de gouvernance sont proposés dans le cadre de suites plus vastes qui intègrent également des fonctions de gestion des métadonnées et de lignage des données.

De nombreuses plateformes de gouvernance de données et de gestion des métadonnées comprennent également un logiciel de catalogue de données. Il est également disponible en tant que produit autonome auprès de IBM, OvalEdge et de nombreux autres fournisseurs, ainsi que des leaders du marché des plateformes de cloud computing AWS, Google et Microsoft.

Sources

Cet article est une réécriture & une traduction de l’article de « What is data governance and why does it matter? » écrit par Craig Stedman.