De cette manière, la gouvernance est planifiée et exécutée pour créer un avantage concurrentiel, en veillant à la conformité aux politiques, à la sécurité, à l’accessibilité et à la convivialité de manière fluide et complète. Cela accélère à son tour la disponibilité des données et augmente leur facilité d’utilisation pour les membres de l’équipe distribuée, tout en maintenant un contrôle centralisé sur les risques. Bien que les pratiques courantes de gouvernance des données présentent des obstacles pour les entreprises, ce mélange de modèles peut potentiellement surmonter ces obstacles.

Les deux modèles de gouvernance des données posent des défis

Les entreprises ont du mal à gérer les données à grande échelle et dans le cloud. Près des trois quarts des décideurs d’un récent sondage Forrester Research déclarent ne pas encore gérer la plupart des données de leur organisation dans le cloud. Environ 80 % déclarent avoir des difficultés à gérer les données à grande échelle. 82 % d’entre eux citent la prévision et le contrôle des coûts comme un défi dans leur écosystème de données, et 82 % déclarent que des politiques de gouvernance des données confuses sont une difficulté.

Pendant ce temps, le volume de données que les entreprises doivent gérer se multiplie et de plus en plus d’utilisateurs réclament plus d’accès. “Vous avez maintenant beaucoup plus de données provenant de beaucoup plus de sources stockées dans beaucoup plus d’endroits”, déclare Patrick Barch, directeur principal de la gestion des produits chez Capital One Software.

Les organisations souhaitent rendre ces données accessibles à un plus grand nombre d’équipes commerciales, permettant ainsi de nouvelles informations et une plus grande valeur commerciale. Cependant, beaucoup ont du mal à trouver un équilibre entre la nécessité d’une gouvernance centralisée des données dans le cloud (qui garantit une gouvernance complète mais peut entraver l’accès aux données) avec un modèle décentralisé qui donne aux secteurs d’activité plus de contrôle et d’accès aux données et aux analyses. La décentralisation a cependant ses propres inconvénients. Différentes équipes peuvent ne pas être alignées sur les politiques de gouvernance. Des données ou des types de données spécifiques peuvent rester bloqués dans des silos, inaccessibles à tous. Les ingénieurs en apprentissage automatique peuvent ne pas avoir accès aux données dont ils ont besoin pour créer des outils d’analyse avancés.

“Vos équipes veulent un accès complet et instantané aux données et aux outils de leur choix”, déclare Barch. “Vous ne pouvez pas tout gérer de manière centralisée sans devenir un énorme goulot d’étranglement ou embaucher une armée d’ingénieurs de données, et vous ne pouvez pas complètement décentraliser la responsabilité de la gestion sans encourir un risque important pour les données.”

Le meilleur des deux mondes

Il existe cependant un moyen de combiner des approches centralisées et décentralisées dans un nouveau modèle de gouvernance des données grâce à la fédération de la gestion des données. Cela permet aux entreprises de réaliser les avantages de chacun, sans les inconvénients.

Capital One, par exemple, a adopté ce modèle alors que l’entreprise fermait ses centres de données et transférait ses opérations sur le cloud public. L’entreprise a mis en place un entrepôt de données cloud pour rendre les données largement accessibles aux équipes commerciales, mais a réalisé qu’elle devait être attentive à la gouvernance des données.

« Sans de bons contrôles de gouvernance, vous avez non seulement le risque de gestion des politiques, mais vous risquez également de dépenser beaucoup, beaucoup plus d’argent que prévu, beaucoup plus rapidement », déclare Barch. « Nous savions que la maximisation de la valeur de nos données, d’autant plus que la quantité et la variété de ces données évoluent, allait nécessiter la création d’expériences intégrées avec une gouvernance intégrée permettant aux différentes parties prenantes impliquées dans des activités telles que la publication de données, la consommation de données, la gouvernance données et la gestion de l’infrastructure sous-jacente, pour que tout fonctionne ensemble de manière transparente. »