Par Philippe Nieuwbourg
Pendant de nombreuses années en informatique la gouvernance de données n’était pas considérée comme un sujet majeur. On ne l’évoquait que dans des cas particuliers comme pour les grandes bases de données ou des systèmes d’information particulièrement complexes. Plus récemment on a commencé à s’intéresser à la gouvernance de données avec le développement des ERP et surtout avec le développement de l’Intelligence Artificielle, notamment le « machine learning ». En effet, la qualité des données est fondamentale pour paramétrer efficacement ces systèmes.
Depuis quelques années on a pris conscience que les données constituent une partie significative du patrimoine des entreprises et des administrations. Pour l’améliorer il est nécessaire qu’un travail de conception significatif soit effectué. Il ne doit pas être mis en œuvre application par application mais réalisé au niveau du système d’information de l’entreprise car la même donnée ou le même ensemble de données peuvent être produits et utilisés par différents systèmes.
L’importance croissante des architectes
Dans ces conditions, la définition des données mais aussi leur stockage et leur gestion deviennent des enjeux cruciaux. Il est pour cela nécessaire d’améliorer l’architecture des données et de disposer de la compétence de professionnels appelés architectes de données. C’est une profession qui monte. Une requête réalisée ces jours-ci sur LinkedIn montre que dans le monde 70.000 personnes s’identifient comme « Data Architect » et 604 s’identifient en français comme des « architectes de données ». Comme on le voit c’est une profession qui progresse.
Mais en informatique le terme architecte est ambigu. Il y a quelques mois, je donnais une formation sur le Big Data à la SNCF. Dans la salle, j’ai rencontré non pas un, ni deux, mais douze architectes… tous de la SNCF, tous arborant des titres différents, et ils ne se connaissaient pas les uns les autres. Accessoirement, aucun n’était vraiment chargé des données, alors même qu’ils venaient suivre une formation sur ce sujet.
Il existe en informatique de nombreux type d’architectes différents comme les architectes d’entreprise, les architectes d’application, les architectes fonctionnels, les architectes techniques, les architectes systèmes, les architectes réseaux et maintenant le petit nouveau qui commence à pointer le bout de son nez, l’architecte de données ou « Data Architect ». Au cours des cinq dernières années, selon Google Trends, les recherches sur Google concernant le terme “architecte de données”, ont bondi de plus de 30 %. Cela montre bien l’intérêt croissant pour la fonction.
Mise en perspective des évolutions de la fonction
Pendant les décennies de 1990 à 2010 où on a considérablement développé l’usage des ERP, l’application était reine et elle embarquait avec elle ses données. A cette époque l’essentiel des efforts portait sur le développement des fonctions mises en œuvre. Cependant, on a noté, dès cette époque, qu’une attention particulière était portée à la mise en commun de certaines données. Cette démarche a fait clairement apparaître la complexité du partage des données.
Ensuite on a assisté au développement des systèmes décisionnels (infocentre, data warehouse, data lake, …) et surtout il y a eu plus récemment le développement de l’emploi du cloud. Ils ont mis en évidence le rôle fondamental de la définition et de la gestion des données. Il est ainsi apparu peu à peu que leur place est au cœur même du système d’information. Mais surtout ces démarches ont montré, contrairement aux idées dominantes à cette époque, que les données doivent être indépendantes des applications qui les utilisent.
Dans ces conditions, il est probable que dans les années à venir, on va assister au développement rapide du métier d’architecte de données. Son rôle consiste à définir et à maintenir l’architecture de données, indépendamment des applications mais en relation avec elles. Il a la responsabilité de :
-
Échanger avec les
métiers, les informaticiens et en particulier avec les « data
scientists »,
-
Évaluer l’architecture de
données en place et prévoir son évolution,
-
Concevoir une nouvelle
architecture de données,
-
Planifier la mise en
œuvre d’un modèle de données,
-
Estimer les coûts
d’investissement et de fonctionnement,
-
Mettre en œuvre les
meilleurs pratiques d’ETL (Extraction, Transformation, Chargement),
-
Surveiller les bases de
données existantes, assurer leur sécurité et suggérer des mises à jour,
-
Contrôler la conformité
des données,
-
Documenter l’architecture
des données et la maintenir à jour,
-
…
Comme on le voit, les tâches à accomplir sont nombreuses et variées. C’est une fonction délicate à accomplir car l’architecte, on le sait, conçoit mais il ne construit pas. En effet, la mise en œuvre est réalisée par d’autres.
C’est une fonction transverse qui impacte presque toutes les autres. Dans ces conditions ses interventions sont parfois perçues comme des perturbations, voir des agressions. Mais le fait de ne pas intervenir n’arrange pas une situation délicate ou compromise. En fait, c’est un problème de structure de l’entreprise.
En pratique on hésite en permanence entre une organisation centralisée ou un système de type fédéral. Dans ce dernier cas chacun intervient dans un cadre réglementé et négocié. On constate que depuis quelque temps le modèle fédéral tend à se développer et un certain nombre d’entreprises mettent en place des « Chief Data Officer ». Cependant, ce modèle a une limite car assez vite on risque de se heurter à la volonté d’autonomie naturelle des métiers avec les risques de balkanisation bien connus qui s’en suivent.
Les fonctions de l’architecte de données
La définition d’une architecture de données est le cœur de la démarche de gouvernance de données. Elle repose quelques points clés qu’il est important de mettre en œuvre :
-
Définir le rôle de l’architecture
de données et sa place dans le système d’information,
-
Préciser la fonction de l’architecte
de données : son profil, ses missions et son rattachement hiérarchique,
-
Organiser les relations entre
les différents métiers d’architecte au sein de l’organisation et notamment en
ce qui concerne la répartition des rôles, les relations avec les hiérarchies et
le recouvrement des opérations,
-
Définir le schéma
directeur de données (Data Framework), le modèle de données (Data Schema) et le
cycle de vie des données (Data Lifecycle),
-
Prévoir le rôle de l’architecture
de données afin de répondre aux besoins du Big Data,
-
Définir son rôle dans la
gouvernance des systèmes d’information de l’entreprise et de manière plus
générale dans la gouvernance de l’entreprise,
-
…
Comme on le voit c’est une activité fondamentale pour l’avenir des systèmes d’information mais elle est parfois difficile à mettre en œuvre. A terme il est probable que cette démarche va évoluer vers le « Data Mesh ». Cette évolution est hâtée par le développement de l’Intelligence Artificielle et notamment l’apprentissage machine (Machine Learning). A terme, il est possible que on assiste à un découplage de l’architecture des données et de l’architecture applicative.
Ce texte est un résumé de la conférence que Philippe Nieuwbourg a fait au Club de la Gouvernance des Systèmes d’Information le Mardi 26 Septembre 2023 sur le thème : « Architecture de données, le nouveau cœur du système d’information ? ». Elle a permis de faire le point sur ce sujet et de répondre à quelques questions clés :
-
Qu’est-ce que
l’architecture de données ?
-
Quel rôle assure l’architecte
de données ?
-
Quelles relations entre
l’architecte de données et les métiers ?
-
Quelles sont les
évolutions probables de la fonction ?
-
….
Lire ci-dessous le support de présentation de l’exposé de Philippe Nieuwbourg :
Slide
1
– Définitions
2
2
– Rôle de l’architecte de données 6
3
– Quelques qualités sont nécessaires 7
4
– Intégrer l’architecture de données au cœur de l’équipe data 10
5
– Comment ont évolué les modèles de gouvernance 16
6
– Choisir un modèle d’entreprise ; centralisé ou fédéral ? 17
7
– La balkanisation des données
20
8
– La place du Data Lake
22
9
– Le Data Mesh
25