Comment déployer un Data Catalog ? 

Le Data Catalog ou catalogue de données, est un inventaire qui centralise et regroupe les métadonnées des données exploitées dans l’entreprise.

Ces métadonnées sont primordiales pour comprendre le contexte de la donnée,  elles permettent à tous les utilisateurs de mieux utiliser la data quel que soit leur profil.

Et ce n’est pas tout.

Les métadonnées décrivent les différents aspects d’un ensemble d’informations et permettent de valoriser l’ensemble de votre patrimoine data.  Elles permettent de comprendre les données en leur conférant un contexte.

Pour vulgariser, cela correspond au titre des colonnes d’un tableau : nom, prénom, date de naissance, adresse …

Attention

Le Data Catalog ne réalise pas des modifications directement dans les bases, mais regroupe les infos sur les données dans un emplacement centralisé.

data-catalog-données-metadonnees

Illustré, le Data Catalog ressemblerait à ça :

data-catalog-données-metadonnees-metiers-equipe-IT

Quels sont les avantages ? 

  • Meilleure collaboration entre les utilisateurs de la donnée grâce à une documentation centralisée
  • Ressource clé pour déployer la gouvernance data et assurer sa sécurité
  • Confiance dans la donnée par une contextualisation renforcée
  • Accélérateur de projet grâce à la maîtrise des données manipulées

Ok ! On commence par quoi ?

1. Prioriser

Quels sont les vrais besoins au quotidien ?

Autour de plusieurs ateliers d’idéation, les futurs consommateurs de la donnée vont identifier et prioriser les différents cas d’usage pertinents dans leur écosystème.

data-catalog-prioriser

2. Benchmark

Quel est le meilleur choix d’outil pour mes cas d’usage ?

C’est le moment où nos consultants vont pouvoir vous accompagner pour challenger les solutions.

En apportant leur connaissance des outils du marché basés sur des retours d’expérience concrets en fonction de vos critères identifiés comme prioritaires.

Bien accompagnées, ces deux étapes permettent de … 

 

  • Tester des solutions adaptées à votre environnement
  • Mobiliser à bon escient vos contributeurs en ciblant leurs interventions
  • Légitimer votre démarche en impliquant vos futurs utilisateurs
  • Anticiper la conduite du changement grâce à une démarche basée sur la co-construction

La méthode Thélio

Miser sur la valeur conseil

5 ans d’expérience sur le sujet

et l’expérience de plusieurs solutions de Data Catalog, grâce à nos partenariats éditeurs

des méthodes d’animations collaboratives

qui permettent dans un temps réduit de recenser et prioriser les besoins

des supports d’onboarding ludiques

pour accélérer la montée en compétence des équipes data

Après avoir priorisé les besoins et comparé les différents outils de Data Catalog sur le marché… 

Il est temps de réaliser un PoC 

3. Cadrage 

Choix du périmètre

Il est temps de définir le périmètre projet pour s’aligner sur les attendus.

Pour commencer, vous devez valider les critères de réussite du PoC & des cas d’usage à éprouver.

(liste non exhaustive)

  • Expérience utilisateur
  • Opérations manuelles
  • Pertinence des connecteurs
  • Respect des exigences sécurité
  • Fonctionnalités de collaboration

4. Ateliers d’organisation

et paramétrage de la solution

  • Atelier 1 : identifier les rôles dans la plateforme en fonction du modèle de gouvernance 
  • Atelier 2 : définir le métamodèle cible 
  • Atelier 3 : valider et ajuster le paramétrage de la plateforme 

5. Expérimentation

alimentation du Data Catalog selon le dispositif établi

L’équipe peut alors tester la solution de Data Catalog en exploitant les différentes fonctionnalités offertes 

  • Évaluer les critères de réussite visés
  • Préciser les modalités de déploiement

    6. Go / No go ? 

    État des lieux et décision pour une éventuelle poursuite avec un déploiement

    Bien accompagnée, la démarche PoC permet de …

     

    • Évaluer la solution avant de la déployer à grande échelle
    • S’assurer de l’implication de chacun et du respect des exigences
    • Réduire les risques liés à la mise en œuvre du nouvel outil

    Après avoir testé la solution de Data Catalog grâce au PoC 

    Il est temps de planifier et déployer la solution 

    7. Finaliser 

    la conception et la configuration de la solution

    En prenant en compte : 

    • Les résultats du PoC
    • Les retours d’expérience
    • Les besoins spécifiques de l’organisation

      Pour définir :

      • Les sources de données à intégrer
      • Les métadonnées à collecter
      • Les workflows à mettre en place
      • Les indicateurs de performance à suivre les processus autour du data catalog

      8. Construire

      les processus autour du Data Catalog

      Il vous faudra valider et ajuster le modèle organisationnel, en identifiant les acteurs clés et leurs responsabilités, puis décrire les processus d’administration, d’alimentation, d’actualisation de la plateforme.

       

      Attention tout de même… 

       

      Assurez-vous de couvrir aussi bien : 

      • La rétro documentation des usages existants 
      • La cartographie des données dans le cadre des projets futurs et en s’inscrivant dans la gouvernance projet de l’entreprise 

      9. Définir

      le plan d’accompagnement des futurs utilisateurs

      Les objectifs :

      Rétro documentation : permettre aux contributeurs d’alimenter le D.C

      Nouveaux projets : Intégrer la production de livrables pour alimenter le D.C dans la gouvernance projet

      SPONSORS : Démontrer l’atteinte des objectifs de réappréciation du patrimoine data grâce au Data Catalog

      data-catalog-plan-accompagnement

      10. Monitoring du déploiement

      Accordez-vous sur les indicateurs à piloter pour démontrer les résultats de la mise en place du programme.

      1. Superviser l’avancée du déploiement
      2. Communiquer sur les gains de productivité et la satisfaction  utilisateurs 
      3. Prouver l’adoption du D.C

      Exemples d’indicateurs :  nombre d’objets consultés, nombre de visiteurs uniques, nombre de fiches objets (créées, renseignées), taux de data owners renseignés, taux de couverture, de rétro-documentation, etc … 

      11. Établir le plan de déploiement

      Pour terminer, évaluez et validez ensemble la stratégie 

      par opportunité ?  par la popularité des usages ? par la roadmap projets ?

      Et ajustez la roadmap en fonction des ressources 

      Bien accompagnées, ces étapes permettent de …

       

      • Optimiser la démarche de remise en qualité des données
      • Favoriser la réussite du déploiement de la gouvernance des données
      • Concilier ambitions de déploiement et ressources disponibles pour un déploiement structuré
      • Faciliter la collaboration et la prise de décision
      image-ebook-comment-deployer-un-datacatalog

      Comment déployer un Data Catalog ?

      Télécharger notre guide illustré

      Vous souhaitez être accompagnés dans vos projets data ?

      Vous avez des questions ?