Big Data – Qualité des données
Code stage
BIGDATAQUALITE01
Durée
14 heures | 2 jours
Certification
non
Objectifs pédagogiques
- Charger et analyser des données de diverses sources avec Hadoop, NiFi, Kafka et Spark
- Restituer ces données avec Kibana
Niveau requis
Avoir des connaissances de base en systèmes d'information et sur les enjeux du traitement des données de masse.
Public concerné
Responsables qualité / QA, Data stewards, consultants, architectes SI, urbanistes SI, chefs de projets, responsables SI, experts méthodes qualité.
Programme
Jour 1
- La valeur stratégique de l’actif « données »
- Qu’est-ce qu’une donnée ?
- Qu’est-ce que la qualité des données ?
- Qu’est-ce que le management de la qualité des données ?
- Les données, pétrole brut des économies de demain
- Débloquer la valeur des données grâce aux technologies du Big Data
- Web 3.0, IoT, Web sémantique : les données de demain
- Les exigences du contexte
- Exigences réglementaires et autres exigences
Veille juridique :
- Principes
- Outils
- Et techniques
La gouvernance des données
- Le cadre de Zachman et la qualité des données
- Clés de succès d’un programme de gouvernance des données
- Approche méthodologique
- Roue de Deming / PDCA et Six Sigma DMAIC
- Normes ISO 8000
- Politique de qualité des données et objectifs stratégiques
- Identification des parties prenantes et de leurs exigences
- Planification du management de la qualité et objectifs opérationnels
- Fonctions et infrastructures de support
Jour 2
- Maîtrise opérationnelle
- Contrôles, audits et plans d’actions
- Initier une culture de l’amélioration continue
- Outils opérationnels de la qualité des données
- Définir et mesurer les dimensions de la qualité des données
- Contrôle qualité, Assurance qualité des données
- Evaluer, nettoyer et valider les données
- Analyse des causes racines des non-conformités et plan d’actions
- Migration et intégration réussies des données
- Concevoir et mettre en place un programme de Master Data Management (MDM)
- Exemples de travaux pratiques (à titre indicatif)
- Mise en oeuvre de solutions de nettoyage et d’intégration de données dans un contexte Big Data
Le contenu de ce programme peut faire l’objet d’adaptation selon les niveaux, prérequis et besoins des apprenants.