Support formation Master Data Management
Le schéma en étoile aide à organiser les données d’un modèle tabulaire.

On le représente ainsi :
image.png
Un exemple simple (oui en anglais) :
Les ventes (”sales”) sont les faits : quantité (”order quantity”) et Montant vente (”Sales Amount”).
Les autres tables sont des dimensions : Produits (”Product”), client (”Customer”), etc. Tous les champs de ces tables permettent des regroupements possibles.
On pourra ainsi obtenir dans le rapport la somme des “Montant vente” par (retroupement) Produit, catégories de produit (”Category”) et Couleur (”Color”).
image.png

Table de faits

Table qui stocke des observations ou des événements qui enregistrent une activité métier spécifique.
Exemples : quantités, volumes, montants, tonnes.
Grand nombre de lignes
Prend en charge la totalisation

Tables de dimension

Les tables de dimension décrivent les entités métier.
Exemples : dates, clients, produits.
Au moins une colonne “clé” (sans doublon), comme ProduitClé ou ProduitID + des colonnes descriptives, comme le nom, la catégorie, le lieu, l’année.
Cette même clé se retrouve dans la table de faits et permet de créer une relation.
Utilisées pour filtrer et regrouper les données.
Nombre de lignes réduits.
Comparer les tables de faits et de dimension
Caractéristique
Table de faits
Table de dimension
1
Objectif du modèle
Stocke les événements ou les observations
Stocke les entités métier
2
Structure de table
Contient les colonnes de clé de dimension et les colonnes de mesure numériques qui peuvent être résumées
Contient une colonne clé et des colonnes descriptives pour le filtrage et le regroupement
3
Volume de données
Peut contenir de nombreuses lignes
En général, contient moins de lignes (par rapport aux tables de faits)
4
Objectif de la requête
Pour résumer
Pour filtrer et grouper
There are no rows in this table

Autres schémas possible

Sans titre-1.png

Normalisation et dé-normalisation

La normalisation est le terme utilisé pour décrire les données stockées de manière à réduire les données répétitives.
Dans cet exemple, la table des lignes de commandes, à gauche, est normalisée. Chaque produit vendu a un numéro (une clé). Les caractéristiques de chaque produit est dans la table Produit (à droite).

image.png
Une version dé-normalisée de ces 2 tables se présenterait ainsi :
image.png
On a utilisé le champs ProduitéClé, présent dans les 2 tables, pour lier les tables.
Si vos données proviennent d’une extraction, il est probable qu’elles soient déjà dénormalisées. Dans ce cas, utiliser Power Query, pour les normaliser.

Want to print your doc?
This is not the way.
Try clicking the ⋯ next to your doc name or using a keyboard shortcut (
CtrlP
) instead.