diaporamaMiscDM
 
◃  Ch. 1 ECD  ▹
 

Segmentation (ou clustering)

  • La segmentation (ou catégorisation, clustering ou encore apprentissage non supervisé) vise à structurer l'ensemble des données afin d'obtenir des catégories regroupant les éléments semblables et homogènes.
  • Nous qualifions d'exploratoire cette approche car la recherche de partitions se fait tous azimuts, sans idée préalable de ce que pourrait contenir les assemblages produits.
  • Formellement, on dispose d'un ensemble de données E sous forme matricielle décrite par n attributs Attri, l'objectif est d'analyser ces données afin de proposer une partition (E1, E2,..., Ek) de E telle que les éléments de Ei soient les plus similaires possibles alors que deux éléments de Ei et Ej doivent être le plus dissimilaires possible.
  • Le choix du nombre de clusters k n'est pas toujours obligatoire.