Segmentation (ou clustering)
- La segmentation (ou catégorisation, clustering ou encore
apprentissage non supervisé) vise à structurer l'ensemble des
données afin d'obtenir des catégories regroupant les éléments
semblables et homogènes.
- Nous qualifions d'exploratoire cette approche car la recherche
de partitions se fait tous azimuts, sans idée préalable de ce que
pourrait contenir les assemblages produits.
- Formellement, on dispose d'un ensemble de données E sous forme matricielle décrite par n attributs Attri, l'objectif est d'analyser ces données afin de proposer une partition (E1, E2,..., Ek) de E telle que les éléments de Ei soient les plus similaires possibles alors que deux éléments de Ei et Ej doivent être le plus dissimilaires possible.
- Le choix du nombre de clusters k n'est pas toujours obligatoire.