diaporamaMiscDM
 
◃  Ch. 3 Seg  ▹
 

Discrétiser une variable quantitative

  • Le plus simple est de procéder par dichotomies successives de façon à produire deux groupes aux moyennes les plus différentes possibles en maximisant la variance interclasse (critère AID)
  • Soit G1 et G2 les deux ensembles de valeurs produits par dichotomie respectivement de taille n1 et n2, on cherche à maximiser
    n1/n (moy(G1)-moy(G))2 + n2/n (moy(G2)-moy(G))2
  • Approche pouvant être facilitée si les données sont déjà catégorisées
  • Cette approche, appliquée récursivement est à l'origine des premiers arbres de décisions