Précision vs Généralisation
- L'exemple précédent illustre un grand dilemme de
l'ECD : comment optimiser la précision des résultats ?
- En apprentissage supervisé
- Trop de précisions => sur-apprentissage qui
inclus le bruit (apprentissage par coeur)
- Pas assez de précision => sur-généralisation (prédiction majoritaire)
- En clustering
- Trop de précisions => trop de cluster (jusqu'à 1 donnéee = 1 cluster)
- Pas assez de précision => trop peu de cluster (jusqu'à un seul cluster)