Accueil
Recherche
Publications
Activités
Enseignement
Supports
Synthèse
Divers
Errance Chromatique
Réalisation fablab
D'où viens-je ?
Le Masque SF
Docs
WEKA
docs WEKA
R-project
RapidMiner
Bibliographie
CM
Intro ECD
Arbres de Décision
Segmentation
Règles d'associations
Exemple Iris
Renforcement
Intro logiciel R
Régression linéaire
ACP
Analyse descriptive des données
Data Mining
Ce support de cours n'est pas maintenu et est en parti obsolèle !
ECD
▼
Fouille de données et Apprentissage
Définitions
Processus de l'ECD
Processus de l'ECD
Apprentissage supervisé
Exemple : lentilles de contact (1)
Exemple : lentilles de contact (2)
Exemple : lentilles de contact (3)
Segmentation (ou clustering)
Exemple ornithologique (1)
Exemple ornithologique (2)
Exemple ornithologique (3)
Précision vs Généralisation
Comment valider les modèles produits ?
A quoi ça sert ?
Processus de l'ECD
Pré-traitements
Processus de l'ECD
Post-traitements
Apprentissage supervisé
Clustering
Outils
K plus proches voisins
Apprentissage par renforcement
Bibliographie Principale
AD
▼
Analyse et Fouille de Données
Principes généraux
Algorithme
Mesure d'intérêt d'une partition
Critères pour une bonne mesure
Matrices de contingence
Construction des arbres possibles
Entropie croisée
Gain d'information
Quid des variables numériques
Valeurs candidates pour un seuil
Réutilisation des variables numériques
Autres mesures d'intérêt
Gini
Chi2
Critère d'arrêt du partitionnement
Évaluation de l'apprentissage
Taux d'erreurs en apprentissage
Base d'apprentissage, base de test
Élagage des Arbres de Décision
Critère d'élagage (CART)
Méthodes d'amélioration des Apprentissages
Seg
▼
Analyse et Fouille de Données
Segmentation et Apprentissage non supervisé
Discrétiser une variable quantitative
Exemple
Données associées à plusieurs variables
K-means
Exemple (1/2)
Exemple (2/2)
Mesures de similarité
Proximité de deux clusters
Caractérisation des clusters
Qualité d'un clustering
Analyse et Fouille de Données
Principe du CHA
Exemple (1/2)
Exemple 2/2
Autres Clustering Hiérarchiques
Similarité entre 2 clusters
RA
▼
Analyse et Fouille de Données
Analyse du panier de la ménagère
Données analysées
Représentation binaire du contenu d'un caddie
Évaluation des règles d'association
Quelles sont les bonnes règles ?
Faire face à l'explosion combinatoire
Stratégie générale
Exemple sur (pain, lait, couches, bière)
Algorithme A priori (Agrawal et Srikant 1994)
La fonction apriori-gen
Le Lift
Exemple iris
▼
Etude de cas les données iris
Projections des données
Classification avec k-means (1/2)
Classification avec k-means (2/2)
Validation des classifications
Projections en fonction des espèces
Arbre de décision
Arbre de décision
App par renforcement
▼
Apprentissage supervisé vs Renforcement
Apprentissage Pénalité - Récompense
Q-Learning (1)
Q-Learning (2)
Q-Learning (3)
Fonction de renforcement
Fonction de mise à jour
Convergence et Limitations
Calculs de Q(s,a) (1/2)
Calculs de Q(s,a) (2/2)
Tableau Q après un passage
Autres algorithmes
Application et Robotique
Bibliographie
Intro à R
▼
Analyse et Fouille de Données
Introduction à R
Références
Éléments syntaxiques
Les objets
Les valeurs particulières
Opérateurs arithmétiques et logiques
Ensembles d'objets
Les vecteurs
Générer des séquences
Générer des séquences aléatoires
Les facteurs (1/2)
Les facteurs (2/2)
Les matrices (1/3)
Les matrices (2/3)
Les matrices (3/3)
Les Listes (1/2)
Les Listes (2/2)
Les data frames
Charger un fichier dans un data.frame
Décrire la structure et le contenu des data.frames
Extraire des données d'un data.frame
Bases de données disponibles
Exercices
Fonctions graphiques
Paramétrage des graphiques
Exporter des graphiques
Structures de contrôle
Définir des fonctions
Sauver des données
Charger un programme
Exercices
Régression linéaire
▼
Fouille de données
Régression linéaire simple
Regression linéaire avec R
Régression linéaire multiple
Production du meilleur modèle
Exercice