Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

Le deal à ne pas rater :
Pokémon EV06 : où acheter le Bundle Lot 6 Boosters Mascarade ...
Voir le deal

ACM CAH (données qualitatives & grosse base de données)

4 participants

Aller en bas

données - ACM CAH (données qualitatives & grosse base de données) Empty ACM CAH (données qualitatives & grosse base de données)

Message par Khroutchev Lun 27 Mai 2013 - 12:02

Bonjour,
après avoir réalisé une ACM sur des données qualitatives. J'aimerais réaliser une typologie mais la CAH n'est pas adapaté à un grand nombre de données. Quelle autre méthode peut-être utilisée ? Je souligne le faite que mes variables étaient à la base mixte (quanti et quali). Cepandant pour réaliser l'ACM, j'ai du transformer mes deux variables quantitatives en qualitatives.

J'aimerais donc juste savoir quelle méthode utilisé pour "typer" des individus avec un nombre important de données et des variables exclusivement qualitatives ?

Khroutchev

Nombre de messages : 32
Date d'inscription : 24/05/2013

Revenir en haut Aller en bas

données - ACM CAH (données qualitatives & grosse base de données) Empty Re: ACM CAH (données qualitatives & grosse base de données)

Message par FS Lun 27 Mai 2013 - 12:26

Salut, pour les grande base de données il y'a deux stratégies simple à mettre en oeuvre :

- Faire la CAH sur un échantillon de tes données (quelque milliers d'individus), puis pour classer l’ensemble les individus appliquer les k-means à partir des centroïds issues de la CAH (en prenant un individu de chaque groupe)

- A l'inverse commencer par les k-means avec un très grand nombre de cluster (plusieurs centaine /millier) et terminer avec une CAH.







FS

Nombre de messages : 163
Date d'inscription : 25/04/2008

Revenir en haut Aller en bas

données - ACM CAH (données qualitatives & grosse base de données) Empty Re: ACM CAH (données qualitatives & grosse base de données)

Message par Khroutchev Lun 27 Mai 2013 - 12:45

Ok c'est cool merci Wink

Khroutchev

Nombre de messages : 32
Date d'inscription : 24/05/2013

Revenir en haut Aller en bas

données - ACM CAH (données qualitatives & grosse base de données) Empty Re: ACM CAH (données qualitatives & grosse base de données)

Message par niaboc Lun 27 Mai 2013 - 13:14

FS a écrit:
- Faire la CAH sur un échantillon de tes données (quelque milliers d'individus), puis pour classer l’ensemble les individus appliquer les k-means à partir des centroïds issues de la CAH (en prenant un individu de chaque groupe)

- A l'inverse commencer par les k-means avec un très grand nombre de cluster (plusieurs centaine /millier) et terminer avec une CAH.

La deuxième solution est plus souvent employée... et tu peux même refaire une k-means après la cah pour consolider tes partitions.
niaboc
niaboc

Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

données - ACM CAH (données qualitatives & grosse base de données) Empty Re: ACM CAH (données qualitatives & grosse base de données)

Message par zezima Lun 27 Mai 2013 - 13:19

FS a écrit:Salut, pour les grande base de données il y'a deux stratégies simple à mettre en oeuvre :

- Faire la CAH sur un échantillon de tes données (quelque milliers d'individus), puis pour classer l’ensemble les individus appliquer les k-means à partir des centroïds issues de la CAH (en prenant un individu de chaque groupe)






Alors là ça m'intéresse, pourquoi est-il censé n'utiliser que des échantillons de sa base de donnée pour réaliser sa CAH ?
zezima
zezima

Nombre de messages : 939
Date d'inscription : 26/02/2013

Revenir en haut Aller en bas

données - ACM CAH (données qualitatives & grosse base de données) Empty Re: ACM CAH (données qualitatives & grosse base de données)

Message par FS Lun 27 Mai 2013 - 14:25

Car le temps de calcul explose, une CAH est très gourmand en calcul alors qu'un k-means est très rapide.
Un échantillon (aléatoire) est suffisant pour décrire tes données (cf. cours de sondage) et donc pour initialiser correctement les centres pour lancer le k-means.

FS

Nombre de messages : 163
Date d'inscription : 25/04/2008

Revenir en haut Aller en bas

données - ACM CAH (données qualitatives & grosse base de données) Empty Re: ACM CAH (données qualitatives & grosse base de données)

Message par niaboc Lun 27 Mai 2013 - 18:09

FS a écrit:Car le temps de calcul explose, une CAH est très gourmand en calcul alors qu'un k-means est très rapide.
Un échantillon (aléatoire) est suffisant pour décrire tes données (cf. cours de sondage) et donc pour initialiser correctement les centres pour lancer le k-means.

En vérifiant quand même si l'échantillon reste représentatif de l'ensemble de la population.
niaboc
niaboc

Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

données - ACM CAH (données qualitatives & grosse base de données) Empty Re: ACM CAH (données qualitatives & grosse base de données)

Message par zezima Mar 28 Mai 2013 - 6:51

Oui bien sur, j'avais pas pensé que ça pouvait prendre du temps à faire tourner.

Comme quand on fait tourner une boucle de tests de fisher.exact, c'est horrible clown
zezima
zezima

Nombre de messages : 939
Date d'inscription : 26/02/2013

Revenir en haut Aller en bas

données - ACM CAH (données qualitatives & grosse base de données) Empty Re: ACM CAH (données qualitatives & grosse base de données)

Message par Khroutchev Mer 29 Mai 2013 - 15:50

Alors du coup, comment on fait pour vérifier si l'échantillon est représentatif de la population ?
Existe-il un test ? Ou tout simplement avec un plot ?

Khroutchev

Nombre de messages : 32
Date d'inscription : 24/05/2013

Revenir en haut Aller en bas

données - ACM CAH (données qualitatives & grosse base de données) Empty Re: ACM CAH (données qualitatives & grosse base de données)

Message par niaboc Mer 29 Mai 2013 - 17:01

tu peux faire des tests de moyennes, de proportion, test du khi deux sur les différentes variable quantitatives/qualitatives.
niaboc
niaboc

Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

données - ACM CAH (données qualitatives & grosse base de données) Empty Re: ACM CAH (données qualitatives & grosse base de données)

Message par Khroutchev Ven 31 Mai 2013 - 14:17

Tu connais, par hasard le code sous R, pour faire de tels tests ? Ou faut-il tout simplement calculer les moyennes, proportion ... par variable ?

Khroutchev

Nombre de messages : 32
Date d'inscription : 24/05/2013

Revenir en haut Aller en bas

données - ACM CAH (données qualitatives & grosse base de données) Empty Re: ACM CAH (données qualitatives & grosse base de données)

Message par zezima Dim 2 Juin 2013 - 9:18

chisq.test(varnumeric,varcategorielle)

pour le Chi2
zezima
zezima

Nombre de messages : 939
Date d'inscription : 26/02/2013

Revenir en haut Aller en bas

données - ACM CAH (données qualitatives & grosse base de données) Empty Re: ACM CAH (données qualitatives & grosse base de données)

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum