Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Combinaison Analyse Factorielle et Classification
2 participants
Page 1 sur 1
Combinaison Analyse Factorielle et Classification
Bonjour,
Dand le cadre de mon stage je dois réaliser une analyse typologique. Après quelques recherche j'ai vu que cela se combine bien avec de l'analyse factorielle mais je n'ai pas trop compris en quoi.
L'ACP et la CAH se prête bien à mes données.
J'ai vu qu'une ACP pouvait être réalisé en prêt traitement d'une CAH ou en post traitement (visualisation des groupes sur 1er plan factoriel) .
Mais je ne suis pas sûre que dans mon cas ce soit très intéressant de réaliser une CAH sur les 1er axes issus d'une ACP. Quels en sont les intérêts exactes ?
Je ne travaille pas sur un échantillon et j'ai une 15aine de variables. Si le but de cette combinaison est de réduire le nombre de variable et d' éliminer les fluctuations d"échantillonnage je n'ai peut être pas besoin de le faire.
Est ce que cela équilibrerai l'influence des variables ? Je dois travailler sur des pays et je voudrais prendre en compte la taille de chaque pays (il n'est pas aisé de comparer deux pays comme le Luxembourg et la France par exemple). Une ACP serais une solution à ce problème ?
De plus si on utilise une ACP en pre traitement peut on encore faire un post traitement ?
J'espère avoir été claire
Merci d'avance
Mimina- Nombre de messages : 12
Localisation : Lorraine
Date d'inscription : 27/10/2009
Re: Combinaison Analyse Factorielle et Classification
Le principe de faire une classif sur les premiers axes de l'ACP permet de différencier les individus selon les variables qui structurent le jeu de données. Du coup, si tu ne veux pas faire une clasif des individus sur les premiers axes, tu va les différencier selon des variables qui ne représentent qu'une faible part de la variabilité du jeu de données, et tu risque donc de les différencier selon des critères de très faible importance en oubliant les critères de forte importance.
Que veux-tu dire quand tu dis que tu ne travailles pas su un échantillon? Le but de l'ACP est de représenter tes données selon dans un repères qui maximise les différences entre les individus. En gros, du passe d'un espace en 15 dimensions dans ton cas, à un espace en 3 ou 4 dimensions intéressantes, c'est dans ce cas que l'ACP réduit le nombre de variable, pas parce que tu supprime des variables, mais parce que certaines variables évoluent conjointement, l'ACP visualise ce phénomène.
Par contre je n'ai pas compris les questions de pré/post traitement. Pour moi tu fais une ACP, puis une classification des individus sur la base de leurs coordonnées sur les axes principaux. La représentation des classes sur le nuage de points de l'ACP n'est pas un traitement, simplement une représentation graphique.
Peut-être que l'on pourra plus t'aider si tu nous expose ton problème. L'ACP comme beaucoup d'analyse factorielle sert à identifier la structure de tes données, tu peux donc comparer les pays selon les différentes variables...
Que veux-tu dire quand tu dis que tu ne travailles pas su un échantillon? Le but de l'ACP est de représenter tes données selon dans un repères qui maximise les différences entre les individus. En gros, du passe d'un espace en 15 dimensions dans ton cas, à un espace en 3 ou 4 dimensions intéressantes, c'est dans ce cas que l'ACP réduit le nombre de variable, pas parce que tu supprime des variables, mais parce que certaines variables évoluent conjointement, l'ACP visualise ce phénomène.
Par contre je n'ai pas compris les questions de pré/post traitement. Pour moi tu fais une ACP, puis une classification des individus sur la base de leurs coordonnées sur les axes principaux. La représentation des classes sur le nuage de points de l'ACP n'est pas un traitement, simplement une représentation graphique.
Peut-être que l'on pourra plus t'aider si tu nous expose ton problème. L'ACP comme beaucoup d'analyse factorielle sert à identifier la structure de tes données, tu peux donc comparer les pays selon les différentes variables...
Invité- Invité
Re: Combinaison Analyse Factorielle et Classification
Merci pour ta réponse, elle m'a déjà pas mal éclairé dans mes idées.
Je dois faire une typologie des pays de l'UE selon des critéres socio-économiques.
"Que veux-tu dire quand tu dis que tu ne travailles pas su un échantillon? "
Je veux dire que je ne travail pas sur un échantillon tiré d'une population. J'ai donc tout les individus de la population c'est à dire tout les pays de l'UE. Il n'y a pas eu de tirage aléatoire.
Donc si j'ai bien compris. ça ne pose pas de problèmes de projeter les groupes issues de la CAH (à partie de l'ACP) sur un axe factoriel. J'avais peur qu'il y est un lien.
Et c'est bien meilleur de faire la CAH à partir des coordonnées issues de l'ACP que de la faire directement sur mes données.
Je dois faire une typologie des pays de l'UE selon des critéres socio-économiques.
"Que veux-tu dire quand tu dis que tu ne travailles pas su un échantillon? "
Je veux dire que je ne travail pas sur un échantillon tiré d'une population. J'ai donc tout les individus de la population c'est à dire tout les pays de l'UE. Il n'y a pas eu de tirage aléatoire.
Donc si j'ai bien compris. ça ne pose pas de problèmes de projeter les groupes issues de la CAH (à partie de l'ACP) sur un axe factoriel. J'avais peur qu'il y est un lien.
Et c'est bien meilleur de faire la CAH à partir des coordonnées issues de l'ACP que de la faire directement sur mes données.
Mimina- Nombre de messages : 12
Localisation : Lorraine
Date d'inscription : 27/10/2009
Re: Combinaison Analyse Factorielle et Classification
Le fait que tu analyse l'ensemble des pays ne pose pas de problème. Tant que tu ne veux pas extrapoler tes résultats à l'ensemble des pays du monde...
Pour faire une typologie, l'ACP est parfaite.
Une ACP sur tes différents pays, puis une classification sur les axes factoriels pour prendre en compte le fait que certaines de tes variables sont très structurantes.
Après, tu disais qu'il n'était pas facile de comparer luxembourg et france...
Tout dépend de tes variables, pourquoi pas transformer tes données pour que ce soit des densités ou des indicateurs par habitant.
Cordialement.
Pour faire une typologie, l'ACP est parfaite.
Une ACP sur tes différents pays, puis une classification sur les axes factoriels pour prendre en compte le fait que certaines de tes variables sont très structurantes.
Après, tu disais qu'il n'était pas facile de comparer luxembourg et france...
Tout dépend de tes variables, pourquoi pas transformer tes données pour que ce soit des densités ou des indicateurs par habitant.
Cordialement.
Invité- Invité
Re: Combinaison Analyse Factorielle et Classification
Oui c'est une bonne idée les indicateur par habitant. J'avais aussi pensé a affecter des poids aux individus, j'ai vu que c'était possible avec R.
Mimina- Nombre de messages : 12
Localisation : Lorraine
Date d'inscription : 27/10/2009
Re: Combinaison Analyse Factorielle et Classification
Je sais que c'est possible sous R oui, mais plutot que d'affecter des poids je préfère parler de revenus par habitant par exemple, c'est plus interprétable, plutot qu'une variable revenu ou tout les pays n'ont pas le même poids...
Invité- Invité
Re: Combinaison Analyse Factorielle et Classification
Je ne sais pas si toutes mes variables s'y prêterons. Avec importation, exportation, investissements en recherche... Mais oui c'est évident que ça a plus de sens.
Mais je suis en train de me dire que la pondération ce n'est pas géniale si j'ai déjà certaines de mes variables qui sont par habitant et d'autres pas.
Mais je suis en train de me dire que la pondération ce n'est pas géniale si j'ai déjà certaines de mes variables qui sont par habitant et d'autres pas.
Mimina- Nombre de messages : 12
Localisation : Lorraine
Date d'inscription : 27/10/2009
Re: Combinaison Analyse Factorielle et Classification
Bonjour,
je dois moi aussi réaliser une typologie pour mon stage et j'ai donc fait une ACP et une CAH avec le logiciel SPAD.
Mais je voulais savoir, lorsque je fais la classification on me demande dans les parametres "les coordonnées utilisées pour l'agrégation" et je peux soit choisir les premières soit toutes les coordonnées.
Est-ce que ce nombre de coordonnées utilisées correspond au nombre d'axes que je choisi de concerver pour l'interprétation de mon ACP?
Par défaut ils proposent 10...
Merci
je dois moi aussi réaliser une typologie pour mon stage et j'ai donc fait une ACP et une CAH avec le logiciel SPAD.
Mais je voulais savoir, lorsque je fais la classification on me demande dans les parametres "les coordonnées utilisées pour l'agrégation" et je peux soit choisir les premières soit toutes les coordonnées.
Est-ce que ce nombre de coordonnées utilisées correspond au nombre d'axes que je choisi de concerver pour l'interprétation de mon ACP?
Par défaut ils proposent 10...
Merci
titi- Nombre de messages : 4
Date d'inscription : 17/05/2011
Re: Combinaison Analyse Factorielle et Classification
L'aide SPAD dit ceci "Le choix du nombre d'axes utilisés pour l'agrégation est très important pour la construction de l'arbre et les coupures qui suivront.
Il convient de le choisir en fonction de l'histogramme des valeurs propres de l'analyse et de le faire varier pour mesurer la stabilité de la classification."
Il est possible de conserver la totalité des axes, mais le fait
d’écarter les derniers facteurs (ceux présentant une faible inertie) permet d’éliminer les fluctuations aléatoires qui constituent en général l’essentiel de leur variance. En les abandonnant, on effectue un lissage qui améliore l’homogénéité des classes. Reste à déterminer le nombre de coordonnées conservées.
Il convient de le choisir en fonction de l'histogramme des valeurs propres de l'analyse et de le faire varier pour mesurer la stabilité de la classification."
Il est possible de conserver la totalité des axes, mais le fait
d’écarter les derniers facteurs (ceux présentant une faible inertie) permet d’éliminer les fluctuations aléatoires qui constituent en général l’essentiel de leur variance. En les abandonnant, on effectue un lissage qui améliore l’homogénéité des classes. Reste à déterminer le nombre de coordonnées conservées.
Mimina- Nombre de messages : 12
Localisation : Lorraine
Date d'inscription : 27/10/2009
Re: Combinaison Analyse Factorielle et Classification
De mon coté je choisirai le nombre d'axes correspondant à ton interprétation,
car si tu conserves des axes au delà, tu oriente ta classification sur du bruit dans tes données.
Cordialement.
Hadrien35
EDIT: aparemment je n'ai pas été le plus rapide
car si tu conserves des axes au delà, tu oriente ta classification sur du bruit dans tes données.
Cordialement.
Hadrien35
EDIT: aparemment je n'ai pas été le plus rapide
Invité- Invité
Re: Combinaison Analyse Factorielle et Classification
Merci de votre aide !!
Pour mon ACP j'avais choisi de concerver les 4 premiers axes qui représentaient 55.67% de l'information.
car selon les différentes méthodes qui existent j'avais le choix entre 4 ,7 ou 9 axes. Est-ce que 4 axes sont suffisants?
Pour mon ACP j'avais choisi de concerver les 4 premiers axes qui représentaient 55.67% de l'information.
car selon les différentes méthodes qui existent j'avais le choix entre 4 ,7 ou 9 axes. Est-ce que 4 axes sont suffisants?
titi- Nombre de messages : 4
Date d'inscription : 17/05/2011
Re: Combinaison Analyse Factorielle et Classification
55,67% ça me parait peu. Essaye d'avoir plus de 80% d'info retenue.
Ton ACP n'a pas l'air d'être très représentatif (4axes c'est déjà bcp et tu n'as que 55%). Regarde voir si aucun individu perturbe ton analyse (forte contribution, cos2 faible) si c'est le cas retente en les mettant en illustratif.
Ton ACP n'a pas l'air d'être très représentatif (4axes c'est déjà bcp et tu n'as que 55%). Regarde voir si aucun individu perturbe ton analyse (forte contribution, cos2 faible) si c'est le cas retente en les mettant en illustratif.
Mimina- Nombre de messages : 12
Localisation : Lorraine
Date d'inscription : 27/10/2009
Re: Combinaison Analyse Factorielle et Classification
Tout dépend après tout du type de données sur lesquelles tu travaille...
Dans le cas de données de grandes dimensions, retenir 4 axes pour 55% de l'inertie est un bon résultat! (je ne suis pas un adepte de la méthode des 80% de l'info, qui peut pousser à interpréter du bruit... enfin selon moi)
Mais en effet, tu peux mettre en évidence des exception, ce n'est pas le but je pense, et les éliminer de ton analyse en les considérant comme illustratif.
Dans le cas de données de grandes dimensions, retenir 4 axes pour 55% de l'inertie est un bon résultat! (je ne suis pas un adepte de la méthode des 80% de l'info, qui peut pousser à interpréter du bruit... enfin selon moi)
Mais en effet, tu peux mettre en évidence des exception, ce n'est pas le but je pense, et les éliminer de ton analyse en les considérant comme illustratif.
Invité- Invité
Re: Combinaison Analyse Factorielle et Classification
enfet je n'ai que 66 individus et 20 variables qui sont des évolutions et des valeurs.
Et j'ai un individu qui sort un peu du lot avec 2 valeurs "exceptionnelles". Et du coup après dans ma classification il se retrouve souvent tout seul. Et j'ai essayé de le mettre en illustratif mais du coup après j'ai un autre groupe de 3 individus qui se retrouve isolé donc ca ne m'arrange pas vraiment.
Et justement avec les 80% d'info ca me donne 9 axes à interpréter ce qui me semble beaucoup.
Et lorsque je le met en illustratif ca ne change presque pas au niveau des valeurs propres et c'est même pire je me retrouve avec 51.62% pour 4 axes...
Et j'ai un individu qui sort un peu du lot avec 2 valeurs "exceptionnelles". Et du coup après dans ma classification il se retrouve souvent tout seul. Et j'ai essayé de le mettre en illustratif mais du coup après j'ai un autre groupe de 3 individus qui se retrouve isolé donc ca ne m'arrange pas vraiment.
Et justement avec les 80% d'info ca me donne 9 axes à interpréter ce qui me semble beaucoup.
Et lorsque je le met en illustratif ca ne change presque pas au niveau des valeurs propres et c'est même pire je me retrouve avec 51.62% pour 4 axes...
Dernière édition par titi le Mer 18 Mai 2011 - 9:49, édité 3 fois
titi- Nombre de messages : 4
Date d'inscription : 17/05/2011
Re: Combinaison Analyse Factorielle et Classification
Est ce que dans mon cas les 4 premiers axes vont suffir? Et comment justifier ce choix?
titi- Nombre de messages : 4
Date d'inscription : 17/05/2011
Sujets similaires
» Combinaison ou possibilité
» Analyse factorielle des correspondances
» ACP et analyse factorielle
» analyse factorielle
» analyse factorielle des correspondances
» Analyse factorielle des correspondances
» ACP et analyse factorielle
» analyse factorielle
» analyse factorielle des correspondances
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum