Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
nombre de variables et nombres d'observations pour ACM
3 participants
Page 1 sur 1
nombre de variables et nombres d'observations pour ACM
Bonjour à tous,
je souhaite réaliser une analyse des correspondances multiples (ACM) afin d'établir une typologies de ménages pour lesquels je dispose d'un nombre très important de variables qualitatives. J'ai cherché dans un premier temps à réduire ce nombre de variables en étudiant les liens éventuels existants entre elles (par un test exact de fisher) et en éliminant celles porteuses d'informations redondantes.J'ai également éliminé certaines variables qui semblaient peu pertinentes d'un point de vue "thématique".
Après cette première étape il me reste toujours un nombre important de variables (une vingtaine formant 71 modalités au total) pour un nombre relativement peu élevé d'observations (une soixantaine), et d'un point de vue thématique j'aurai du mal à éliminer d'autres variables sans perdre de l'information. J'ai lu que pour une ACM de bonne qualité, il fallait autant que possible limiter le nombre de variables en particulier au regard du nombre d'observations. Cependant je n'ai pas trouver de critères ni de conseils particulier par rapport à la détermination de ce nombre, ce qui m'amène à poser les questions suivantes :
1) avec une vingtaine de variables (71 modalités) pour une soixantaine d'individus, est-ce que la qualité de l'ACM est remise en question ?
2) compte tenu du nombre important de modalités (71), les contributions de chacune d'entre elles aux différents axes sont toujours faibles (les plus importantes ne dépassent pas les 12% et la plupart tournent autour de quelques % seulement). Dans ce contexte comment choisir quelles modalités prendre en compte pour interpréter les axes, serait-on en mesure de fixer un critère pertinent ? ou peut-on choisir arbitrairement les X premières modalités contribuant le plus...?
Merci !
je souhaite réaliser une analyse des correspondances multiples (ACM) afin d'établir une typologies de ménages pour lesquels je dispose d'un nombre très important de variables qualitatives. J'ai cherché dans un premier temps à réduire ce nombre de variables en étudiant les liens éventuels existants entre elles (par un test exact de fisher) et en éliminant celles porteuses d'informations redondantes.J'ai également éliminé certaines variables qui semblaient peu pertinentes d'un point de vue "thématique".
Après cette première étape il me reste toujours un nombre important de variables (une vingtaine formant 71 modalités au total) pour un nombre relativement peu élevé d'observations (une soixantaine), et d'un point de vue thématique j'aurai du mal à éliminer d'autres variables sans perdre de l'information. J'ai lu que pour une ACM de bonne qualité, il fallait autant que possible limiter le nombre de variables en particulier au regard du nombre d'observations. Cependant je n'ai pas trouver de critères ni de conseils particulier par rapport à la détermination de ce nombre, ce qui m'amène à poser les questions suivantes :
1) avec une vingtaine de variables (71 modalités) pour une soixantaine d'individus, est-ce que la qualité de l'ACM est remise en question ?
2) compte tenu du nombre important de modalités (71), les contributions de chacune d'entre elles aux différents axes sont toujours faibles (les plus importantes ne dépassent pas les 12% et la plupart tournent autour de quelques % seulement). Dans ce contexte comment choisir quelles modalités prendre en compte pour interpréter les axes, serait-on en mesure de fixer un critère pertinent ? ou peut-on choisir arbitrairement les X premières modalités contribuant le plus...?
Merci !
helo- Nombre de messages : 5
Date d'inscription : 02/06/2012
Re: nombre de variables et nombres d'observations pour ACM
Tu peux éventuellement diminuer le nombre de modalité en faisant des regroupements au sein de tes variables (s'ils restent cohérent avec le thème de la variable), sinon en effet 71 modalités c'est vraiment beaucoup...
Concernant la contribution je te recommanderais de conserver uniquement les plus importantes, quitte à définir un critère personnel et justifier le fait que malgré toutes tes démarches tu n'arrives pas à diminuer suffisamment ton jeu de données.
Concernant la contribution je te recommanderais de conserver uniquement les plus importantes, quitte à définir un critère personnel et justifier le fait que malgré toutes tes démarches tu n'arrives pas à diminuer suffisamment ton jeu de données.
Re: nombre de variables et nombres d'observations pour ACM
Salut,
Non le nb de variables dans une ACM ne pose pas de problème. C'est une analyse symétrique et il y a assez peu d'effet du nombre d'individus par rapport au nombre de variables. On est pas dans un modèle d'estimation des paramètres.
Pour l'interprétation des axes tu peux effectivement retenir les plus fortes.
nik
Non le nb de variables dans une ACM ne pose pas de problème. C'est une analyse symétrique et il y a assez peu d'effet du nombre d'individus par rapport au nombre de variables. On est pas dans un modèle d'estimation des paramètres.
Pour l'interprétation des axes tu peux effectivement retenir les plus fortes.
nik
Dernière édition par Nik le Jeu 7 Juin 2012 - 7:52, édité 1 fois
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: nombre de variables et nombres d'observations pour ACM
il y a assez peu d'effet du nombre d'individus par rapport au nombre de variables
Voilà!
Sujets similaires
» Grand nombre de variables
» Nombre de variables pour ACP
» Classification - grand nombre d'individus & de variables
» comparaison de nombres dans le temps
» Nombre de sujets nécessaires
» Nombre de variables pour ACP
» Classification - grand nombre d'individus & de variables
» comparaison de nombres dans le temps
» Nombre de sujets nécessaires
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|