Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
quelle méthode pour réduire une batterie de variable dicho ?
4 participants
Page 1 sur 1
quelle méthode pour réduire une batterie de variable dicho ?
Bonjour à toutes (?) et tous,
C'est mon premier message, mais sans doute pas le dernier.
J'ai à analyser une batterie (18) de variables dichotomique (oui/non) concernant différentes motivations à participer à un festival, Je voudrai voir si on peut relever des configurations de réponses et voir si on peut faire des profil-type parmi les répondant-e-s en fonction des configuration de réponse.
A votre avis, quelle méthode correspondrait le mieux ?
D'avance merci & n'oubliez pas... il faut être gentil avec les pives !
C'est mon premier message, mais sans doute pas le dernier.
J'ai à analyser une batterie (18) de variables dichotomique (oui/non) concernant différentes motivations à participer à un festival, Je voudrai voir si on peut relever des configurations de réponses et voir si on peut faire des profil-type parmi les répondant-e-s en fonction des configuration de réponse.
A votre avis, quelle méthode correspondrait le mieux ?
D'avance merci & n'oubliez pas... il faut être gentil avec les pives !
elpibe- Nombre de messages : 3
Date d'inscription : 06/03/2013
Re: quelle méthode pour réduire une batterie de variable dicho ?
Une méthode, aussi bien pour les variables continues que pour les variables dichotomiques ou qualitatives, est l'Iconographie des corrélations. En outre, elle permet de détecter les "interactions logiques". Par exemple, la variable Y est lié à "A et B", c'est à dire A = oui et B = oui dans ton cas. Ou bien Y est lié à "A et non B", "A ou B", "A ou exclusif B", "A si non B", etc...
xierqi- Nombre de messages : 6
Date d'inscription : 07/03/2013
Re: quelle méthode pour réduire une batterie de variable dicho ?
Bonjour,
Merci bien pour cette réponse. Je dois dire que je n'ai jamais entendu parler de cette méthode et ne suis pas sûr de vouloir m'y frotter.
N'existe-t-il pas une méthode plus "classique" ?
Merci bien pour cette réponse. Je dois dire que je n'ai jamais entendu parler de cette méthode et ne suis pas sûr de vouloir m'y frotter.
N'existe-t-il pas une méthode plus "classique" ?
elpibe- Nombre de messages : 3
Date d'inscription : 06/03/2013
Re: quelle méthode pour réduire une batterie de variable dicho ?
Un moyen simple de sélectionner tes variables est de faire une ACM et de ne conserver que celles qui ont au moins une modalité fortement contributive à la formation de tes axes retenus. Tu peux déjà éliminer les variables présentant une répartiton (oui/non) beaucoup trop déséquilibrée puisque l'ACM est sensible à ce genre de choses.
Pour ce qui est d'établir un profil, tu regardes les variables les plus contributives aux formations des axes et les groupes qu'elles forment, ça te donnera tes profils. Une visualisation de la projection des observations (profil-lignes) te permettra de voir comment se situe ta population au niveau de ces différents groupes de variables et donc profils.
Je pars du principe que tu n'as pas de variable à expliquer. Si c'était le cas une autre méthode plus carré existe: faire des tests du chi2 ou exact de Fisher avec la variable à expliquer ainsi qu'une correction des p-values (Benjamini-Hochberg) et ne retenir que celles liées au sens statistique à la variable à expliquer. Puis sur ces variables retenues, faire ton ACM et reprendre le type d'analyse citée ci-dessus.
Quand à l'iconographie des variables, je connaissais pas non plus, j'ai vite regardé ce que wikipédia en dit, l'outil est séduisant mais pour une personne peut affiliée aux stats et qui cherche à faire simple il y a mieux je pense.
Pour ce qui est d'établir un profil, tu regardes les variables les plus contributives aux formations des axes et les groupes qu'elles forment, ça te donnera tes profils. Une visualisation de la projection des observations (profil-lignes) te permettra de voir comment se situe ta population au niveau de ces différents groupes de variables et donc profils.
Je pars du principe que tu n'as pas de variable à expliquer. Si c'était le cas une autre méthode plus carré existe: faire des tests du chi2 ou exact de Fisher avec la variable à expliquer ainsi qu'une correction des p-values (Benjamini-Hochberg) et ne retenir que celles liées au sens statistique à la variable à expliquer. Puis sur ces variables retenues, faire ton ACM et reprendre le type d'analyse citée ci-dessus.
Quand à l'iconographie des variables, je connaissais pas non plus, j'ai vite regardé ce que wikipédia en dit, l'outil est séduisant mais pour une personne peut affiliée aux stats et qui cherche à faire simple il y a mieux je pense.
Re: quelle méthode pour réduire une batterie de variable dicho ?
A noter que l'Iconographie des Corrélations est une méthode géométrique simple d'emploi: il n'y a aucune hypothèse à faire sur la distribution statistique des données. De plus les "fausses bonnes corrélations" (non pertinentes car dues à une tierce variable) sont éliminées du schéma; et les corrélation masquées sont mises en évidence (ce sont les corrélations faibles parceque la variable d'intérêt dépend de plusieurs variables indépendantes). C'est donc un moyen puissant pour débrousailler les données.
xierqi- Nombre de messages : 6
Date d'inscription : 07/03/2013
Re: quelle méthode pour réduire une batterie de variable dicho ?
C'est pas parce qu'il n'y a pas d'hypothèse que c'est simple. Pour l'ACM, non plus tu ne fais pas d'hypothèse pourtant la lecture même si le calcul est à 100% géométrique reste complexe. J'ai également jeté un oeil via wikipedia et on peut pas dire que la lecture des graphiques soit très directe ni très simple.A noter que l'Iconographie des Corrélations est une méthode géométrique simple d'emploi: il n'y a aucune hypothèse à faire sur la distribution statistique des données
Bref, c'est un autre méthode, une de plus mais elle a néanmoins un défaut majeur c'est cette histoire de seuil sur la corrélation. Elle subit donc nécessairement les plus gros défaut de la valeur de la corrélation, notamment parce qu'elle repose sur la moyenne et qui elle est fortement influencée par les valeurs extrêmes ou encore correspond mal aux distributions non-symétriques.
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: quelle méthode pour réduire une batterie de variable dicho ?
Tes objections montrent que tu n'as pas pratiqué la méthode (ce qui n'est pas un reproche, car la méthode est encore peu connue). Le résultat est en général peu sensible au seuil qu'il est d'ailleurs possible de faire varier en temps réel. Il faut noter que le critère d'élimination des liens par les corrélations partielles est extrêmement sévère. Les liens qui subsistent sont presque toujours pertinents. Un seuil trop haut fait perdre de l'information physiquement intéressante.
Mathématiquement, la corrélation est un COSINUS entre deux vecteurs centrés réduits à n dimensions. Donc la moyenne n'intervient pas: on étudie les variations de chaque variable autour de sa moyenne.
L'iconographie des corrélations est un problème de trigonométrie sphérique sur la sphère à n dimensions. Il est toujours licite de calculer le cosinus entre deux vecteurs, quels qu'ils soient. Une corrélation nulle est le cosinus d'un angle droit, et comme telle contient autant d'information qu'une corrélation égale à 1 (cosinus d'un angle nul). Le principe du calcul est le même que celui du positionnement par GPS, lui aussi fondé sur la trigonométrie sphérique, et, comme tel ,nécessite pour une bonne précision de conserver toutes les décimales du cosinus. Du point de vue du positionnement par recoupement d'informations d'origine diverses, les angles droits engendrent beaucoup moins d'erreur de position sur le schéma d'ensemble que les angles nuls.
En d'autres termes, une "non corrélation" est une information aussi intéressante, sinon plus, qu'une forte corrélation, pour une interprétation correcte de l'organisation d'ensemble du tableau des données.
Mathématiquement, la corrélation est un COSINUS entre deux vecteurs centrés réduits à n dimensions. Donc la moyenne n'intervient pas: on étudie les variations de chaque variable autour de sa moyenne.
L'iconographie des corrélations est un problème de trigonométrie sphérique sur la sphère à n dimensions. Il est toujours licite de calculer le cosinus entre deux vecteurs, quels qu'ils soient. Une corrélation nulle est le cosinus d'un angle droit, et comme telle contient autant d'information qu'une corrélation égale à 1 (cosinus d'un angle nul). Le principe du calcul est le même que celui du positionnement par GPS, lui aussi fondé sur la trigonométrie sphérique, et, comme tel ,nécessite pour une bonne précision de conserver toutes les décimales du cosinus. Du point de vue du positionnement par recoupement d'informations d'origine diverses, les angles droits engendrent beaucoup moins d'erreur de position sur le schéma d'ensemble que les angles nuls.
En d'autres termes, une "non corrélation" est une information aussi intéressante, sinon plus, qu'une forte corrélation, pour une interprétation correcte de l'organisation d'ensemble du tableau des données.
xierqi- Nombre de messages : 6
Date d'inscription : 07/03/2013
Re: quelle méthode pour réduire une batterie de variable dicho ?
Bon, j'admire ta passion pour cet outil que tu nous rabâches sur plusieurs topics (au risque de nous sortir des topics dont on avait tous oublié l'existence, 2009 pour le plus vieux que tu aies up je crois...) mais en l’occurrence il faut savoir s'adapter aux gens qui viennent sur le forum.
L'auteur du topic serait quelqu'un comme Nik ou Niaboc (je prend le premier en exemple car il s'exprime avec toi et le second car ils demandent souvent des conseils d'un niveau plus poussé que la majeur partie des gens qui viennent ici pour être aidé) je t'encouragerais à nous en parler avec plus de précision. Mais là nous sommes en présence d'un "cas basique" (désolé pour l'expression maladroite) qui demande juste une méthode simple et efficace pour faire cracher son jeu de données et je doute qu'on puisse difficilement faire mieux qu'une ACM étant donné le contexte.
L'auteur du topic serait quelqu'un comme Nik ou Niaboc (je prend le premier en exemple car il s'exprime avec toi et le second car ils demandent souvent des conseils d'un niveau plus poussé que la majeur partie des gens qui viennent ici pour être aidé) je t'encouragerais à nous en parler avec plus de précision. Mais là nous sommes en présence d'un "cas basique" (désolé pour l'expression maladroite) qui demande juste une méthode simple et efficace pour faire cracher son jeu de données et je doute qu'on puisse difficilement faire mieux qu'une ACM étant donné le contexte.
Re: quelle méthode pour réduire une batterie de variable dicho ?
J'en rajoute pas plus pour ne pas polluer davantage le topic en HS. Xierqi, tu peux toujours ouvrir un nouveau sujet si tu souhaites détailler ta présentation sur cet outil.
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Sujets similaires
» Quelle méthode pour intervalle de confiance?
» Quelle méthode pour estimer une série temporelle?
» Quelle méthode pour prévoir un événement cyclique ?
» quelle méthode de calcul utiliser ?
» Quelle méthode d'analyse choisir ?
» Quelle méthode pour estimer une série temporelle?
» Quelle méthode pour prévoir un événement cyclique ?
» quelle méthode de calcul utiliser ?
» Quelle méthode d'analyse choisir ?
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum