Les posteurs les plus actifs de la semaine
Eric Wajnberg
 
jujuSA
 
Ayana
 
pvdv
 
Bibilerikiki
 
Mr. Shidokaz
 
zezima
 
niaboc
 
droopy
 
MatthDan
 


Traitement des questions fermées à choix multiple

Voir le sujet précédent Voir le sujet suivant Aller en bas

Traitement des questions fermées à choix multiple

Message par Cali13 le Dim 4 Sep 2016 - 12:57

Bonjour à tous.

Je suis confrontée à une problème de raisonnement statistique dont je ne trouve pas la réponse malgré mes recherches. Le problème doit pourtant être courant...

Admettons que nous voulions tester l'effet de la couleur des murs d'une pièce (trois modalités : vert, rouge, bleu) sur le score d'un exercice d'attention réalisé dans ladite pièce.

Une ANOVA à un facteur permet de comparer entre elles les trois moyennes de la variable "Couleur".

Mais admettons maintenant qu'une pièce puisse avoir plusieurs couleurs (certaines pièces ayant deux couleurs, d'autres trois, d'autres encore une seule). Il est nécessaire de découper, lors du recueil de données, la variable "Couleur" en trois colonnes dichotomiques -une pour "vert", une pour "rouge", une pour "bleu"- et d'indiquer dans chaque colonne pour chaque ligne si "oui" ou "non" le participant a été exposé à la couleur en question.
Quel test doit-on alors réaliser pour comparer les moyennes du score d'attention de "vert", "rouge" et "bleu" ?!

En d'autres termes, je sais comment traiter les données d'une question fermée à une réponse. En revanche je n'arrive pas à saisir comment comparer les réponses nominales d'une question fermée à choix multiple !


J'espère pouvoir bénéficier de votre aide ! Elle me serait d'une grande utilité ! Smile

Cali13

Nombre de messages : 10
Date d'inscription : 03/09/2016

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Traitement des questions fermées à choix multiple

Message par Nik le Lun 5 Sep 2016 - 7:09

Bonjour Cali13,

Je crois que tu te compliques la vie dans ta réflexion du fait d'une mauvaise approche de l'ANOVA. Vu comme cette dernière est enseignée il est toujours utile de rappeler que l'ANOVA n'est rien d'autre qu'une régression (simple ou multiple) dont la variable explicative est catégorielle. En fait on devrait faire définitivement diparaître ce foutu nom d'ANOVA. Smile
A partir de ça, tu peux rentrer dans ton modèle les couleurs sous forme de trois variables explicatives binaires (oui ou non pour la couleur) et peut être faut-il rentrer le nombre de couleur de la pièce. A toi de voir si tu as aussi le moyen d'entrer les interactions et si cela est intéressant pour ton étude.

Donc en d'autres termes, tu sais parfaitement traiter ce cas Wink

Nik

Nik

Nombre de messages : 1542
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Traitement des questions fermées à choix multiple

Message par c@ssoulet le Lun 5 Sep 2016 - 8:03

Il n'y a pas de recette miracle toute faite. Mais généralement, la variable couleur est "splittée" en 3 variables dichotomiques vert rouge bleu (codées en 0/1). Si tu lis des trucs en Anglais, cette facon de faire s'appelle générer des "dummy variables".

Il y a d'autres facons de faire, mais le choix est étroitement dépendant des caractéristiques de la variable et ca nécessite un conseil spécialisé.

c@ssoulet

Nombre de messages : 718
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Traitement des questions fermées à choix multiple

Message par Cali13 le Mar 6 Sep 2016 - 17:21

Bonjour,

Merci à vous deux d'avoir répondu !

Nik a écrit:
l'ANOVA n'est rien d'autre qu'une régression (simple ou multiple) dont la variable explicative est catégorielle.
Effectivement, j'avoue n'avoir jamais réalisé ceci  Rolling Eyes

Nik a écrit:A partir de ça, tu peux rentrer dans ton modèle les couleurs sous forme de trois variables explicatives binaires (oui ou non pour la couleur) et peut être faut-il rentrer le nombre de couleur de la pièce. A toi de voir si tu as aussi le moyen d'entrer les interactions et si cela est intéressant pour ton étude.
Hum je ne suis pas sûre de comprendre comment je peux rentrer le nombre de couleurs dans la pièce...? Mais je ne vais pas prendre en compte le nombre de couleurs dans la pièce, ni l'effet d'interaction entre les couleurs.

c@ssoulet a écrit:Si tu lis des trucs en Anglais, cette facon de faire s'appelle générer des "dummy variables".

Cette façon de faire correspond à ce que je cherchais ; merci pour le tuyau, je suis allée voir ces "dummy variables" (des statistiques en Anglais, toujours plus...! clown ).


Cependant, maintenant que j'ai réalisé qu'ANOVA et Régression linéaire avaient la même "base", reste que je ne sais pas quel test il vaut mieux que j'applique. J'utilise le logiciel R et il y a des commandes différentes pour une ANOVA et une régression linéaire. Je me suis documentée sur ces "variables indicatrices" et j'ai fouiné toute l'aprem mais je ne comprends pas tout...  No

Je crois avoir compris que je peux réaliser une régression linéaire multiple avec une commande de ce type : "test<-lm(VD~VI1+VI2+VI3)", chaque VI ayant donc deux modalités. Chaque première modalité de la variable sert de référence pour que la deuxième modalité y soit comparée. La p-value que j'obtiens m'indique donc (si p<.05) que la deuxième modalité influence la VD, comparée à la première modalité (je dis pas de bêtise ?), et ceci pour chacune des trois variables.
Si je réalise une ANOVA à plusieurs facteurs (en l'occurrence trois, mes trois couleurs), je vais savoir si la couleur verte (avec ses deux modalités, à savoir "oui" ou "non") influence significativement la VD, idem pour le rouge et idem pour le bleu.
Je touche du doigt la différence entre ces deux procédés mais... je n'arrive pas à METTRE le doigt dessus, si on peut dire. Je n'arrive pas à saisir la différence des deux procédés, pourtant je vois bien que les résultats obtenus sont différents.

Et puis surtout, savoir s'il y a une différence entre "oui" et "non" pour bleu, puis pour rouge, puis pour vert (ou savoir si bleu, rouge ou vert influencent via leurs deux différentes modalités la VD), ne me dit pas si ces différences-là sont différentes entre elles !?! Car ce que je voulais au départ, c'est quand même savoir s'il y a des couleurs qui influencent plus que les autres ou non la VD...?

J'ai essayé de synthétiser mes questions après mes recherches, j'espère ne pas être trop longue ni pénible, mais les statistiques ne sont pas trop mes amies.

J'espère de nouveau pouvoir compter sur votre aide, avec un grand merci évidemment...!

Cali13

Nombre de messages : 10
Date d'inscription : 03/09/2016

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Traitement des questions fermées à choix multiple

Message par Eric Wajnberg le Mer 7 Sep 2016 - 3:58

Cali13 a écrit:Je crois avoir compris que je peux réaliser une régression linéaire multiple avec une commande de ce type : "test<-lm(VD~VI1+VI2+VI3)", chaque VI ayant donc deux modalités. Chaque première modalité de la variable sert de référence pour que la deuxième modalité y soit comparée. La p-value que j'obtiens m'indique donc (si p<.05) que la deuxième modalité influence la VD, comparée à la première modalité (je dis pas de bêtise ?), et ceci pour chacune des trois variables.
Oui, c'est bien ça.
Cali13 a écrit:Si je réalise une ANOVA à plusieurs facteurs (en l'occurrence trois, mes trois couleurs), je vais savoir si la couleur verte (avec ses deux modalités, à savoir "oui" ou "non") influence significativement la VD, idem pour le rouge et idem pour le bleu.
Oui, c'est bien ça aussi.
Cali13 a écrit:Je touche du doigt la différence entre ces deux procédés mais... je n'arrive pas à METTRE le doigt dessus, si on peut dire. Je n'arrive pas à saisir la différence des deux procédés, pourtant je vois bien que les résultats obtenus sont différents.
La réponse est qu'il n'y a pas de différence entre régression multiple et ANOVA à plusieurs facteurs. Ces deux approches sont en fait des déclinaisons différentes de ce que l'on appelle un modèle linéaire général. C'est exactement le même calcul qui est fait dans les deux cas, et l'interprétation des résultats reste la même.
Cali13 a écrit:Et puis surtout, savoir s'il y a une différence entre "oui" et "non" pour bleu, puis pour rouge, puis pour vert (ou savoir si bleu, rouge ou vert influencent via leurs deux différentes modalités la VD), ne me dit pas si ces différences-là sont différentes entre elles !?! Car ce que je voulais au départ, c'est quand même savoir s'il y a des couleurs qui influencent plus que les autres ou non la VD...?
Dans la mesure où une ANOVA n'est rien d'autres qu'une régression, on calcul des pentes dans une ANOVA également, et l'on peut faire des comparaisons de ces pentes. On peut donc savoir si l'effet de rouge, par exemple, est plus fort significativement que bleu, etc. Pour information, sous R, on peut récupérer ces pentes et leur SE avec summary(lm(VD~VI1+VI2+VI3)), etc.

HTH, Eric.
avatar
Eric Wajnberg

Nombre de messages : 513
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Traitement des questions fermées à choix multiple

Message par Cali13 le Mer 7 Sep 2016 - 14:19

Bonjour.

D'accord.
Merci de me préciser que je suis sur le bon chemin !

Alors peut-être est-ce un problème lié à R et je devrais dans ce cas changer de topic, mais lorsque que je fais "lm(VD~VI1+VI2+VI3)" et "aov(VD~VI1+VI2+VI3)", je n'ai vraiment pas les mêmes résultats, les p-values ne sont pas les mêmes et ce ne sont pas les mêmes VI qui sont indiquées comme significativement différentes. Mon interprétation est donc différente selon que je lance une ANOVA ou une régression... scratch

Cali13

Nombre de messages : 10
Date d'inscription : 03/09/2016

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Traitement des questions fermées à choix multiple

Message par Eric Wajnberg le Mer 7 Sep 2016 - 16:01

C'est juste un problème de présentation des résultats dans les deux cas.

Vu du coté de l'anova, on récupère les tests globaux avec summary(aov(VD~VI1+VI2+VI3)). Vu du coté de la régression, on récupère la même chose avec anova(lm(VD~VI1+VI2+VI3)).

On doit retrouver les mêmes résultats, exactement. Si vous ne trouvez pas la même chose, c'est qu'il y a un problème dans vos syntaxes. Et tâchez de nous donner ici vos données qu'on comprenne alors ce qui se passe.

Cordialement, Eric.
avatar
Eric Wajnberg

Nombre de messages : 513
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Traitement des questions fermées à choix multiple

Message par Cali13 le Mer 7 Sep 2016 - 18:24

Aah... Aah ! Il me manquait la commande "anova(lm(VD~VI1+VI2+VI3))". Les résultats sont désormais les mêmes !

Je crois que mon problème est résolu. Merci beaucoup pour votre aide.
Je reviendrai peut-être bientôt si je ne me sors pas de toutes mes autres interrogations... Wink

Bonne soirée.

Cali13

Nombre de messages : 10
Date d'inscription : 03/09/2016

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Traitement des questions fermées à choix multiple

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum