Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Traitement des questions fermées à choix multiple
4 participants
Page 1 sur 1
Traitement des questions fermées à choix multiple
Bonjour à tous.
Je suis confrontée à une problème de raisonnement statistique dont je ne trouve pas la réponse malgré mes recherches. Le problème doit pourtant être courant...
Admettons que nous voulions tester l'effet de la couleur des murs d'une pièce (trois modalités : vert, rouge, bleu) sur le score d'un exercice d'attention réalisé dans ladite pièce.
Une ANOVA à un facteur permet de comparer entre elles les trois moyennes de la variable "Couleur".
Mais admettons maintenant qu'une pièce puisse avoir plusieurs couleurs (certaines pièces ayant deux couleurs, d'autres trois, d'autres encore une seule). Il est nécessaire de découper, lors du recueil de données, la variable "Couleur" en trois colonnes dichotomiques -une pour "vert", une pour "rouge", une pour "bleu"- et d'indiquer dans chaque colonne pour chaque ligne si "oui" ou "non" le participant a été exposé à la couleur en question.
Quel test doit-on alors réaliser pour comparer les moyennes du score d'attention de "vert", "rouge" et "bleu" ?!
En d'autres termes, je sais comment traiter les données d'une question fermée à une réponse. En revanche je n'arrive pas à saisir comment comparer les réponses nominales d'une question fermée à choix multiple !
J'espère pouvoir bénéficier de votre aide ! Elle me serait d'une grande utilité !
Je suis confrontée à une problème de raisonnement statistique dont je ne trouve pas la réponse malgré mes recherches. Le problème doit pourtant être courant...
Admettons que nous voulions tester l'effet de la couleur des murs d'une pièce (trois modalités : vert, rouge, bleu) sur le score d'un exercice d'attention réalisé dans ladite pièce.
Une ANOVA à un facteur permet de comparer entre elles les trois moyennes de la variable "Couleur".
Mais admettons maintenant qu'une pièce puisse avoir plusieurs couleurs (certaines pièces ayant deux couleurs, d'autres trois, d'autres encore une seule). Il est nécessaire de découper, lors du recueil de données, la variable "Couleur" en trois colonnes dichotomiques -une pour "vert", une pour "rouge", une pour "bleu"- et d'indiquer dans chaque colonne pour chaque ligne si "oui" ou "non" le participant a été exposé à la couleur en question.
Quel test doit-on alors réaliser pour comparer les moyennes du score d'attention de "vert", "rouge" et "bleu" ?!
En d'autres termes, je sais comment traiter les données d'une question fermée à une réponse. En revanche je n'arrive pas à saisir comment comparer les réponses nominales d'une question fermée à choix multiple !
J'espère pouvoir bénéficier de votre aide ! Elle me serait d'une grande utilité !
Cali13- Nombre de messages : 10
Date d'inscription : 03/09/2016
Re: Traitement des questions fermées à choix multiple
Bonjour Cali13,
Je crois que tu te compliques la vie dans ta réflexion du fait d'une mauvaise approche de l'ANOVA. Vu comme cette dernière est enseignée il est toujours utile de rappeler que l'ANOVA n'est rien d'autre qu'une régression (simple ou multiple) dont la variable explicative est catégorielle. En fait on devrait faire définitivement diparaître ce foutu nom d'ANOVA.
A partir de ça, tu peux rentrer dans ton modèle les couleurs sous forme de trois variables explicatives binaires (oui ou non pour la couleur) et peut être faut-il rentrer le nombre de couleur de la pièce. A toi de voir si tu as aussi le moyen d'entrer les interactions et si cela est intéressant pour ton étude.
Donc en d'autres termes, tu sais parfaitement traiter ce cas
Nik
Je crois que tu te compliques la vie dans ta réflexion du fait d'une mauvaise approche de l'ANOVA. Vu comme cette dernière est enseignée il est toujours utile de rappeler que l'ANOVA n'est rien d'autre qu'une régression (simple ou multiple) dont la variable explicative est catégorielle. En fait on devrait faire définitivement diparaître ce foutu nom d'ANOVA.
A partir de ça, tu peux rentrer dans ton modèle les couleurs sous forme de trois variables explicatives binaires (oui ou non pour la couleur) et peut être faut-il rentrer le nombre de couleur de la pièce. A toi de voir si tu as aussi le moyen d'entrer les interactions et si cela est intéressant pour ton étude.
Donc en d'autres termes, tu sais parfaitement traiter ce cas
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Traitement des questions fermées à choix multiple
Il n'y a pas de recette miracle toute faite. Mais généralement, la variable couleur est "splittée" en 3 variables dichotomiques vert rouge bleu (codées en 0/1). Si tu lis des trucs en Anglais, cette facon de faire s'appelle générer des "dummy variables".
Il y a d'autres facons de faire, mais le choix est étroitement dépendant des caractéristiques de la variable et ca nécessite un conseil spécialisé.
Il y a d'autres facons de faire, mais le choix est étroitement dépendant des caractéristiques de la variable et ca nécessite un conseil spécialisé.
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Re: Traitement des questions fermées à choix multiple
Bonjour,
Merci à vous deux d'avoir répondu !
Cette façon de faire correspond à ce que je cherchais ; merci pour le tuyau, je suis allée voir ces "dummy variables" (des statistiques en Anglais, toujours plus...! ).
Cependant, maintenant que j'ai réalisé qu'ANOVA et Régression linéaire avaient la même "base", reste que je ne sais pas quel test il vaut mieux que j'applique. J'utilise le logiciel R et il y a des commandes différentes pour une ANOVA et une régression linéaire. Je me suis documentée sur ces "variables indicatrices" et j'ai fouiné toute l'aprem mais je ne comprends pas tout...
Je crois avoir compris que je peux réaliser une régression linéaire multiple avec une commande de ce type : "test<-lm(VD~VI1+VI2+VI3)", chaque VI ayant donc deux modalités. Chaque première modalité de la variable sert de référence pour que la deuxième modalité y soit comparée. La p-value que j'obtiens m'indique donc (si p<.05) que la deuxième modalité influence la VD, comparée à la première modalité (je dis pas de bêtise ?), et ceci pour chacune des trois variables.
Si je réalise une ANOVA à plusieurs facteurs (en l'occurrence trois, mes trois couleurs), je vais savoir si la couleur verte (avec ses deux modalités, à savoir "oui" ou "non") influence significativement la VD, idem pour le rouge et idem pour le bleu.
Je touche du doigt la différence entre ces deux procédés mais... je n'arrive pas à METTRE le doigt dessus, si on peut dire. Je n'arrive pas à saisir la différence des deux procédés, pourtant je vois bien que les résultats obtenus sont différents.
Et puis surtout, savoir s'il y a une différence entre "oui" et "non" pour bleu, puis pour rouge, puis pour vert (ou savoir si bleu, rouge ou vert influencent via leurs deux différentes modalités la VD), ne me dit pas si ces différences-là sont différentes entre elles !?! Car ce que je voulais au départ, c'est quand même savoir s'il y a des couleurs qui influencent plus que les autres ou non la VD...?
J'ai essayé de synthétiser mes questions après mes recherches, j'espère ne pas être trop longue ni pénible, mais les statistiques ne sont pas trop mes amies.
J'espère de nouveau pouvoir compter sur votre aide, avec un grand merci évidemment...!
Merci à vous deux d'avoir répondu !
Effectivement, j'avoue n'avoir jamais réalisé ceciNik a écrit:
l'ANOVA n'est rien d'autre qu'une régression (simple ou multiple) dont la variable explicative est catégorielle.
Hum je ne suis pas sûre de comprendre comment je peux rentrer le nombre de couleurs dans la pièce...? Mais je ne vais pas prendre en compte le nombre de couleurs dans la pièce, ni l'effet d'interaction entre les couleurs.Nik a écrit:A partir de ça, tu peux rentrer dans ton modèle les couleurs sous forme de trois variables explicatives binaires (oui ou non pour la couleur) et peut être faut-il rentrer le nombre de couleur de la pièce. A toi de voir si tu as aussi le moyen d'entrer les interactions et si cela est intéressant pour ton étude.
c@ssoulet a écrit:Si tu lis des trucs en Anglais, cette facon de faire s'appelle générer des "dummy variables".
Cette façon de faire correspond à ce que je cherchais ; merci pour le tuyau, je suis allée voir ces "dummy variables" (des statistiques en Anglais, toujours plus...! ).
Cependant, maintenant que j'ai réalisé qu'ANOVA et Régression linéaire avaient la même "base", reste que je ne sais pas quel test il vaut mieux que j'applique. J'utilise le logiciel R et il y a des commandes différentes pour une ANOVA et une régression linéaire. Je me suis documentée sur ces "variables indicatrices" et j'ai fouiné toute l'aprem mais je ne comprends pas tout...
Je crois avoir compris que je peux réaliser une régression linéaire multiple avec une commande de ce type : "test<-lm(VD~VI1+VI2+VI3)", chaque VI ayant donc deux modalités. Chaque première modalité de la variable sert de référence pour que la deuxième modalité y soit comparée. La p-value que j'obtiens m'indique donc (si p<.05) que la deuxième modalité influence la VD, comparée à la première modalité (je dis pas de bêtise ?), et ceci pour chacune des trois variables.
Si je réalise une ANOVA à plusieurs facteurs (en l'occurrence trois, mes trois couleurs), je vais savoir si la couleur verte (avec ses deux modalités, à savoir "oui" ou "non") influence significativement la VD, idem pour le rouge et idem pour le bleu.
Je touche du doigt la différence entre ces deux procédés mais... je n'arrive pas à METTRE le doigt dessus, si on peut dire. Je n'arrive pas à saisir la différence des deux procédés, pourtant je vois bien que les résultats obtenus sont différents.
Et puis surtout, savoir s'il y a une différence entre "oui" et "non" pour bleu, puis pour rouge, puis pour vert (ou savoir si bleu, rouge ou vert influencent via leurs deux différentes modalités la VD), ne me dit pas si ces différences-là sont différentes entre elles !?! Car ce que je voulais au départ, c'est quand même savoir s'il y a des couleurs qui influencent plus que les autres ou non la VD...?
J'ai essayé de synthétiser mes questions après mes recherches, j'espère ne pas être trop longue ni pénible, mais les statistiques ne sont pas trop mes amies.
J'espère de nouveau pouvoir compter sur votre aide, avec un grand merci évidemment...!
Cali13- Nombre de messages : 10
Date d'inscription : 03/09/2016
Re: Traitement des questions fermées à choix multiple
Oui, c'est bien ça.Cali13 a écrit:Je crois avoir compris que je peux réaliser une régression linéaire multiple avec une commande de ce type : "test<-lm(VD~VI1+VI2+VI3)", chaque VI ayant donc deux modalités. Chaque première modalité de la variable sert de référence pour que la deuxième modalité y soit comparée. La p-value que j'obtiens m'indique donc (si p<.05) que la deuxième modalité influence la VD, comparée à la première modalité (je dis pas de bêtise ?), et ceci pour chacune des trois variables.
Oui, c'est bien ça aussi.Cali13 a écrit:Si je réalise une ANOVA à plusieurs facteurs (en l'occurrence trois, mes trois couleurs), je vais savoir si la couleur verte (avec ses deux modalités, à savoir "oui" ou "non") influence significativement la VD, idem pour le rouge et idem pour le bleu.
La réponse est qu'il n'y a pas de différence entre régression multiple et ANOVA à plusieurs facteurs. Ces deux approches sont en fait des déclinaisons différentes de ce que l'on appelle un modèle linéaire général. C'est exactement le même calcul qui est fait dans les deux cas, et l'interprétation des résultats reste la même.Cali13 a écrit:Je touche du doigt la différence entre ces deux procédés mais... je n'arrive pas à METTRE le doigt dessus, si on peut dire. Je n'arrive pas à saisir la différence des deux procédés, pourtant je vois bien que les résultats obtenus sont différents.
Dans la mesure où une ANOVA n'est rien d'autres qu'une régression, on calcul des pentes dans une ANOVA également, et l'on peut faire des comparaisons de ces pentes. On peut donc savoir si l'effet de rouge, par exemple, est plus fort significativement que bleu, etc. Pour information, sous R, on peut récupérer ces pentes et leur SE avec summary(lm(VD~VI1+VI2+VI3)), etc.Cali13 a écrit:Et puis surtout, savoir s'il y a une différence entre "oui" et "non" pour bleu, puis pour rouge, puis pour vert (ou savoir si bleu, rouge ou vert influencent via leurs deux différentes modalités la VD), ne me dit pas si ces différences-là sont différentes entre elles !?! Car ce que je voulais au départ, c'est quand même savoir s'il y a des couleurs qui influencent plus que les autres ou non la VD...?
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Traitement des questions fermées à choix multiple
Bonjour.
D'accord.
Merci de me préciser que je suis sur le bon chemin !
Alors peut-être est-ce un problème lié à R et je devrais dans ce cas changer de topic, mais lorsque que je fais "lm(VD~VI1+VI2+VI3)" et "aov(VD~VI1+VI2+VI3)", je n'ai vraiment pas les mêmes résultats, les p-values ne sont pas les mêmes et ce ne sont pas les mêmes VI qui sont indiquées comme significativement différentes. Mon interprétation est donc différente selon que je lance une ANOVA ou une régression...
D'accord.
Merci de me préciser que je suis sur le bon chemin !
Alors peut-être est-ce un problème lié à R et je devrais dans ce cas changer de topic, mais lorsque que je fais "lm(VD~VI1+VI2+VI3)" et "aov(VD~VI1+VI2+VI3)", je n'ai vraiment pas les mêmes résultats, les p-values ne sont pas les mêmes et ce ne sont pas les mêmes VI qui sont indiquées comme significativement différentes. Mon interprétation est donc différente selon que je lance une ANOVA ou une régression...
Cali13- Nombre de messages : 10
Date d'inscription : 03/09/2016
Re: Traitement des questions fermées à choix multiple
C'est juste un problème de présentation des résultats dans les deux cas.
Vu du coté de l'anova, on récupère les tests globaux avec summary(aov(VD~VI1+VI2+VI3)). Vu du coté de la régression, on récupère la même chose avec anova(lm(VD~VI1+VI2+VI3)).
On doit retrouver les mêmes résultats, exactement. Si vous ne trouvez pas la même chose, c'est qu'il y a un problème dans vos syntaxes. Et tâchez de nous donner ici vos données qu'on comprenne alors ce qui se passe.
Cordialement, Eric.
Vu du coté de l'anova, on récupère les tests globaux avec summary(aov(VD~VI1+VI2+VI3)). Vu du coté de la régression, on récupère la même chose avec anova(lm(VD~VI1+VI2+VI3)).
On doit retrouver les mêmes résultats, exactement. Si vous ne trouvez pas la même chose, c'est qu'il y a un problème dans vos syntaxes. Et tâchez de nous donner ici vos données qu'on comprenne alors ce qui se passe.
Cordialement, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Traitement des questions fermées à choix multiple
Aah... Aah ! Il me manquait la commande "anova(lm(VD~VI1+VI2+VI3))". Les résultats sont désormais les mêmes !
Je crois que mon problème est résolu. Merci beaucoup pour votre aide.
Je reviendrai peut-être bientôt si je ne me sors pas de toutes mes autres interrogations...
Bonne soirée.
Je crois que mon problème est résolu. Merci beaucoup pour votre aide.
Je reviendrai peut-être bientôt si je ne me sors pas de toutes mes autres interrogations...
Bonne soirée.
Cali13- Nombre de messages : 10
Date d'inscription : 03/09/2016
Sujets similaires
» Traitement de données
» Choix d'un test de comparaison multiple
» Aide traitement
» Traitement des non réponses
» Traitement de la variable âge
» Choix d'un test de comparaison multiple
» Aide traitement
» Traitement des non réponses
» Traitement de la variable âge
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum