Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Regression logistique multinomiale
3 participants
Page 1 sur 1
Regression logistique multinomiale
Bonjour,
J’ai récemment reçu les résultats d’un sondage dont on m’a demandé d’analyser les résultats. Il s’agit d’un sondage portant sur les attributs d’une marque.
Voici les trois informations relevées:
Pour analyser ces données, j’ai donc:
Mon problème est le suivant, j’aimerai mesurer l’impact des variables dichotomiques (perception de la marque) et des variables ordinales (impact de la marque) sur la variable ordinale (recommandation de la marque).
Je pense que je devrais utiliser une régression logistique multinomiale, cependant, j’ai vu que certaines analyses dont la variable dépendante était une échelle de Likert avait été interprété comme étant numérique. Dans ce cas, une régression linéaire avec comme variable numérique dépendante « recommandation » serait-elle suffisante ?
Qu’en pensez-vous ?
Merci pour votre aide.
J’ai récemment reçu les résultats d’un sondage dont on m’a demandé d’analyser les résultats. Il s’agit d’un sondage portant sur les attributs d’une marque.
Voici les trois informations relevées:
- La perception de la marque (1 question à choix multiple avec 13 modalités)
Ex : Réputée, Innovante, Unique, etc. - L’impact de la marque (6 questions avec échelle de Likert à 5 modalités)
Ex : Cette marque rend ma vie plus facile, Sans cette marque ma vie serait négativement impactée, etc. - Une variable "recommander" (1 question avec échelle de Likert à 5 modalités)
Ex : Recommanderiez-vous cette marque à un ami ?
Pour analyser ces données, j’ai donc:
- 13 variables dichotomiques/binaires, qui mesurent la perception du client vis-à-vis de la marque (Unique, Innovante, Réputée, etc.)
- 6 variables ordinales, qui mesurent l’accord ou non d’un client vis-à-vis de de l’impact de la marque
- 1 variable ordinale, qui mesure l’accord ou non d’un client à recommander la marque.
Mon problème est le suivant, j’aimerai mesurer l’impact des variables dichotomiques (perception de la marque) et des variables ordinales (impact de la marque) sur la variable ordinale (recommandation de la marque).
Je pense que je devrais utiliser une régression logistique multinomiale, cependant, j’ai vu que certaines analyses dont la variable dépendante était une échelle de Likert avait été interprété comme étant numérique. Dans ce cas, une régression linéaire avec comme variable numérique dépendante « recommandation » serait-elle suffisante ?
Qu’en pensez-vous ?
Merci pour votre aide.
Dernière édition par wampus le Mar 10 Mar 2015 - 20:02, édité 1 fois
wampus- Nombre de messages : 3
Date d'inscription : 09/03/2015
Re: Regression logistique multinomiale
Bonjour,
A la limite, pour une régression linéaire, on pourrait utiliser les échelles de Likert dans les variables explicatives, mais là c'est également la variable à expliquer : et il y aurait des résultats étranges (inférieur ) 0 etc.
Donc je pense que la régression logistique multinomiale reste la meilleure solution (à odd-ratios proportionnels).
Niaboc
A la limite, pour une régression linéaire, on pourrait utiliser les échelles de Likert dans les variables explicatives, mais là c'est également la variable à expliquer : et il y aurait des résultats étranges (inférieur ) 0 etc.
Donc je pense que la régression logistique multinomiale reste la meilleure solution (à odd-ratios proportionnels).
Niaboc
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: Regression logistique multinomiale
Bonjour niaboc,
merci pour votre réponse. Pouvez-vous m’expliquer ce que veut dire : « à odd-ratios proportionnels » ?
J’ai finalement utilisé SPSS pour cette regression et je suis surpris du résultat. Pour identifier la variable qui a le plus d’impact dans ce modèle, j’ai analysé le tableau des « Tests des ratios de vraisemblance ». Toutes les variables ont un Khi-deux compris entre 1 et 110 sauf une variable qui a un Khi-deux de plus de 30 000 (p-value de 0) ! J’ai plusieurs warning en début d’analyse et je pense que ça pourrait expliquer ce résultat mais je ne suis pas certain :
Note: La taille de l'échantillon est 1126.
merci pour votre réponse. Pouvez-vous m’expliquer ce que veut dire : « à odd-ratios proportionnels » ?
J’ai finalement utilisé SPSS pour cette regression et je suis surpris du résultat. Pour identifier la variable qui a le plus d’impact dans ce modèle, j’ai analysé le tableau des « Tests des ratios de vraisemblance ». Toutes les variables ont un Khi-deux compris entre 1 et 110 sauf une variable qui a un Khi-deux de plus de 30 000 (p-value de 0) ! J’ai plusieurs warning en début d’analyse et je pense que ça pourrait expliquer ce résultat mais je ne suis pas certain :
- Le premier indique : There are 5054 (83.0%) cells (i.e., dependent variable levels by subpopulations) with zero frequencies.
- Le deuxième indique : Unexpected singularities in the Hessian matrix are encountered. This indicates that either some predictor variables should be excluded or some categories should be merged.
Note: La taille de l'échantillon est 1126.
wampus- Nombre de messages : 3
Date d'inscription : 09/03/2015
Re: Regression logistique multinomiale
Je ne sais pas trop ce que veut dire cet erreur mais tu as peut-être :
- Tu as peut-être une quasi-séparation des données
- Tu as peut-être des variables explicatives beaucoup trop corrélées (multicolinéarité) => Tu peux essayer une analyse factorielle et voir ce que ça donne
Niaboc
- Tu as peut-être une quasi-séparation des données
- Tu as peut-être des variables explicatives beaucoup trop corrélées (multicolinéarité) => Tu peux essayer une analyse factorielle et voir ce que ça donne
Niaboc
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: Regression logistique multinomiale
Merci Niaboc,
je vais faire une analyse factorielle.
Les questions relatives à l'impact de la marque ont une échelle de Likert à 5 modalités. Cependant, une sixième modalités est présente: "Ne sait pas".
Jusqu'à maintenant j'ai tout simplement ignoré ces réponses mais je ne suis pas certain que ce soit la meilleure méthode. Mais si je tiens compte de ces réponses, il ne s'agit plus d'une variable ordinale mais d'une variable nominale.
Quelle est la meilleur méthodologie à appliquer dans ces conditions ?
je vais faire une analyse factorielle.
Les questions relatives à l'impact de la marque ont une échelle de Likert à 5 modalités. Cependant, une sixième modalités est présente: "Ne sait pas".
Jusqu'à maintenant j'ai tout simplement ignoré ces réponses mais je ne suis pas certain que ce soit la meilleure méthode. Mais si je tiens compte de ces réponses, il ne s'agit plus d'une variable ordinale mais d'une variable nominale.
Quelle est la meilleur méthodologie à appliquer dans ces conditions ?
wampus- Nombre de messages : 3
Date d'inscription : 09/03/2015
Re: Regression logistique multinomiale
Bonjour,
une régression logistique à à odd-ratios proportionnels permet de faciliter grandement l'interprétation. Pour une variable explicative donnée, tu n'as plus un coefficient par modalité de variable explicative Y, mais un seul coefficient. L'interprétation des odd-ratios ne dépend donc plus des niveaux de Y mais plutôt comme : X fois plus de chance d'améliorer Y, quelque soit son niveau.
Si tu as une modalité "ne sait pas" tu n'as effectivement plus une variable ordinale... tu peux rester sur une régression logistique multinomiale ou sinon tu peux tenter, via une méthode d'imputation, de redonner une valeur sur l'échelle de Likert à toutes les valeurs "ne sait pas".
Sinon, si les individus qui répondent "ne sait pas" ne sont pas nombreux, ça peut être envisageable de supprimer ces individus de l'analyse.
Niaboc
une régression logistique à à odd-ratios proportionnels permet de faciliter grandement l'interprétation. Pour une variable explicative donnée, tu n'as plus un coefficient par modalité de variable explicative Y, mais un seul coefficient. L'interprétation des odd-ratios ne dépend donc plus des niveaux de Y mais plutôt comme : X fois plus de chance d'améliorer Y, quelque soit son niveau.
Si tu as une modalité "ne sait pas" tu n'as effectivement plus une variable ordinale... tu peux rester sur une régression logistique multinomiale ou sinon tu peux tenter, via une méthode d'imputation, de redonner une valeur sur l'échelle de Likert à toutes les valeurs "ne sait pas".
Sinon, si les individus qui répondent "ne sait pas" ne sont pas nombreux, ça peut être envisageable de supprimer ces individus de l'analyse.
Niaboc
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: Regression logistique multinomiale
Attention, lorsqu'on utilise un modèle à risques proportionnels il faut etre particulièrement attentif à la vérification des conditions d'application. Et apparemment, tu ne les a pas vérifiées du tout.
Le risque de conclure n'importe quoi est assez important. Tu as un exemple ci-dessous, dans lequel l'auteur utilise volontairement le modèle de cox sans passer par les étapes de vérification, obtient des résultats apparemment justes mais contraires aux données publiées, et en explique les raisons.
http://www.em-consulte.com/rmr/article/157267
La conclusion de toutes les formations sur ces modèles, c'est vérification des conditions d'application : ATTENTION +++
Le risque de conclure n'importe quoi est assez important. Tu as un exemple ci-dessous, dans lequel l'auteur utilise volontairement le modèle de cox sans passer par les étapes de vérification, obtient des résultats apparemment justes mais contraires aux données publiées, et en explique les raisons.
http://www.em-consulte.com/rmr/article/157267
La conclusion de toutes les formations sur ces modèles, c'est vérification des conditions d'application : ATTENTION +++
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Re: Regression logistique multinomiale
Comme de bien entendu, Cassoulet a raison.
Avec SAS par exemple, tu as, dans le cas de la régression logistique multinomiale, le "Score Test for the Proportional Odds Assumption".
Niaboc
Avec SAS par exemple, tu as, dans le cas de la régression logistique multinomiale, le "Score Test for the Proportional Odds Assumption".
Niaboc
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Sujets similaires
» régression logistique multinomiale
» régression logistique multinomiale
» regression logistique multinomiale.. help!
» Regression logistique multinomiale
» régression logistique multinomiale
» régression logistique multinomiale
» regression logistique multinomiale.. help!
» Regression logistique multinomiale
» régression logistique multinomiale
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum