Les posteurs les plus actifs de la semaine
Kaidozaki
 


Regression logistique multinomiale

Voir le sujet précédent Voir le sujet suivant Aller en bas

Regression logistique multinomiale

Message par wampus le Mar 10 Mar 2015 - 2:10

Bonjour,

J’ai récemment reçu les résultats d’un sondage dont on m’a demandé d’analyser les résultats. Il s’agit d’un sondage portant sur les attributs d’une marque.

Voici les trois informations relevées:
  • La perception de la marque (1 question à choix multiple avec 13 modalités)
    Ex : Réputée, Innovante, Unique, etc.
  • L’impact de la marque (6 questions avec échelle de Likert à 5 modalités)
    Ex : Cette marque rend ma vie plus facile, Sans cette marque ma vie serait négativement impactée, etc.
  • Une variable "recommander" (1 question avec échelle de Likert à 5 modalités)
    Ex : Recommanderiez-vous cette marque à un ami ?

Pour analyser ces données, j’ai donc:
  • 13 variables dichotomiques/binaires, qui mesurent la perception du client vis-à-vis de la marque (Unique, Innovante, Réputée, etc.)
  • 6 variables ordinales, qui mesurent l’accord ou non d’un client vis-à-vis de de l’impact de la marque
  • 1 variable ordinale, qui mesure l’accord ou non d’un client à recommander la marque.

Mon problème est le suivant, j’aimerai mesurer l’impact des variables dichotomiques (perception de la marque) et des variables ordinales (impact de la marque) sur la variable ordinale (recommandation de la marque).
Je pense que je devrais utiliser une régression logistique multinomiale, cependant, j’ai vu que certaines analyses dont la variable dépendante était une échelle de Likert avait été interprété comme étant numérique. Dans ce cas, une régression linéaire avec comme variable numérique dépendante « recommandation » serait-elle suffisante ?

Qu’en pensez-vous ?

Merci pour votre aide.


Dernière édition par wampus le Mar 10 Mar 2015 - 20:02, édité 1 fois

wampus

Nombre de messages : 3
Date d'inscription : 09/03/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Regression logistique multinomiale

Message par niaboc le Mar 10 Mar 2015 - 15:20

Bonjour,

A la limite, pour une régression linéaire, on pourrait utiliser les échelles de Likert dans les variables explicatives, mais là c'est également la variable à expliquer : et il y aurait des résultats étranges (inférieur ) 0 etc.

Donc je pense que la régression logistique multinomiale reste la meilleure solution (à odd-ratios proportionnels).

Niaboc

niaboc

Nombre de messages : 865
Age : 29
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Regression logistique multinomiale

Message par wampus le Mar 10 Mar 2015 - 18:54

Bonjour niaboc,

merci pour votre réponse. Pouvez-vous m’expliquer ce que veut dire : « à odd-ratios proportionnels » ?

J’ai finalement utilisé SPSS pour cette regression et je suis surpris du résultat. Pour identifier la variable qui a le plus d’impact dans ce modèle, j’ai analysé le tableau des « Tests des ratios de vraisemblance ». Toutes les variables ont un Khi-deux compris entre 1 et 110 sauf une variable qui a un Khi-deux de plus de 30 000 (p-value de 0) ! J’ai plusieurs warning en début d’analyse et je pense que ça pourrait expliquer ce résultat mais je ne suis pas certain :
  • Le premier indique : There are 5054 (83.0%) cells (i.e., dependent variable levels by subpopulations) with zero frequencies.
  • Le deuxième indique : Unexpected singularities in the Hessian matrix are encountered. This indicates that either some predictor variables should be excluded or some categories should be merged.
Devrais-je appliquer une analyse factorielle afin de réduire le nombre de variable à l’étude et supprimer du modèle les variables qui ne sont pas relevantes  ? Qu'en pensez-vous ?

Note: La taille de l'échantillon est 1126.

wampus

Nombre de messages : 3
Date d'inscription : 09/03/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Regression logistique multinomiale

Message par niaboc le Mar 10 Mar 2015 - 20:02

Je ne sais pas trop ce que veut dire cet erreur mais tu as peut-être :

- Tu as peut-être une quasi-séparation des données
- Tu as peut-être des variables explicatives beaucoup trop corrélées (multicolinéarité) => Tu peux essayer une analyse factorielle et voir ce que ça donne

Niaboc

niaboc

Nombre de messages : 865
Age : 29
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Regression logistique multinomiale

Message par wampus le Mar 10 Mar 2015 - 20:14

Merci Niaboc,

je vais faire une analyse factorielle.

Les questions relatives à l'impact de la marque ont une échelle de Likert à 5 modalités. Cependant, une sixième modalités est présente: "Ne sait pas".

Jusqu'à maintenant j'ai tout simplement ignoré ces réponses mais je ne suis pas certain que ce soit la meilleure méthode. Mais si je tiens compte de ces réponses, il ne s'agit plus d'une variable ordinale mais d'une variable nominale.

Quelle est la meilleur méthodologie à appliquer dans ces conditions ?



wampus

Nombre de messages : 3
Date d'inscription : 09/03/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Regression logistique multinomiale

Message par niaboc le Mer 11 Mar 2015 - 9:25

Bonjour,

une régression logistique à à odd-ratios proportionnels permet de faciliter grandement l'interprétation. Pour une variable explicative donnée, tu n'as plus un coefficient par modalité de variable explicative Y, mais un seul coefficient. L'interprétation des odd-ratios ne dépend donc plus des niveaux de Y mais plutôt comme : X fois plus de chance d'améliorer Y, quelque soit son niveau.

Si tu as une modalité "ne sait pas" tu n'as effectivement plus une variable ordinale... tu peux rester sur une régression logistique multinomiale ou sinon tu peux tenter, via une méthode d'imputation, de redonner une valeur sur l'échelle de Likert à toutes les valeurs "ne sait pas".

Sinon, si les individus qui répondent "ne sait pas" ne sont pas nombreux, ça peut être envisageable de supprimer ces individus de l'analyse.


Niaboc

niaboc

Nombre de messages : 865
Age : 29
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Regression logistique multinomiale

Message par c@ssoulet le Mer 11 Mar 2015 - 11:52

Attention, lorsqu'on utilise un modèle à risques proportionnels il faut etre particulièrement attentif à la vérification des conditions d'application. Et apparemment, tu ne les a pas vérifiées du tout.

Le risque de conclure n'importe quoi est assez important. Tu as un exemple ci-dessous, dans lequel l'auteur utilise volontairement le modèle de cox sans passer par les étapes de vérification, obtient des résultats apparemment justes mais contraires aux données publiées, et en explique les raisons.

http://www.em-consulte.com/rmr/article/157267

La conclusion de toutes les formations sur ces modèles, c'est vérification des conditions d'application : ATTENTION +++


c@ssoulet

Nombre de messages : 646
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Regression logistique multinomiale

Message par niaboc le Mer 11 Mar 2015 - 12:07

Comme de bien entendu, Cassoulet a raison.

Avec SAS par exemple, tu as, dans le cas de la régression logistique multinomiale, le "Score Test for the Proportional Odds Assumption".

Niaboc

niaboc

Nombre de messages : 865
Age : 29
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Regression logistique multinomiale

Message par Contenu sponsorisé Aujourd'hui à 12:31


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum