Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

Le deal à ne pas rater :
Bon plan achat en duo : 2ème robot cuiseur Moulinex Companion ...
600 €
Voir le deal

Au secours, j'ai un dilemme

4 participants

Aller en bas

Au secours, j'ai un dilemme Empty Au secours, j'ai un dilemme

Message par VirginieIAE Ven 13 Nov 2015 - 22:05

Bonsoir à tous,

En tant qu'ancienne littéraire, j'avoue que je patauge complètement dans la semoule sur les stats. pale

J'ai un devoir à rendre concernant l'étude d'une BDD d'entreprises.

On me demande de valider l'hypothèse suivante : la taille de l'entreprise (variable numérique) dépend du marché (variable catégorielle à 4 modalités)

J'hésite entre une comparaison de moyennes et une régression linéaire après création de variables muettes pour le marché.

Vous en dites quoi ?

Merci de votre aide,


Virginie

VirginieIAE

Nombre de messages : 10
Date d'inscription : 13/11/2015

Revenir en haut Aller en bas

Au secours, j'ai un dilemme Empty Re: Au secours, j'ai un dilemme

Message par gg Sam 14 Nov 2015 - 17:40

Bonjour.

Pas besoin de statistiques pour répondre à une question aussi évidente !

Je comprends l'idée de comparaison de moyennes, par contre, je ne vois pas comment faire de la régression linéaire avec des modalités, ni ce que tu peux en tirer. peux-tu expliquer ?

Cordialement.

NB : Si tu ne peux pas expliquer clairement, tu n'as plus de dilemme Smile

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Au secours, j'ai un dilemme Empty Re: Au secours, j'ai un dilemme

Message par VirginieIAE Sam 14 Nov 2015 - 18:38

Bonjour GG,

Je peux faire une régression linéaire en créant des variable binaires à partir de mes 4 modalités de variable catégorielles.
J'en intègre 3 dans mon modèle de régression et je garde la 4ème en référence.
Du coup, je sais si ma variable dépendante taille dépend de mes 3 variables indépendantes représentant le marché.
Pas clair ?

VirginieIAE

Nombre de messages : 10
Date d'inscription : 13/11/2015

Revenir en haut Aller en bas

Au secours, j'ai un dilemme Empty Re: Au secours, j'ai un dilemme

Message par gg Sam 14 Nov 2015 - 21:40

Désolé,

mais je ne comprends pas l'intérêt de faire cela. Des modalités transformées en variables donnent des variables totalement dépendantes (quand l'une est à 1 les autres sont à 0). Faire de la régression avec des régresseurs dépendant ....

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Au secours, j'ai un dilemme Empty Re: Au secours, j'ai un dilemme

Message par Eric Wajnberg Dim 15 Nov 2015 - 7:23

Si j'ai bien compris, et si la taille de l'entreprise est une variable qui suit une loi normale, il s'agit alors d'une simple analyse de variance (ANOVA) à un facteur.

Il se trouve que faire une ANOVA revient en fait exactement au même que de faire une régression multiple, sur des variables binarisées. Mais ca c'est la "mécanique" qui est "derrière" et qu'il ni besoin de faire soit même, ni même besoin de comprendre.

L'ANOVA dira si la taille de l'entreprise dépend du marché.

HTH, Eric.
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1238
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

Au secours, j'ai un dilemme Empty Re: Au secours, j'ai un dilemme

Message par VirginieIAE Dim 15 Nov 2015 - 15:49

Bonjour,

Non, la variable taille ne suit pas une loi normale et je n'ai pas non plus d'homogénéité des variances. J'ai fait un Kruskal-Wallis du coup.

Voilà ce que ça donne :
Marchés Mediane ? χ² de KW p-value
Local 581
Régional 826 48,643 1,554e-10
National 1514
International 5008

Kuskal-Wallis donne bien une médiane ?

Je n'arrive à passer de la lecture du tableau à la validation de l'hypothèse...

Désolée d'être lourde mais, les stats, c'est vraiment de la découverte pour moi...

Merci de votre aide


Virginie

VirginieIAE

Nombre de messages : 10
Date d'inscription : 13/11/2015

Revenir en haut Aller en bas

Au secours, j'ai un dilemme Empty Re: Au secours, j'ai un dilemme

Message par Eric Wajnberg Dim 15 Nov 2015 - 17:24

Faire un test de KW est une bonne idée, une parmi d'autres. Je pense que vous avez la réponse à votre question : la taille de l'entreprise dépend bien du marché.

Eric.
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1238
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

Au secours, j'ai un dilemme Empty Re: Au secours, j'ai un dilemme

Message par VirginieIAE Dim 15 Nov 2015 - 17:38

Merci Eric,

Je peux conclure que la taille dépend du marché à cause des valeurs croissantes des médianes et de la p-value qui indique qu'au moins une médiane est différente d'une autre dans les sous-groupes ?
C'est ça ?

J'avoue que lecture du résultat du test n'est pas très intuitive pour moi.

Merci

VirginieIAE

Nombre de messages : 10
Date d'inscription : 13/11/2015

Revenir en haut Aller en bas

Au secours, j'ai un dilemme Empty Re: Au secours, j'ai un dilemme

Message par Eric Wajnberg Dim 15 Nov 2015 - 17:56

vous pouvez conclure que les valeurs moyennes diffèrent. C'est ce que le test de KW indique. Pas que les moyennes croissent, ce qui est une autre hypothèse. Et oui, la conclusion peut-être faite car la p-value est très faible.
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1238
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

Au secours, j'ai un dilemme Empty Re: Au secours, j'ai un dilemme

Message par VirginieIAE Dim 15 Nov 2015 - 18:00

Et du coup, comment faire pour pouvoir le prouver plus précisément ?

VirginieIAE

Nombre de messages : 10
Date d'inscription : 13/11/2015

Revenir en haut Aller en bas

Au secours, j'ai un dilemme Empty Re: Au secours, j'ai un dilemme

Message par Eric Wajnberg Dim 15 Nov 2015 - 18:09

prouver plus précisément quoi?
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1238
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

Au secours, j'ai un dilemme Empty Re: Au secours, j'ai un dilemme

Message par VirginieIAE Dim 15 Nov 2015 - 19:16

Que la taille dépend du marché

VirginieIAE

Nombre de messages : 10
Date d'inscription : 13/11/2015

Revenir en haut Aller en bas

Au secours, j'ai un dilemme Empty Re: Au secours, j'ai un dilemme

Message par VirginieIAE Dim 15 Nov 2015 - 19:19

En fait j'ai lancé 3 régressions linéaires simples avec mes variables binaires construites à partir des modalités.

En fait, seul le marché national a une influence. Donc j'ai des doutes sur la validité du KW

VirginieIAE

Nombre de messages : 10
Date d'inscription : 13/11/2015

Revenir en haut Aller en bas

Au secours, j'ai un dilemme Empty Re: Au secours, j'ai un dilemme

Message par Eric Wajnberg Dim 15 Nov 2015 - 20:40

Le test de KW vous a déjà prouvé que la taille dépend du marché. Vous avez déjà la réponse à votre question.

Par ailleurs, votre idée de régressions linéaires implique de facto que vous considérez la taille comme une variable gaussien, comme dans une ANOVA (je le répète, un ANOVA n'est rien d'autre qu'une régression). Or vous nous avez dit que ce n'était pas le cas.

Eric.
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1238
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

Au secours, j'ai un dilemme Empty Re: Au secours, j'ai un dilemme

Message par c@ssoulet Lun 16 Nov 2015 - 9:14

Pour tout un tas de raisons un peu difficiles à expliquer, lorsqu'on a des résultats discordants entre "plusieurs régressions lineaires" et "un test KW", si il y a un truc sur lequel on peut avoir de gros doutes, une grosse méfiance et une confiance ultra limitée, c'est bien le petit tas de régressions linéaires... Rolling Eyes

Allez, j'explique à peine. Un KW est un test non paramétrique, c'est à dire qu'aucune hypothèse sur la distribution des données ne sous tend son résultat.

Interpréter les résultats d'une régression lineaire suppose que ses données respectent une certaine structure, et qu'il faut vérifier quelques petites choses avant. Normalité des résidus, répartition homogène de la variance... etc... ca te cause ? Tu as vérifié ?

De plus, il faut être assez méfiant sur la significativité associée aux reg. lin. (hypothèse nulle = r different de zéro, donc pour tout echantillon suffisamment grand, on a un p significatif même avec un r ridiculement bas)

Enfin, comparer "plusieurs régressions lineaires" entre elles n'est pas si simple. En particulier, elle n'est pas directe : la valeur pente dépend de l'unité dans laquelle les mesures on été effectuées. Pour comparer plusieurs pentes entre elles, il faut étudier leur interaction.

C'est là que ca va devenir drôle : une façon relativement simple d'étudier les interactions passe par de l'analyse de variance. Autrement appelée ANOVA... ca te rappelle rien ? ..... L'équivalent non paramétrique de l'ANOVA qui t'intéresse s'appelle un test de...
de.....
de.....
DE KRUSKALL WALLIS !  lol!

Pardon pour le ton humoristique, c'est pas méchant et j'espère que cette petite explication pourra servir à d'autres gens pas très à l'aise

c@ssoulet

Nombre de messages : 925
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

Au secours, j'ai un dilemme Empty Re: Au secours, j'ai un dilemme

Message par Eric Wajnberg Lun 16 Nov 2015 - 17:13

c@ssoulet a écrit:
C'est là que ca va devenir drôle : une façon relativement simple d'étudier les interactions passe par de l'analyse de variance. Autrement appelée ANOVA... ca te rappelle rien ? ..... L'équivalent non paramétrique de l'ANOVA qui t'intéresse s'appelle un test de...
de.....
de.....
DE KRUSKALL WALLIS !  lol!


"Kurskal" ne s'écrit qu'avec un seul "l".

Eric.
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1238
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

Au secours, j'ai un dilemme Empty Re: Au secours, j'ai un dilemme

Message par VirginieIAE Mar 17 Nov 2015 - 7:47

Super !!
Merci à tous de votre aide et de votre patience !!!

Je pense que j'ai compris.

Very Happy

Virginie

VirginieIAE

Nombre de messages : 10
Date d'inscription : 13/11/2015

Revenir en haut Aller en bas

Au secours, j'ai un dilemme Empty Re: Au secours, j'ai un dilemme

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum