Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Au secours, j'ai un dilemme
4 participants
Page 1 sur 1
Au secours, j'ai un dilemme
Bonsoir à tous,
En tant qu'ancienne littéraire, j'avoue que je patauge complètement dans la semoule sur les stats.
J'ai un devoir à rendre concernant l'étude d'une BDD d'entreprises.
On me demande de valider l'hypothèse suivante : la taille de l'entreprise (variable numérique) dépend du marché (variable catégorielle à 4 modalités)
J'hésite entre une comparaison de moyennes et une régression linéaire après création de variables muettes pour le marché.
Vous en dites quoi ?
Merci de votre aide,
Virginie
En tant qu'ancienne littéraire, j'avoue que je patauge complètement dans la semoule sur les stats.
J'ai un devoir à rendre concernant l'étude d'une BDD d'entreprises.
On me demande de valider l'hypothèse suivante : la taille de l'entreprise (variable numérique) dépend du marché (variable catégorielle à 4 modalités)
J'hésite entre une comparaison de moyennes et une régression linéaire après création de variables muettes pour le marché.
Vous en dites quoi ?
Merci de votre aide,
Virginie
VirginieIAE- Nombre de messages : 10
Date d'inscription : 13/11/2015
Re: Au secours, j'ai un dilemme
Bonjour.
Pas besoin de statistiques pour répondre à une question aussi évidente !
Je comprends l'idée de comparaison de moyennes, par contre, je ne vois pas comment faire de la régression linéaire avec des modalités, ni ce que tu peux en tirer. peux-tu expliquer ?
Cordialement.
NB : Si tu ne peux pas expliquer clairement, tu n'as plus de dilemme
Pas besoin de statistiques pour répondre à une question aussi évidente !
Je comprends l'idée de comparaison de moyennes, par contre, je ne vois pas comment faire de la régression linéaire avec des modalités, ni ce que tu peux en tirer. peux-tu expliquer ?
Cordialement.
NB : Si tu ne peux pas expliquer clairement, tu n'as plus de dilemme
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Au secours, j'ai un dilemme
Bonjour GG,
Je peux faire une régression linéaire en créant des variable binaires à partir de mes 4 modalités de variable catégorielles.
J'en intègre 3 dans mon modèle de régression et je garde la 4ème en référence.
Du coup, je sais si ma variable dépendante taille dépend de mes 3 variables indépendantes représentant le marché.
Pas clair ?
Je peux faire une régression linéaire en créant des variable binaires à partir de mes 4 modalités de variable catégorielles.
J'en intègre 3 dans mon modèle de régression et je garde la 4ème en référence.
Du coup, je sais si ma variable dépendante taille dépend de mes 3 variables indépendantes représentant le marché.
Pas clair ?
VirginieIAE- Nombre de messages : 10
Date d'inscription : 13/11/2015
Re: Au secours, j'ai un dilemme
Désolé,
mais je ne comprends pas l'intérêt de faire cela. Des modalités transformées en variables donnent des variables totalement dépendantes (quand l'une est à 1 les autres sont à 0). Faire de la régression avec des régresseurs dépendant ....
mais je ne comprends pas l'intérêt de faire cela. Des modalités transformées en variables donnent des variables totalement dépendantes (quand l'une est à 1 les autres sont à 0). Faire de la régression avec des régresseurs dépendant ....
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Au secours, j'ai un dilemme
Si j'ai bien compris, et si la taille de l'entreprise est une variable qui suit une loi normale, il s'agit alors d'une simple analyse de variance (ANOVA) à un facteur.
Il se trouve que faire une ANOVA revient en fait exactement au même que de faire une régression multiple, sur des variables binarisées. Mais ca c'est la "mécanique" qui est "derrière" et qu'il ni besoin de faire soit même, ni même besoin de comprendre.
L'ANOVA dira si la taille de l'entreprise dépend du marché.
HTH, Eric.
Il se trouve que faire une ANOVA revient en fait exactement au même que de faire une régression multiple, sur des variables binarisées. Mais ca c'est la "mécanique" qui est "derrière" et qu'il ni besoin de faire soit même, ni même besoin de comprendre.
L'ANOVA dira si la taille de l'entreprise dépend du marché.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Au secours, j'ai un dilemme
Bonjour,
Non, la variable taille ne suit pas une loi normale et je n'ai pas non plus d'homogénéité des variances. J'ai fait un Kruskal-Wallis du coup.
Voilà ce que ça donne :
Marchés Mediane ? χ² de KW p-value
Local 581
Régional 826 48,643 1,554e-10
National 1514
International 5008
Kuskal-Wallis donne bien une médiane ?
Je n'arrive à passer de la lecture du tableau à la validation de l'hypothèse...
Désolée d'être lourde mais, les stats, c'est vraiment de la découverte pour moi...
Merci de votre aide
Virginie
Non, la variable taille ne suit pas une loi normale et je n'ai pas non plus d'homogénéité des variances. J'ai fait un Kruskal-Wallis du coup.
Voilà ce que ça donne :
Marchés Mediane ? χ² de KW p-value
Local 581
Régional 826 48,643 1,554e-10
National 1514
International 5008
Kuskal-Wallis donne bien une médiane ?
Je n'arrive à passer de la lecture du tableau à la validation de l'hypothèse...
Désolée d'être lourde mais, les stats, c'est vraiment de la découverte pour moi...
Merci de votre aide
Virginie
VirginieIAE- Nombre de messages : 10
Date d'inscription : 13/11/2015
Re: Au secours, j'ai un dilemme
Faire un test de KW est une bonne idée, une parmi d'autres. Je pense que vous avez la réponse à votre question : la taille de l'entreprise dépend bien du marché.
Eric.
Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Au secours, j'ai un dilemme
Merci Eric,
Je peux conclure que la taille dépend du marché à cause des valeurs croissantes des médianes et de la p-value qui indique qu'au moins une médiane est différente d'une autre dans les sous-groupes ?
C'est ça ?
J'avoue que lecture du résultat du test n'est pas très intuitive pour moi.
Merci
Je peux conclure que la taille dépend du marché à cause des valeurs croissantes des médianes et de la p-value qui indique qu'au moins une médiane est différente d'une autre dans les sous-groupes ?
C'est ça ?
J'avoue que lecture du résultat du test n'est pas très intuitive pour moi.
Merci
VirginieIAE- Nombre de messages : 10
Date d'inscription : 13/11/2015
Re: Au secours, j'ai un dilemme
vous pouvez conclure que les valeurs moyennes diffèrent. C'est ce que le test de KW indique. Pas que les moyennes croissent, ce qui est une autre hypothèse. Et oui, la conclusion peut-être faite car la p-value est très faible.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Au secours, j'ai un dilemme
Et du coup, comment faire pour pouvoir le prouver plus précisément ?
VirginieIAE- Nombre de messages : 10
Date d'inscription : 13/11/2015
Re: Au secours, j'ai un dilemme
prouver plus précisément quoi?
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Au secours, j'ai un dilemme
Que la taille dépend du marché
VirginieIAE- Nombre de messages : 10
Date d'inscription : 13/11/2015
Re: Au secours, j'ai un dilemme
En fait j'ai lancé 3 régressions linéaires simples avec mes variables binaires construites à partir des modalités.
En fait, seul le marché national a une influence. Donc j'ai des doutes sur la validité du KW
En fait, seul le marché national a une influence. Donc j'ai des doutes sur la validité du KW
VirginieIAE- Nombre de messages : 10
Date d'inscription : 13/11/2015
Re: Au secours, j'ai un dilemme
Le test de KW vous a déjà prouvé que la taille dépend du marché. Vous avez déjà la réponse à votre question.
Par ailleurs, votre idée de régressions linéaires implique de facto que vous considérez la taille comme une variable gaussien, comme dans une ANOVA (je le répète, un ANOVA n'est rien d'autre qu'une régression). Or vous nous avez dit que ce n'était pas le cas.
Eric.
Par ailleurs, votre idée de régressions linéaires implique de facto que vous considérez la taille comme une variable gaussien, comme dans une ANOVA (je le répète, un ANOVA n'est rien d'autre qu'une régression). Or vous nous avez dit que ce n'était pas le cas.
Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Au secours, j'ai un dilemme
Pour tout un tas de raisons un peu difficiles à expliquer, lorsqu'on a des résultats discordants entre "plusieurs régressions lineaires" et "un test KW", si il y a un truc sur lequel on peut avoir de gros doutes, une grosse méfiance et une confiance ultra limitée, c'est bien le petit tas de régressions linéaires...
Allez, j'explique à peine. Un KW est un test non paramétrique, c'est à dire qu'aucune hypothèse sur la distribution des données ne sous tend son résultat.
Interpréter les résultats d'une régression lineaire suppose que ses données respectent une certaine structure, et qu'il faut vérifier quelques petites choses avant. Normalité des résidus, répartition homogène de la variance... etc... ca te cause ? Tu as vérifié ?
De plus, il faut être assez méfiant sur la significativité associée aux reg. lin. (hypothèse nulle = r different de zéro, donc pour tout echantillon suffisamment grand, on a un p significatif même avec un r ridiculement bas)
Enfin, comparer "plusieurs régressions lineaires" entre elles n'est pas si simple. En particulier, elle n'est pas directe : la valeur pente dépend de l'unité dans laquelle les mesures on été effectuées. Pour comparer plusieurs pentes entre elles, il faut étudier leur interaction.
C'est là que ca va devenir drôle : une façon relativement simple d'étudier les interactions passe par de l'analyse de variance. Autrement appelée ANOVA... ca te rappelle rien ? ..... L'équivalent non paramétrique de l'ANOVA qui t'intéresse s'appelle un test de...
de.....
de.....
DE KRUSKALL WALLIS !
Pardon pour le ton humoristique, c'est pas méchant et j'espère que cette petite explication pourra servir à d'autres gens pas très à l'aise
Allez, j'explique à peine. Un KW est un test non paramétrique, c'est à dire qu'aucune hypothèse sur la distribution des données ne sous tend son résultat.
Interpréter les résultats d'une régression lineaire suppose que ses données respectent une certaine structure, et qu'il faut vérifier quelques petites choses avant. Normalité des résidus, répartition homogène de la variance... etc... ca te cause ? Tu as vérifié ?
De plus, il faut être assez méfiant sur la significativité associée aux reg. lin. (hypothèse nulle = r different de zéro, donc pour tout echantillon suffisamment grand, on a un p significatif même avec un r ridiculement bas)
Enfin, comparer "plusieurs régressions lineaires" entre elles n'est pas si simple. En particulier, elle n'est pas directe : la valeur pente dépend de l'unité dans laquelle les mesures on été effectuées. Pour comparer plusieurs pentes entre elles, il faut étudier leur interaction.
C'est là que ca va devenir drôle : une façon relativement simple d'étudier les interactions passe par de l'analyse de variance. Autrement appelée ANOVA... ca te rappelle rien ? ..... L'équivalent non paramétrique de l'ANOVA qui t'intéresse s'appelle un test de...
de.....
de.....
DE KRUSKALL WALLIS !
Pardon pour le ton humoristique, c'est pas méchant et j'espère que cette petite explication pourra servir à d'autres gens pas très à l'aise
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Re: Au secours, j'ai un dilemme
c@ssoulet a écrit:
C'est là que ca va devenir drôle : une façon relativement simple d'étudier les interactions passe par de l'analyse de variance. Autrement appelée ANOVA... ca te rappelle rien ? ..... L'équivalent non paramétrique de l'ANOVA qui t'intéresse s'appelle un test de...
de.....
de.....
DE KRUSKALL WALLIS !
"Kurskal" ne s'écrit qu'avec un seul "l".
Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Au secours, j'ai un dilemme
Super !!
Merci à tous de votre aide et de votre patience !!!
Je pense que j'ai compris.
Virginie
Merci à tous de votre aide et de votre patience !!!
Je pense que j'ai compris.
Virginie
VirginieIAE- Nombre de messages : 10
Date d'inscription : 13/11/2015
Sujets similaires
» anova kruska wallis test, multifactoriel ou unifactoriel?
» au secours !
» Aux secours les stat!
» AU secours STAt ...
» Au secours ! Quel test choisir ?
» au secours !
» Aux secours les stat!
» AU secours STAt ...
» Au secours ! Quel test choisir ?
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum