Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
anova VS régression avec variables dichotomiques
2 participants
Page 1 sur 1
anova VS régression avec variables dichotomiques
Bonjour tout le monde;
Je dois réaliser une modélisation d'une variables quantitative grâce à des variables quali et quanti.
Pour l'instant j'ai choisi de le faire avec une méthode ANOVA, j'ai donc découpé toutes mes variables quanti en classes pour n'obtenir que des variables quali.
Cependant maintenant je me demande s'il n'aurait pas mieux fallu, au contraire, garder mes variables quanti telles qu'elles, et dichotomiser mes variables quali pour n'obtenir que des variables quanti et donc faire une régression au final. (sachant que le fait de garder mes variables quanti telles qu'elles m'expose au fait de n'avoir que des effets linéaires, mais ce n'est pas un pb ici).
qu'en pensez vous?
Je dois réaliser une modélisation d'une variables quantitative grâce à des variables quali et quanti.
Pour l'instant j'ai choisi de le faire avec une méthode ANOVA, j'ai donc découpé toutes mes variables quanti en classes pour n'obtenir que des variables quali.
Cependant maintenant je me demande s'il n'aurait pas mieux fallu, au contraire, garder mes variables quanti telles qu'elles, et dichotomiser mes variables quali pour n'obtenir que des variables quanti et donc faire une régression au final. (sachant que le fait de garder mes variables quanti telles qu'elles m'expose au fait de n'avoir que des effets linéaires, mais ce n'est pas un pb ici).
qu'en pensez vous?
flipo- Nombre de messages : 36
Date d'inscription : 13/06/2008
Re: anova VS régression avec variables dichotomiques
Pour ma part je pense que tout dépend de ton objectif.
Est-ce que comparer des moyennes te suffit pour ton étude ?
Tu veux aller plus loin, par exemple faire un modèle prédictif, vérifier si tes variables quanti ont une relation plutôt linéaire ou exponentielle -> régression
Est-ce que comparer des moyennes te suffit pour ton étude ?
Tu veux aller plus loin, par exemple faire un modèle prédictif, vérifier si tes variables quanti ont une relation plutôt linéaire ou exponentielle -> régression
FS- Nombre de messages : 163
Date d'inscription : 25/04/2008
Re: anova VS régression avec variables dichotomiques
mon étude est dans une optique 100% prédictive...en quoi cela pose problème pour l'anova?
flipo- Nombre de messages : 36
Date d'inscription : 13/06/2008
Re: anova VS régression avec variables dichotomiques
l'anova est très bien pour comparer des moyennes et chercher des interactions.
Mais pour faire de la prédiction tu sera limité, car l'anova ne prend pas en compte la valeur de tes groupes.
A moins de découper tes variables quanti en un max de groupe, ce qui à mon avis est ingérable.
La régression est bien plus adapté pour faire de la prédiction, ce sera bien plus précis et plus pratique pour étudier la forme de la relation.
combien tu as de var quanti/quali ?
Mais pour faire de la prédiction tu sera limité, car l'anova ne prend pas en compte la valeur de tes groupes.
A moins de découper tes variables quanti en un max de groupe, ce qui à mon avis est ingérable.
La régression est bien plus adapté pour faire de la prédiction, ce sera bien plus précis et plus pratique pour étudier la forme de la relation.
combien tu as de var quanti/quali ?
FS- Nombre de messages : 163
Date d'inscription : 25/04/2008
Re: anova VS régression avec variables dichotomiques
quand tu dis "l'anova ne prend pas en compte la valeur de tes groupes", tu veux dire que ça ne peut pas me permettre de prévoir les valeurs ensuite?
quand j'obtiens la valeur de mes "régresseurs" sur sas, il me met un message:
Terms are not uniquely estimable.
le pb vient de ce dont tu parles?
à priori j'ai une douzaine de variables quanti et quelques pauvres quali...sachant que les quanti ont plus d'impact à priori...
quand j'obtiens la valeur de mes "régresseurs" sur sas, il me met un message:
Terms are not uniquely estimable.
le pb vient de ce dont tu parles?
à priori j'ai une douzaine de variables quanti et quelques pauvres quali...sachant que les quanti ont plus d'impact à priori...
flipo- Nombre de messages : 36
Date d'inscription : 13/06/2008
Re: anova VS régression avec variables dichotomiques
Quand tu découpes une variable qualitative en une variable quantitatuve tu perd de l'information. Dans un but prédictif il est a mon avis beaucoup plus intéressant de garder tes variables qualitatives telles quelles.
Un exemple tu cherches a prédire Y par X. Si tu découpes X en 4 classes les prédictions que tu obtiendras seront les moyennes par classes. A un individu de la première classe tu prédiras la moyenne de la première classe. Alors que si ta relation est linéaire, ta prédiction sera bien meilleur car pour chaque individu tu vas calculé une valeur qui dépend de son X.
Après je ne vois pas ce qui te gène à mélanger les deux types de variables ? Si tu as des quanti et des quali pour expliquer ta variable Y et bah gardes les tel quelles !!!! C'est encore la meilleur chose à faire.
micros.
Un exemple tu cherches a prédire Y par X. Si tu découpes X en 4 classes les prédictions que tu obtiendras seront les moyennes par classes. A un individu de la première classe tu prédiras la moyenne de la première classe. Alors que si ta relation est linéaire, ta prédiction sera bien meilleur car pour chaque individu tu vas calculé une valeur qui dépend de son X.
Après je ne vois pas ce qui te gène à mélanger les deux types de variables ? Si tu as des quanti et des quali pour expliquer ta variable Y et bah gardes les tel quelles !!!! C'est encore la meilleur chose à faire.
micros.
Invité- Invité
Re: anova VS régression avec variables dichotomiques
euh ya eut un petit cafouillage quali/quanti au début de ta réponse non...?
sinon garder mes variables telles qu'ellles, qu'elles soient quali ou quanti c'est ce que je comptais faire initiallement mais il faut (d'apres ce que j'ai compris) faire appel à la méthode ANCOVA que je ne maitrise pas du tout.
sinon garder mes variables telles qu'ellles, qu'elles soient quali ou quanti c'est ce que je comptais faire initiallement mais il faut (d'apres ce que j'ai compris) faire appel à la méthode ANCOVA que je ne maitrise pas du tout.
flipo- Nombre de messages : 36
Date d'inscription : 13/06/2008
Re: anova VS régression avec variables dichotomiques
Effectivement excuse pour la confusion.
Quand tu pratiques une ANCOVA tu es dans de l'inférentiel. Vu que ta démarche est prédictive tu te fous de ce genre de trucs. Ce que tu vas chercher à avoir c'est un modèle qui prédise le mieux tes données et non pas savoir qui de la variable quanti ou quali explique le plus de variabilité, est-ce que les pentes sont égales ? est-ce que les ordonnées à l'origine sont égales ?, etc. Tu n'es plus dans la même démarche. Ce que tu cherches à faire est une régression linéaire multiple qui prédise le mieux tes données. Il y a aussi une chose à laquelle tu dois faire attention quand tu as un modèle qui collent très bien à tes données, il se peut qu'il ne soit pas très bon pour prédire des données indépendantes. Tout le truc est de trouver un modèle qui prédise pas trop mal tes données mais qui soit aussi capable de prédire correctement des données indépendantes. A vouloir trop diminuer l'erreur qu'on fait sur le jeu de données qui sert à calibrer le modèle on perd en précision pour prédire des données indépendantes.
en gros bon courage !
micros
Quand tu pratiques une ANCOVA tu es dans de l'inférentiel. Vu que ta démarche est prédictive tu te fous de ce genre de trucs. Ce que tu vas chercher à avoir c'est un modèle qui prédise le mieux tes données et non pas savoir qui de la variable quanti ou quali explique le plus de variabilité, est-ce que les pentes sont égales ? est-ce que les ordonnées à l'origine sont égales ?, etc. Tu n'es plus dans la même démarche. Ce que tu cherches à faire est une régression linéaire multiple qui prédise le mieux tes données. Il y a aussi une chose à laquelle tu dois faire attention quand tu as un modèle qui collent très bien à tes données, il se peut qu'il ne soit pas très bon pour prédire des données indépendantes. Tout le truc est de trouver un modèle qui prédise pas trop mal tes données mais qui soit aussi capable de prédire correctement des données indépendantes. A vouloir trop diminuer l'erreur qu'on fait sur le jeu de données qui sert à calibrer le modèle on perd en précision pour prédire des données indépendantes.
en gros bon courage !
micros
Invité- Invité
Re: anova VS régression avec variables dichotomiques
je ne vois pas trop ce que tu entends par données indépendantes ?
flipo- Nombre de messages : 36
Date d'inscription : 13/06/2008
Re: anova VS régression avec variables dichotomiques
Je pense que ce sont les données que tu aura à prédire par la suite, donc celles qui ne servent pas à construire ton modèle.
Bon courage également.
Et n'oublie qu'il faut tu sois bien clair sur tes objectifs, description ou prédiction.
Pour moi le plus gros problème c'est que j'ai souvent du mal à savoir ce que mon boss veut exactement...
Bon courage également.
Et n'oublie qu'il faut tu sois bien clair sur tes objectifs, description ou prédiction.
Pour moi le plus gros problème c'est que j'ai souvent du mal à savoir ce que mon boss veut exactement...
FS- Nombre de messages : 163
Date d'inscription : 25/04/2008
Re: anova VS régression avec variables dichotomiques
Les données indépendantes sont effectivement les données que tu auras à prédire par la suite.
micros
micros
Invité- Invité
Re: anova VS régression avec variables dichotomiques
ah okay!
les joies de la stat, à chaque fois il y a plein de termes qui désignent la même chose...
oui bien entendu je ne teste pas mon modèle sur la population de construction.
merci à vous deux pour votre aide! je pense que je risque d'etre souvent sur le forum les semaines à venir car après quelques temps à mettre en place mes données l'heure de la modélisation a sonné...
à plus tard.
les joies de la stat, à chaque fois il y a plein de termes qui désignent la même chose...
oui bien entendu je ne teste pas mon modèle sur la population de construction.
merci à vous deux pour votre aide! je pense que je risque d'etre souvent sur le forum les semaines à venir car après quelques temps à mettre en place mes données l'heure de la modélisation a sonné...
à plus tard.
flipo- Nombre de messages : 36
Date d'inscription : 13/06/2008
Re: anova VS régression avec variables dichotomiques
après quelques jours à ramer sur ma modélisation je reviens sur ces propos:
à quelle méthode tu penses exactement?
je veux dire, pour modéliser une variable quanti par des variables quanti on effectue une régression linéaire, pour modéliser une variable quali par des variables quanti ou quali ou fait une régression logistique, mais pour modéliser une variable quanti par des variables quanti ou quali...j'avais lu initiallement que c'était de l'ancova, mais là je seche...
micros corpus a écrit:Après je ne vois pas ce qui te gène à mélanger les deux types de variables ? Si tu as des quanti et des quali pour expliquer ta variable Y et bah gardes les tel quelles !!!! C'est encore la meilleur chose à faire
à quelle méthode tu penses exactement?
je veux dire, pour modéliser une variable quanti par des variables quanti on effectue une régression linéaire, pour modéliser une variable quali par des variables quanti ou quali ou fait une régression logistique, mais pour modéliser une variable quanti par des variables quanti ou quali...j'avais lu initiallement que c'était de l'ancova, mais là je seche...
flipo- Nombre de messages : 36
Date d'inscription : 13/06/2008
Re: anova VS régression avec variables dichotomiques
flipo a écrit:Bonjour tout le monde;
Je dois réaliser une modélisation d'une variables quantitative grâce à des variables quali et quanti.
Je ne parlais que dans le cas d'une variable quantitative a modéliser avec un mélange de variable quanti et quali uniquement. Après pour modéliser des variables quali, il existe des vagons de modèles différents selon que la variable est ordinale ou pas ... et la c'est un autre domaine.
micros
Invité- Invité
Re: anova VS régression avec variables dichotomiques
on s'y perd un peu avec ces quali/quanti
je reformule:
je veux modéliser une variable continue par des variables continues et catégorielles, si j'ai bien compris tu dis que cela se fait simplement:
"Si tu as des quanti et des quali pour expliquer ta variable Y et bah gardes les tel quelles"
mais concretement je ne vois pas comment faire autrement que par ancova.
je reformule:
je veux modéliser une variable continue par des variables continues et catégorielles, si j'ai bien compris tu dis que cela se fait simplement:
"Si tu as des quanti et des quali pour expliquer ta variable Y et bah gardes les tel quelles"
mais concretement je ne vois pas comment faire autrement que par ancova.
flipo- Nombre de messages : 36
Date d'inscription : 13/06/2008
Re: anova VS régression avec variables dichotomiques
Je vais tacher d'être plus claire.
Tu cherches a modéliser une variable Y continue avec des variables Xi qui peuvent être soient continues soient catégorielles. Ok ?
Si ton objectif est purement prédictif, tu passes par un modèle linéaire du type : Y ~ alpha + somme(betai*Xi). Alors tu te fous de savoir quel est la nature des Xi !!!!!!!! Tu peux très bien mélanger des Xi continues et des Xi catégorielles.
L'ancova est un cas particulier ou tu as une Xi continue et une Xi catégorielle. Mais l'ancova est une méthode inférentielle ! Ici l'objectif est de savoir si tu as des pentes différentes, ou des ordonnées à l'origine différente ou les deux ou seulement des ordonnées à l'origine différente. L'ancova est aussi un modèle linéaire qui peut s'écrire de la manière suivante : Y ~ alpha + somme(betai*Xi).
Quand tu es dans un objectif prédictif tu t'en moques un peu de tout ça. Tu fais une régression multiple de Y sur les deux types de variables.
micros
Tu cherches a modéliser une variable Y continue avec des variables Xi qui peuvent être soient continues soient catégorielles. Ok ?
Si ton objectif est purement prédictif, tu passes par un modèle linéaire du type : Y ~ alpha + somme(betai*Xi). Alors tu te fous de savoir quel est la nature des Xi !!!!!!!! Tu peux très bien mélanger des Xi continues et des Xi catégorielles.
L'ancova est un cas particulier ou tu as une Xi continue et une Xi catégorielle. Mais l'ancova est une méthode inférentielle ! Ici l'objectif est de savoir si tu as des pentes différentes, ou des ordonnées à l'origine différente ou les deux ou seulement des ordonnées à l'origine différente. L'ancova est aussi un modèle linéaire qui peut s'écrire de la manière suivante : Y ~ alpha + somme(betai*Xi).
Quand tu es dans un objectif prédictif tu t'en moques un peu de tout ça. Tu fais une régression multiple de Y sur les deux types de variables.
micros
Invité- Invité
Re: anova VS régression avec variables dichotomiques
ok...
du coup concretement, si par exemple une variable catégorielle est le sexe, comment cela se traduit dans la formule
Y~f (Ki) ?
il faut dichotomiser la variable pour avoir
Y ~ β1 * indicatrice[femme] + β2 * indicatrice[homme] + ...
??
du coup concretement, si par exemple une variable catégorielle est le sexe, comment cela se traduit dans la formule
Y~f (Ki) ?
il faut dichotomiser la variable pour avoir
Y ~ β1 * indicatrice[femme] + β2 * indicatrice[homme] + ...
??
flipo- Nombre de messages : 36
Date d'inscription : 13/06/2008
Re: anova VS régression avec variables dichotomiques
en pratique dans un logiciel de statistique comme R le passage en indicatrice se fait automatiquement. Par défaut le modèle ne sera pas exactement sous la même forme que toi mais pour ce qui est des tests cela reviendra au même.
Modèle avec R :
Y ~ a + b[homme]
Si l'individu i est une femme alors le modèle est Y ~ a
Si l'individu i est un homme alors le modèle est Y ~ a + b
Ici le b représente la différence entre les hommes et les femmes.
Au final les coefficients que tu calculeras pour les hommes et pour les femmes reviendra exactement à la même chose que ce que tu as écrit.
micros
Modèle avec R :
Y ~ a + b[homme]
Si l'individu i est une femme alors le modèle est Y ~ a
Si l'individu i est un homme alors le modèle est Y ~ a + b
Ici le b représente la différence entre les hommes et les femmes.
Au final les coefficients que tu calculeras pour les hommes et pour les femmes reviendra exactement à la même chose que ce que tu as écrit.
micros
Invité- Invité
Re: anova VS régression avec variables dichotomiques
exact j'avais zappé la modalité de référence, j'ai réalisé après en tapant mon code.
je viens de me galérer à créer mes variables dichotomiques une par une sous sas, je pouvais surement y échapper en fait...
merci pour ton aide et tes conseils micro, ça fait au chaud au coeur un peu d'humanité dans le monde austère des stats
je viens de me galérer à créer mes variables dichotomiques une par une sous sas, je pouvais surement y échapper en fait...
merci pour ton aide et tes conseils micro, ça fait au chaud au coeur un peu d'humanité dans le monde austère des stats
flipo- Nombre de messages : 36
Date d'inscription : 13/06/2008
Sujets similaires
» ANOVA avec beaucoup de variables
» Regression statistique avec multiples variables mixtes
» Variables dichotomiques : quels stats ?
» anova mesures répétées pour dichotomiques?
» Analyse factorielle avec données dichotomiques
» Regression statistique avec multiples variables mixtes
» Variables dichotomiques : quels stats ?
» anova mesures répétées pour dichotomiques?
» Analyse factorielle avec données dichotomiques
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|