Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
problème avec hypothèse de régression
2 participants
Page 1 sur 1
problème avec hypothèse de régression
Bonjour,
Je voulais faire une régression linéaire simple mais je n'ai pas homogénéité des variances. J'ai pensé faire une régression linéaire généralisée, mais j'ai un gros doute, je ne suis plus sûre si on a besoin de l'égalité des variances ou non pour cette méthode. Pouvez-vous m'aider ?
J'ai également une question à propos de la régression logistique binaire. Y a-t-il des hypothèses spéciales à vérifier (à part le variable à expliquer qui doit être de type binaire) ?
Merci.
Je voulais faire une régression linéaire simple mais je n'ai pas homogénéité des variances. J'ai pensé faire une régression linéaire généralisée, mais j'ai un gros doute, je ne suis plus sûre si on a besoin de l'égalité des variances ou non pour cette méthode. Pouvez-vous m'aider ?
J'ai également une question à propos de la régression logistique binaire. Y a-t-il des hypothèses spéciales à vérifier (à part le variable à expliquer qui doit être de type binaire) ?
Merci.
choupon- Nombre de messages : 12
Age : 39
Date d'inscription : 16/04/2008
Re: problème avec hypothèse de régression
qu'entends tu par regression linéaire généralisée ? Du moment que tu utilies une loi normale pour la modélisation de tes données il te faut l'égalité des variances que tu passes par un lm ou un glm ne changera rien. La régression linéaire n'étant qu'un cas particulier de glm.
Pour ce qui est de la régression logistique il existe un bon cours en pdf : http://www.tesser-pro.org/stat/Cours_regression_logistique.pdf
micros
Pour ce qui est de la régression logistique il existe un bon cours en pdf : http://www.tesser-pro.org/stat/Cours_regression_logistique.pdf
micros
Invité- Invité
Re: problème avec hypothèse de régression
Que puis-je utiliser comme méthode alors, sachant que j'ai la normalité mais pas l'homoscédasticité ?
Merci.
Merci.
choupon- Nombre de messages : 12
Age : 39
Date d'inscription : 16/04/2008
Re: problème avec hypothèse de régression
Comment testes-tu l'homogénéité ?
Je n'ai pas de solutions a te proposer.
Sorry
micros
Je n'ai pas de solutions a te proposer.
Sorry
micros
Invité- Invité
Re: problème avec hypothèse de régression
Tu peux essayer de transformer tes données avec une fonction pour homogénéiser la variance. Du moment que ça a encore du sens... c'est quoi tes données ?
popotam- Nombre de messages : 371
Date d'inscription : 27/09/2006
Re: problème avec hypothèse de régression
Désolée d'avoir mis si longtemps à répondre...
micros corpus : j'ai testé l'égalité des variances avec la fonction var.test() du logiciel R. Je voulais utiliser le test de White mais je ne l'ai pas trouvé dans R.
popotam : je ne savais pas qu'on pouvait homogénéiser la variance en faisant une transformation. Peux-tu m'en dire plus ? Existe-t-il des fonctions de R qui le font ?
Ma variable explicative est une distance à vol d'oiseau (DVO) entre deux endroits et ma variable à expliquer est la distance réelle (DR) entre ces deux endroits (en gros la distance qu'on parcours réellement quand on va du point A au point B). Je désire voir si il y a une relation linéaire entre DVO et DR.
micros corpus : j'ai testé l'égalité des variances avec la fonction var.test() du logiciel R. Je voulais utiliser le test de White mais je ne l'ai pas trouvé dans R.
popotam : je ne savais pas qu'on pouvait homogénéiser la variance en faisant une transformation. Peux-tu m'en dire plus ? Existe-t-il des fonctions de R qui le font ?
Ma variable explicative est une distance à vol d'oiseau (DVO) entre deux endroits et ma variable à expliquer est la distance réelle (DR) entre ces deux endroits (en gros la distance qu'on parcours réellement quand on va du point A au point B). Je désire voir si il y a une relation linéaire entre DVO et DR.
choupon- Nombre de messages : 12
Age : 39
Date d'inscription : 16/04/2008
Re: problème avec hypothèse de régression
Si tes deux variables sont quantitatives comment testes-tu l'homogénéité de la variance ?
En général les distance on peut les transformer avec des racines carrées.
micros
En général les distance on peut les transformer avec des racines carrées.
micros
Invité- Invité
Re: problème avec hypothèse de régression
Ton problème semble plus relever de la corrélation que de la régression.
Invité- Invité
Re: problème avec hypothèse de régression
Je me suis un peu mal exprimé comme à mon habitude... En fait, dans ma base de données je ne dispose que de la variable DVO. Je peux connaitre la variable DR en la "mesurant" sur une carte au cas par cas. L'idée était de trouver une relation entre DVO et DR afin de pouvoir prévoir la valeur de DR en fonction de DVO.
J'ai testé l'égalité des variances avec la fonction var.test() de R et j'ai fait un test de White tout à l'heure qui rejettait également l'homoscédasticité.
J'ai fait une transformation avec des racines carrées... mais je n'ai toujours pas égalité des variances.
Est-ce que les moindres carrés pondérés peuvent être utilisés dans mon cas (toutes les hypothèses de la régression linéaire sont vérifiées sauf l'homoscédasticité) ?
J'ai testé l'égalité des variances avec la fonction var.test() de R et j'ai fait un test de White tout à l'heure qui rejettait également l'homoscédasticité.
J'ai fait une transformation avec des racines carrées... mais je n'ai toujours pas égalité des variances.
Est-ce que les moindres carrés pondérés peuvent être utilisés dans mon cas (toutes les hypothèses de la régression linéaire sont vérifiées sauf l'homoscédasticité) ?
choupon- Nombre de messages : 12
Age : 39
Date d'inscription : 16/04/2008
Re: problème avec hypothèse de régression
je vais me répéter, mais dans la fonction var.test il te faut un facteur or ici tu parles de deux variables qui sont continues. J'ai un peu de mal à voir comment tu as tester l'homogénéité des variances.
pour les moindre carrés pondérés j'en ai aucune idée.
micros
pour les moindre carrés pondérés j'en ai aucune idée.
micros
Invité- Invité
Re: problème avec hypothèse de régression
Ah ok, excuse-moi, je pensais que tu n'avais pas vu ma réponse...
Les commandes :
reg<-lm(DRE~DV,data=entree)
var.test(reg$res,reg$fitted)
Les commandes :
reg<-lm(DRE~DV,data=entree)
var.test(reg$res,reg$fitted)
choupon- Nombre de messages : 12
Age : 39
Date d'inscription : 16/04/2008
Re: problème avec hypothèse de régression
Je ne suis pas convaincu que ça soit le moyen de tester l'homogénéité de la variance.
Je te donne un exemple :
x <- rnorm(100)
y <- 300*x-200+rnorm(100,0,100)
lm1 <- lm(y~x)
Si tu regardes les résidus de la régression il n'y a pas de raison de croire que leur variance augmente avec les valeurs prédites. Ce qui est logique quand on voit la construction des différentes variables. Si tu fais le test avec var.test tu obtiens quelque chose de très significatif, alors que si tu fais le test de White (ncv.test de la librairie car), celui la ne l'est pas du tout ! Au contraire la p-value est très grande !
De plus si tu regardes l'aide de la fonction var.test il est dit ceci :
Performs an F test to compare the variances of two samples from normal
populations
Elle sert donc a comparer des variancs de deux échantillons provenant de lois normales. Toi tu compares la variance des résidus et celle des valeurs prédites, mais elles n'ont aucune raison d'être identique. Regarde dans mon exemple. Si ta régression explique un très grand % de variance de y alors tes résidus auront une très faible variance mais ce n'est pas pour ça que tes valeurs prédites ne peuvent pas en avoir une très grande.
J'espère que tout ceci est clair, que je ne suis pas trop confus.
micros
Je te donne un exemple :
x <- rnorm(100)
y <- 300*x-200+rnorm(100,0,100)
lm1 <- lm(y~x)
Si tu regardes les résidus de la régression il n'y a pas de raison de croire que leur variance augmente avec les valeurs prédites. Ce qui est logique quand on voit la construction des différentes variables. Si tu fais le test avec var.test tu obtiens quelque chose de très significatif, alors que si tu fais le test de White (ncv.test de la librairie car), celui la ne l'est pas du tout ! Au contraire la p-value est très grande !
De plus si tu regardes l'aide de la fonction var.test il est dit ceci :
Performs an F test to compare the variances of two samples from normal
populations
Elle sert donc a comparer des variancs de deux échantillons provenant de lois normales. Toi tu compares la variance des résidus et celle des valeurs prédites, mais elles n'ont aucune raison d'être identique. Regarde dans mon exemple. Si ta régression explique un très grand % de variance de y alors tes résidus auront une très faible variance mais ce n'est pas pour ça que tes valeurs prédites ne peuvent pas en avoir une très grande.
J'espère que tout ceci est clair, que je ne suis pas trop confus.
micros
Invité- Invité
Re: problème avec hypothèse de régression
popotam : je ne savais pas qu'on pouvait homogénéiser la variance en faisant une transformation. Peux-tu m'en dire plus ? Existe-t-il des fonctions de R qui le font ?
Ma variable explicative est une distance à vol d'oiseau (DVO) entre deux endroits et ma variable à expliquer est la distance réelle (DR) entre ces deux endroits (en gros la distance qu'on parcours réellement quand on va du point A au point B). Je désire voir si il y a une relation linéaire entre DVO et DR.
En fait c'est pas forcément pour homogénéiser la variance mais pour que le modèle s'ajuste le mieux possible. Il y a la méthode de Box-Cox qui trouve une transformation qui va en ce sens (tu peux trouver ça dans R, voir http://cran.r-project.org/doc/contrib/Faraway-PRA.pdf)
Mais bon peut-être que ça ne t'intéresse pas de faire la régression de, par exemple, log(DVO) par rapport à DR.
popotam- Nombre de messages : 371
Date d'inscription : 27/09/2006
Re: problème avec hypothèse de régression
Est-ce que les moindres carrés pondérés peuvent être utilisés dans mon cas (toutes les hypothèses de la régression linéaire sont vérifiées sauf l'homoscédasticité) ?
Pourquoi pas. Il me semble assez naturel de supposer que dans la relation DR = a*DVO + b + erreur, la variance de l'erreur devrait être plus grande pour des grandes distances à vol d'oiseaux.
Dans R c'est la fonction gls() du package nlme. Mais je n''ai jamais essayé, je ne saurais rien te dire de plus.
popotam- Nombre de messages : 371
Date d'inscription : 27/09/2006
Re: problème avec hypothèse de régression
Autre chose à laquelle je viens de réfléchir: je vois plutôt une erreur qui agit de façon multiplicative sur ces données, plutôt que additive.
Que donne log(DR) par rapport à log(DVO) ?
Ceci correspond au modèle:
log(DR)=a*log(DVO)+b + erreur
soit
DR = exp(b)*DVO^a*exp(erreur)
Mais je n'aime pas trop le DVO^a car les unités perdent leur sens, à moins que a=1.
Que donne log(DR) par rapport à log(DVO) ?
Ceci correspond au modèle:
log(DR)=a*log(DVO)+b + erreur
soit
DR = exp(b)*DVO^a*exp(erreur)
Mais je n'aime pas trop le DVO^a car les unités perdent leur sens, à moins que a=1.
popotam- Nombre de messages : 371
Date d'inscription : 27/09/2006
Sujets similaires
» Probleme d'interprétation d'hypothese.
» Problème avec R
» probleme avec loi exponentielle
» probléme avec les zéros!!!!
» Problème avec ACP et "facteur"
» Problème avec R
» probleme avec loi exponentielle
» probléme avec les zéros!!!!
» Problème avec ACP et "facteur"
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum