Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

Le Deal du moment : -20%
(Adhérents Fnac) Enceinte Bluetooth Marshall ...
Voir le deal
199.99 €

problème avec hypothèse de régression

2 participants

Aller en bas

problème avec hypothèse de régression Empty problème avec hypothèse de régression

Message par choupon Jeu 29 Mai 2008 - 9:47

Bonjour,

Je voulais faire une régression linéaire simple mais je n'ai pas homogénéité des variances. J'ai pensé faire une régression linéaire généralisée, mais j'ai un gros doute, je ne suis plus sûre si on a besoin de l'égalité des variances ou non pour cette méthode. Pouvez-vous m'aider ?

J'ai également une question à propos de la régression logistique binaire. Y a-t-il des hypothèses spéciales à vérifier (à part le variable à expliquer qui doit être de type binaire) ?

Merci.

choupon

Nombre de messages : 12
Age : 38
Date d'inscription : 16/04/2008

Revenir en haut Aller en bas

problème avec hypothèse de régression Empty Re: problème avec hypothèse de régression

Message par Invité Jeu 29 Mai 2008 - 14:27

qu'entends tu par regression linéaire généralisée ? Du moment que tu utilies une loi normale pour la modélisation de tes données il te faut l'égalité des variances que tu passes par un lm ou un glm ne changera rien. La régression linéaire n'étant qu'un cas particulier de glm.

Pour ce qui est de la régression logistique il existe un bon cours en pdf : http://www.tesser-pro.org/stat/Cours_regression_logistique.pdf

micros

Invité
Invité


Revenir en haut Aller en bas

problème avec hypothèse de régression Empty Re: problème avec hypothèse de régression

Message par choupon Jeu 29 Mai 2008 - 14:39

Que puis-je utiliser comme méthode alors, sachant que j'ai la normalité mais pas l'homoscédasticité ?

Merci.

choupon

Nombre de messages : 12
Age : 38
Date d'inscription : 16/04/2008

Revenir en haut Aller en bas

problème avec hypothèse de régression Empty Re: problème avec hypothèse de régression

Message par Invité Jeu 29 Mai 2008 - 16:13

Comment testes-tu l'homogénéité ?

Je n'ai pas de solutions a te proposer.

Sorry

micros

Invité
Invité


Revenir en haut Aller en bas

problème avec hypothèse de régression Empty Re: problème avec hypothèse de régression

Message par popotam Lun 2 Juin 2008 - 7:02

Tu peux essayer de transformer tes données avec une fonction pour homogénéiser la variance. Du moment que ça a encore du sens... c'est quoi tes données ?

popotam

Nombre de messages : 371
Date d'inscription : 27/09/2006

Revenir en haut Aller en bas

problème avec hypothèse de régression Empty Re: problème avec hypothèse de régression

Message par choupon Mer 4 Juin 2008 - 7:58

Désolée d'avoir mis si longtemps à répondre...

micros corpus : j'ai testé l'égalité des variances avec la fonction var.test() du logiciel R. Je voulais utiliser le test de White mais je ne l'ai pas trouvé dans R.

popotam : je ne savais pas qu'on pouvait homogénéiser la variance en faisant une transformation. Peux-tu m'en dire plus ? Existe-t-il des fonctions de R qui le font ?
Ma variable explicative est une distance à vol d'oiseau (DVO) entre deux endroits et ma variable à expliquer est la distance réelle (DR) entre ces deux endroits (en gros la distance qu'on parcours réellement quand on va du point A au point B). Je désire voir si il y a une relation linéaire entre DVO et DR.

choupon

Nombre de messages : 12
Age : 38
Date d'inscription : 16/04/2008

Revenir en haut Aller en bas

problème avec hypothèse de régression Empty Re: problème avec hypothèse de régression

Message par Invité Mer 4 Juin 2008 - 8:50

Si tes deux variables sont quantitatives comment testes-tu l'homogénéité de la variance ?

En général les distance on peut les transformer avec des racines carrées.

micros

Invité
Invité


Revenir en haut Aller en bas

problème avec hypothèse de régression Empty Re: problème avec hypothèse de régression

Message par Invité Mer 4 Juin 2008 - 8:51

Ton problème semble plus relever de la corrélation que de la régression.

Invité
Invité


Revenir en haut Aller en bas

problème avec hypothèse de régression Empty Re: problème avec hypothèse de régression

Message par choupon Mer 4 Juin 2008 - 11:24

Je me suis un peu mal exprimé comme à mon habitude... En fait, dans ma base de données je ne dispose que de la variable DVO. Je peux connaitre la variable DR en la "mesurant" sur une carte au cas par cas. L'idée était de trouver une relation entre DVO et DR afin de pouvoir prévoir la valeur de DR en fonction de DVO.

J'ai testé l'égalité des variances avec la fonction var.test() de R et j'ai fait un test de White tout à l'heure qui rejettait également l'homoscédasticité.
J'ai fait une transformation avec des racines carrées... mais je n'ai toujours pas égalité des variances.

Est-ce que les moindres carrés pondérés peuvent être utilisés dans mon cas (toutes les hypothèses de la régression linéaire sont vérifiées sauf l'homoscédasticité) ?

choupon

Nombre de messages : 12
Age : 38
Date d'inscription : 16/04/2008

Revenir en haut Aller en bas

problème avec hypothèse de régression Empty Re: problème avec hypothèse de régression

Message par Invité Mer 4 Juin 2008 - 13:28

je vais me répéter, mais dans la fonction var.test il te faut un facteur or ici tu parles de deux variables qui sont continues. J'ai un peu de mal à voir comment tu as tester l'homogénéité des variances.

pour les moindre carrés pondérés j'en ai aucune idée.

micros

Invité
Invité


Revenir en haut Aller en bas

problème avec hypothèse de régression Empty Re: problème avec hypothèse de régression

Message par choupon Mer 4 Juin 2008 - 14:34

Ah ok, excuse-moi, je pensais que tu n'avais pas vu ma réponse... Embarassed

Les commandes :
reg<-lm(DRE~DV,data=entree)
var.test(reg$res,reg$fitted)

choupon

Nombre de messages : 12
Age : 38
Date d'inscription : 16/04/2008

Revenir en haut Aller en bas

problème avec hypothèse de régression Empty Re: problème avec hypothèse de régression

Message par Invité Jeu 5 Juin 2008 - 10:00

Je ne suis pas convaincu que ça soit le moyen de tester l'homogénéité de la variance.
Je te donne un exemple :
x <- rnorm(100)
y <- 300*x-200+rnorm(100,0,100)
lm1 <- lm(y~x)

Si tu regardes les résidus de la régression il n'y a pas de raison de croire que leur variance augmente avec les valeurs prédites. Ce qui est logique quand on voit la construction des différentes variables. Si tu fais le test avec var.test tu obtiens quelque chose de très significatif, alors que si tu fais le test de White (ncv.test de la librairie car), celui la ne l'est pas du tout ! Au contraire la p-value est très grande !
De plus si tu regardes l'aide de la fonction var.test il est dit ceci :
Performs an F test to compare the variances of two samples from normal
populations

Elle sert donc a comparer des variancs de deux échantillons provenant de lois normales. Toi tu compares la variance des résidus et celle des valeurs prédites, mais elles n'ont aucune raison d'être identique. Regarde dans mon exemple. Si ta régression explique un très grand % de variance de y alors tes résidus auront une très faible variance mais ce n'est pas pour ça que tes valeurs prédites ne peuvent pas en avoir une très grande.

J'espère que tout ceci est clair, que je ne suis pas trop confus.

micros

Invité
Invité


Revenir en haut Aller en bas

problème avec hypothèse de régression Empty Re: problème avec hypothèse de régression

Message par popotam Jeu 5 Juin 2008 - 12:35

popotam : je ne savais pas qu'on pouvait homogénéiser la variance en faisant une transformation. Peux-tu m'en dire plus ? Existe-t-il des fonctions de R qui le font ?
Ma variable explicative est une distance à vol d'oiseau (DVO) entre deux endroits et ma variable à expliquer est la distance réelle (DR) entre ces deux endroits (en gros la distance qu'on parcours réellement quand on va du point A au point B). Je désire voir si il y a une relation linéaire entre DVO et DR.

En fait c'est pas forcément pour homogénéiser la variance mais pour que le modèle s'ajuste le mieux possible. Il y a la méthode de Box-Cox qui trouve une transformation qui va en ce sens (tu peux trouver ça dans R, voir http://cran.r-project.org/doc/contrib/Faraway-PRA.pdf)

Mais bon peut-être que ça ne t'intéresse pas de faire la régression de, par exemple, log(DVO) par rapport à DR.

popotam

Nombre de messages : 371
Date d'inscription : 27/09/2006

Revenir en haut Aller en bas

problème avec hypothèse de régression Empty Re: problème avec hypothèse de régression

Message par popotam Jeu 5 Juin 2008 - 12:45

Est-ce que les moindres carrés pondérés peuvent être utilisés dans mon cas (toutes les hypothèses de la régression linéaire sont vérifiées sauf l'homoscédasticité) ?

Pourquoi pas. Il me semble assez naturel de supposer que dans la relation DR = a*DVO + b + erreur, la variance de l'erreur devrait être plus grande pour des grandes distances à vol d'oiseaux.

Dans R c'est la fonction gls() du package nlme. Mais je n''ai jamais essayé, je ne saurais rien te dire de plus.

popotam

Nombre de messages : 371
Date d'inscription : 27/09/2006

Revenir en haut Aller en bas

problème avec hypothèse de régression Empty Re: problème avec hypothèse de régression

Message par popotam Jeu 5 Juin 2008 - 12:56

Autre chose à laquelle je viens de réfléchir: je vois plutôt une erreur qui agit de façon multiplicative sur ces données, plutôt que additive.

Que donne log(DR) par rapport à log(DVO) ?

Ceci correspond au modèle:

log(DR)=a*log(DVO)+b + erreur

soit

DR = exp(b)*DVO^a*exp(erreur)

Mais je n'aime pas trop le DVO^a car les unités perdent leur sens, à moins que a=1.

popotam

Nombre de messages : 371
Date d'inscription : 27/09/2006

Revenir en haut Aller en bas

problème avec hypothèse de régression Empty Re: problème avec hypothèse de régression

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut


 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum