Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Valider la normalité des résidus d'une distribution
2 participants
Page 1 sur 1
Valider la normalité des résidus d'une distribution
Bonjour à tous,
Je suis nouvelle sur le site et je me permets de poster ma question, car je ne sais plus par quel bout prendre le problème pour en venir à bout ! Dès maintenant, merci à tous ceux qui voudront bien m’aider pour mon problème qui me bloque réellement !!
Voici ma situation :
J'étudie la régression linéaire entre deux variables sous R commander.
J'ai 41 individus (ou produits). J’utilise la moyenne de chaque individu pour les traitements (car un individu possède deux répétitions car ce sont des données sensorielles).
Pour les diverses régressions linéaires simples que j'ai fait, tout fonctionne parfaitement (test de pearson, significativité de la régression, test de durbin watson) jusqu'au test de Kolmogorov-smirnov... qui rejette Ho (= normalité de la distribution) à chaque fois. J'ai donc pensé à l'influence des points outliers (que j’ai observé avec des graphes comme les résidus standardisés ou le nuage des points) et j'ai réalisé le test de shapiro-wilk (qui semble plus "strict").
Mon problème est le suivant : pour chaque régression, quand kolmogorov-smirnov rejette Ho, shapiro-wilk l'accepte (p-value>0.05)... ?
Du coup, j'aurai aimé connaitre votre avis sur le test que je dois garder ! Est ce que l'un des deux est plus adapté au contexte (nombre d'individus par exemple) ?
Par ailleurs, comme je souhaite réellement valider cette normalité avec un test, faut-il que je réalise un autre test pour vérifier si mes résidus suivent bien une loi normale ? Les tests de Kurtosis et Skewness conviennent ils ? Ou un autre ?
Enfin, mise à part ce problème, je me demande comment je peux faire pour valider mon modèle une fois que j’ai fait tous ces tests ? Dois-je recommencer en prenant certains individus pour construire le modèle (et d’autres qui le valide par la suite) ou dois-je le faire en amont ? Et si je dois le faire en amont, quel est le test à réaliser ?
En vous remerciant vivement pour votre aide !
Emilie
Je suis nouvelle sur le site et je me permets de poster ma question, car je ne sais plus par quel bout prendre le problème pour en venir à bout ! Dès maintenant, merci à tous ceux qui voudront bien m’aider pour mon problème qui me bloque réellement !!
Voici ma situation :
J'étudie la régression linéaire entre deux variables sous R commander.
J'ai 41 individus (ou produits). J’utilise la moyenne de chaque individu pour les traitements (car un individu possède deux répétitions car ce sont des données sensorielles).
Pour les diverses régressions linéaires simples que j'ai fait, tout fonctionne parfaitement (test de pearson, significativité de la régression, test de durbin watson) jusqu'au test de Kolmogorov-smirnov... qui rejette Ho (= normalité de la distribution) à chaque fois. J'ai donc pensé à l'influence des points outliers (que j’ai observé avec des graphes comme les résidus standardisés ou le nuage des points) et j'ai réalisé le test de shapiro-wilk (qui semble plus "strict").
Mon problème est le suivant : pour chaque régression, quand kolmogorov-smirnov rejette Ho, shapiro-wilk l'accepte (p-value>0.05)... ?
Du coup, j'aurai aimé connaitre votre avis sur le test que je dois garder ! Est ce que l'un des deux est plus adapté au contexte (nombre d'individus par exemple) ?
Par ailleurs, comme je souhaite réellement valider cette normalité avec un test, faut-il que je réalise un autre test pour vérifier si mes résidus suivent bien une loi normale ? Les tests de Kurtosis et Skewness conviennent ils ? Ou un autre ?
Enfin, mise à part ce problème, je me demande comment je peux faire pour valider mon modèle une fois que j’ai fait tous ces tests ? Dois-je recommencer en prenant certains individus pour construire le modèle (et d’autres qui le valide par la suite) ou dois-je le faire en amont ? Et si je dois le faire en amont, quel est le test à réaliser ?
En vous remerciant vivement pour votre aide !
Emilie
Emip44- Nombre de messages : 5
Date d'inscription : 15/08/2012
Re: Valider la normalité des résidus d'une distribution
Salut,
Désolé mais je vois pas trop où tu vas. Dans une régression linéaire l'hypothèse de normalité se fait sur les résidus. Un simple qqplot te diras autant de chose que toute ta batterie de tests...ou comme je l'ai lu par ailleurs la comparaison de la distribution empirique et la distribution théorique des résidus.
Pour valider ton modèle l'idéal est un jeu de donnée test et bien sûr il faut regarder l'adéquation entre observé et prédit.
Donc à mon avis tu devrais nous respécifier tes objectifs et questions à traiter car là j'ai comme l'impression que tu pars un peu dans tous les sens sauf le bon.
nik
Désolé mais je vois pas trop où tu vas. Dans une régression linéaire l'hypothèse de normalité se fait sur les résidus. Un simple qqplot te diras autant de chose que toute ta batterie de tests...ou comme je l'ai lu par ailleurs la comparaison de la distribution empirique et la distribution théorique des résidus.
Pour valider ton modèle l'idéal est un jeu de donnée test et bien sûr il faut regarder l'adéquation entre observé et prédit.
Donc à mon avis tu devrais nous respécifier tes objectifs et questions à traiter car là j'ai comme l'impression que tu pars un peu dans tous les sens sauf le bon.
nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Valider la normalité des résidus d'une distribution
En effet, l'hypothèse de la normalité se fait sur les résidus... donc ce que je fais ne va pas ! Je vais recommencer en calculant les résidus et en utilisant ces données... ! Merci pour avoir trouvé l'erreur, qui est surement à l'origine de cette contradiction pour les tests.
L'objectif de mon étude est de montrer la relation (si elle existe) entre deux variables (une variable sensorielle et une variable nutritionnelle). Soit une corrélation linéaire, soit une relation logarithme. Est ce plus clair ?
Par contre, peux tu m'expliquer un peu plus la validation du modèle, j'ai peur de ne pas tout comprendre... comment puis-je regarder la différence entre observé et prédit. C'est une fois que le modèle est validé ?
L'objectif de mon étude est de montrer la relation (si elle existe) entre deux variables (une variable sensorielle et une variable nutritionnelle). Soit une corrélation linéaire, soit une relation logarithme. Est ce plus clair ?
Par contre, peux tu m'expliquer un peu plus la validation du modèle, j'ai peur de ne pas tout comprendre... comment puis-je regarder la différence entre observé et prédit. C'est une fois que le modèle est validé ?
Emip44- Nombre de messages : 5
Date d'inscription : 15/08/2012
Valider la normalité des résidus d'une distribution
Bonjour Nik,
J'ai repensé toute la nuit à l'étude de mes résidus...
ks.test(RegModel.1$residuals, pnorm)
shapiro.test(RegModel.1$residuals)
Comment puis-je faire pour enfin trancher entre ces deux tests ?
Merci pour ton aide,
Emilie
J'ai repensé toute la nuit à l'étude de mes résidus...
Je réalise que j'ai bien effectué mes tests sur les résidus car j'ai écris les scripts des fonctions (sous R) en prenant en compte les résidus :Nik a écrit:Salut,
Désolé mais je vois pas trop où tu vas. Dans une régression linéaire l'hypothèse de normalité se fait sur les résidus.
nik
ks.test(RegModel.1$residuals, pnorm)
shapiro.test(RegModel.1$residuals)
Comment puis-je faire pour enfin trancher entre ces deux tests ?
Merci pour ton aide,
Emilie
Emip44- Nombre de messages : 5
Date d'inscription : 15/08/2012
Sujets similaires
» comparer la distribution des résidus avec la loi noramle
» Normalité de distribution
» evaluer la normalité d'une distribution... par groupe ?
» Valider un sous echantillon d'une population
» Valider une régression linéaire sous R
» Normalité de distribution
» evaluer la normalité d'une distribution... par groupe ?
» Valider un sous echantillon d'une population
» Valider une régression linéaire sous R
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum