Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

-40%
Le deal à ne pas rater :
Tefal Ingenio Emotion – Batterie de cuisine 10 pièces (induction, ...
59.99 € 99.99 €
Voir le deal

régression multiples

2 participants

Aller en bas

regression - régression multiples Empty régression multiples

Message par lynda cid Ven 16 Oct 2015 - 19:05

Bonsoir tout le monde,

j'ai fait une étude sur la variabilité des feuilles chez une espèce donnée. j'ai donc 5 stations; 10 arbres/ station; 3 niveaux d’échantillonnage par arbres (niveaux bas; moyen et cime)en enfin 20 feuille / niveau. j'ai mesuré plusieurs paramétres pour chaque feuille (longueur, largeur, sur.......) je veux étudié la variabilité de ces mesures selon tous mes facteurs pour voir lequel influence le plus la morphologie des feuilles.
j'ai pas une distribution normale donc l'anova est à écarté. que me conseillez vous? je peux faire une régression multiples?

ça serai gentil de m'aider ou de me donné une piste. merci

lynda cid

Nombre de messages : 4
Date d'inscription : 16/10/2015

Revenir en haut Aller en bas

regression - régression multiples Empty Re: régression multiples

Message par Eric Wajnberg Dim 18 Oct 2015 - 9:54

le problème n'est pas tant dans ce cas d'avoir une loi normale ou pas pour vos mesures, mais est plutôt lié au fait que vos données sont loin d'être issues d'échantillons indépendants. Pour chaque paramètre, ce sont les mêmes niveaux pour les feuilles, les mêmes arbres pour les niveaux, les mêmes stations pour les arbres, etc. Vous êtes dans un schéma d'analyse dit hiérarchisée (chercher "nested anova" sur google par exemple). Dans ce cas, il existe des ANOVA sur données hiérarchisées qui peuvent vous aider.

Maintenant, si les données ne sont pas gaussiennes, il faudrait connaitre la distribution de vos données pour avancer, mais des données comme longueur, largeur, etc. suivent généralement des lois normales. Je m'interroge sur la(les) méthode(s) que vous avez utilisée(s) pour tester les normalités ici. Ces méthodes sont généralement peu puissantes et vous avez des effectifs assez faibles..

Egalement, dans la mesure où vous mesurez plusieurs paramètres par feuille, tout ceci serait à mettre dans une analyse équivalente, mais en multivarié.

Je fini enfin pour votre allusion à la régression multiple (titre de votre post). Cette régression nécessite aussi la normalité de la variable à expliquer. Je ne comprends pas votre remarque sur ce point, donc. Et puis, dans une régression multiple, tous les régresseurs sont quantitatifs, or les vôtres sont apparemment tous qualitatifs. On dirait que ce n'est donc pas la solution.

Cordialement, Eric.
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1238
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

regression - régression multiples Empty Re: régression multiples

Message par lynda cid Dim 18 Oct 2015 - 18:22

Bonsoir Eric et merci pour la réponse.

j'avoue que je suis pas nulle en statistique. bon je vous explique le but de mon travail est de voir si les variables (longueur, largeur....) des feuilles varient plus selon le niveau rameau sur l'arbre, entre les différent arbres ou selon la station. J'ai utilisé shapiro.test pour analyser la normalité et qui me donne une p-value <0.001.

j'ai utilisé kruskal.wallis pour analyser chaque variable/ facteur, mais je voulais chercher si il y 'avait un script qui me donne directement l'influence de tout les facteur sur la variable choisi (un peu comme l'anova).
je vais me documenté un peu sur "nested anova".
Merci encore.
Lynda


lynda cid

Nombre de messages : 4
Date d'inscription : 16/10/2015

Revenir en haut Aller en bas

regression - régression multiples Empty Re: régression multiples

Message par Eric Wajnberg Lun 19 Oct 2015 - 5:10

Oui, j'avais bien compris.

Je soupçonne que vous avez appliqué votre test de Shapiro sur l'ensemble de vos données, alors que l'on attend (doit vérifier) la normalité dans chaque population séparément (e.g., chaque niveau de chaque arbre de chaque station, etc.). Si vous avez, par exemple, un très fort effet station, alors la distribution globale de vos données ne peut être normale! C'est pour ceci que je prétendais que vos effectifs sont assez faibles et que vous ne devriez detecter aucune déviation à la normalité. Pour le type de variables que vous mesurez, je pense que vous devriez laisser tomber cette histoire de test de la normalité.

Pour le reste, encore une fois, c'est effectivement la structure hiérarchique de vos données qui doit être prise en compte, et un Kruskal-Wallis ne change rien.

Enfin, on peut effectivement analyser chaque variable explicative séparément (pour peu que les données soient indépendantes, ce qu'elles ne sont pas) mais on perd dans ce cas les effets d'interaction.

Cordialement, Eric.
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1238
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

regression - régression multiples Empty Re: régression multiples

Message par lynda cid Lun 19 Oct 2015 - 19:58

aah oui j'y ai pas pensé!! en effet, je connais les scripts des fonctions tapply et by mais comment peut-on appliqué le test de normalité en choisissant le niveau d'une facteur?

merci encore Eric, je verrai qu'est-ce que ça donne avec le test hiérarchique.

Lynda

lynda cid

Nombre de messages : 4
Date d'inscription : 16/10/2015

Revenir en haut Aller en bas

regression - régression multiples Empty Re: régression multiples

Message par Eric Wajnberg Mar 20 Oct 2015 - 9:55

Sur R, avec tapply, vous pouvez appliquer un test de Shapiro à chaque niveau facilement. Mais - j'ai l'impression de me répéter pour rien - un test de Shapiro manque sérieusement de puissance et vous ne verrez aucune déviation à la normalité dans vos données avec les faibles effectifs que vous avez. Vos variables sont notoirement connues pour être gaussiennes. Je le répète donc :  laisser tomber cette histoire de normalité et concentrez-vous sur la structure hiérarchique dans vos données.

Eric.
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1238
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

regression - régression multiples Empty Re: régression multiples

Message par lynda cid Mar 20 Oct 2015 - 18:28

non non Eric, j'ai bien compris ce que vous m'avez expliquer c'était juste pour connaitre le script à faire pour shapiro pour un niveau donné (pas spécialement pour cette étude) car je le connaissais pas mais j'ai trouver comment.
Je vous remercie énormément et désolée si je vous ai fait perdre du temps.

Lynda

lynda cid

Nombre de messages : 4
Date d'inscription : 16/10/2015

Revenir en haut Aller en bas

regression - régression multiples Empty Re: régression multiples

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum