Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Stat écologie --> ACP ou autre test ?
2 participants
Page 1 sur 1
Stat écologie --> ACP ou autre test ?
Bien le bonjour à vous tous
Je suis heureuse de trouver un forum dédié aux stats!!
J'aime beaucoup manipuler les données, mais là j'avoue j'ai besoin d'aide, car je m'y perds !
Je vous explique mon cas :
j'ai réalisé une expérience de bouturage de plante (suivant un plan d'essai avec quatre répétitions) qui testait l'influence de plusieurs concentrations hormones de bouturage (3 modalités). Au bout de 110 jours d'expérience, j'ai compté les variables suivantes pour chaque individu :
- le nombre de racines
- la longueur de la plus grande racine
- la longueur cumulée de toutes les racines
Plus le pourcentage de réussite pour chaque modalité.
J'ai réalisé l'expérience en juin, puis je l'ai recommencé en septembre.
Il existe une différence significative entre les deux mois.
Je cherche à expliquer cette différence, en déterminant un facteur discriminant. J'ai à ma disposition la température (min, max, moy), les précipitations quotidiennes, le rayonnement, l'humidité relative, la durée du jour.
A priori je pense que c'est la durée du jour qui va le plus influencer, mais je souhaiterais le tester.
Cela vous semble-t-il faisable ?
Est-ce raisonnable de penser à une ACP ?
Si oui, comment la réaliser avec spss ou xlstat ? Je m'y perds complètement entre tous les tutos qu'on trouve sur le net.
Si non que me conseillez vous ?
Je vous remercie beaucoup d'avance, et attend vos réponses avec impatience pour avancer dans mes recherches.
Hélène
Je suis heureuse de trouver un forum dédié aux stats!!
J'aime beaucoup manipuler les données, mais là j'avoue j'ai besoin d'aide, car je m'y perds !
Je vous explique mon cas :
j'ai réalisé une expérience de bouturage de plante (suivant un plan d'essai avec quatre répétitions) qui testait l'influence de plusieurs concentrations hormones de bouturage (3 modalités). Au bout de 110 jours d'expérience, j'ai compté les variables suivantes pour chaque individu :
- le nombre de racines
- la longueur de la plus grande racine
- la longueur cumulée de toutes les racines
Plus le pourcentage de réussite pour chaque modalité.
J'ai réalisé l'expérience en juin, puis je l'ai recommencé en septembre.
Il existe une différence significative entre les deux mois.
Je cherche à expliquer cette différence, en déterminant un facteur discriminant. J'ai à ma disposition la température (min, max, moy), les précipitations quotidiennes, le rayonnement, l'humidité relative, la durée du jour.
A priori je pense que c'est la durée du jour qui va le plus influencer, mais je souhaiterais le tester.
Cela vous semble-t-il faisable ?
Est-ce raisonnable de penser à une ACP ?
Si oui, comment la réaliser avec spss ou xlstat ? Je m'y perds complètement entre tous les tutos qu'on trouve sur le net.
Si non que me conseillez vous ?
Je vous remercie beaucoup d'avance, et attend vos réponses avec impatience pour avancer dans mes recherches.
Hélène
-.Ln.-- Nombre de messages : 3
Date d'inscription : 16/06/2010
Re: Stat écologie --> ACP ou autre test ?
Salut
voilà pour un premier point
Bon courage
A+
Nik
ouiCela vous semble-t-il faisable ?
Alors non car je ne vois pas à quoi ça va te servir : l'ACP n'est pas un test statistique mais une méthode permettant de faire des ordinations en fonction de variables.Est-ce raisonnable de penser à une ACP ?
Donc pas d'ACP et le mieux actuellement reste R. Il faut un peu s'investir au départ mais après c'est d'une part sans limite et ça oblige à réfléchir à ce que l'on fait contrairement aux logiciels dit "presse bouton".Si oui, comment la réaliser avec spss ou xlstat ? Je m'y perds complètement entre tous les tutos qu'on trouve sur le net.
Tout simplement des ANOVA (ou plutôt des régressions avec une variable explicative catégorielle) pour chacune de tes variable descriptive de l'état de la plante (nb racine and co...). Il faut bien vérifier les conditions d'application du modèle linéaire. Peut être qu'une transformation des données sera nécessaires à voir. Il est possible aussi que pour les données de comptage (racine) la distribution d'erreur normale supposée par le modèle linéaire ne s'applique pas. Il faudra alors passer avec une distribution d'erreur poissonnienne sans doute.Si non que me conseillez vous ?
voilà pour un premier point
Bon courage
A+
Nik
Il existe une différence significative entre les deux mois.
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Stat écologie --> ACP ou autre test ?
Bonjour Nick,
merci de t'être arrêté sur mon problème.
Je viens de passer la journée dessus (oui je n'ai pas précisé mais je suis en Calédonie, donc forcément pendant que vous dormez ... je travaille :-)
Et j'ai certes progressé, mais je ne suis pas encore arrivée à mes fins !
Voici mes remarques :
- je suis entièrement d'accord que R semble être LE logiciel à utiliser, malheureusement je n'ai pas reçu de formation sur ce logiciel, mais sur statview. Toutefois, j'ai toujours aimé la programmation donc l'idée me plaît ! J'ai passé du temps à lire des tutos ajd, notamment le manuel débutant de Paradis, et les fiches td du site de biostatistique de Lyon 1 ( http://www.fr.embnet.org/R/enseignement.html ) en testant les petits exercices faciles.
Malgré ça, je ne me sens pas du tout prête à analyser me données avec R
- j'ai parallèlement testé plusieurs choses sur xlstat et statview. Du coup j'ai suivi tes conseils et me suis dirigée vers une régression. Mais il en existe beaucoup de sortes différentes. J'ai suivi le tuto suivant : http://www.xlstat.com/fr/support/tutorials/anco.htm pour réaliser une ancova sur mes données. Le problème que j'ai rencontré c'est que j'ai donc mes variables dépendantes que j'ai mesuré (nb de racines, longueur), mais pour mes variables indépendantes, elles ne prennent que deux valeurs, ou bien celles de juin ou bien celles de septembre (température, humidité, etc.). Du coup le logiciel refusait de me faire l'analyse pour cause de multicolinéarité). J'ai bidouillé un peu les données, c'est-à-dire que pour la température de juin de 18,1°C, j'ai mis différentes valeurs autour de 18 en gardant comme moyenne générale le 18,1°C. Du coup là ça a marché.
Avec xlstat donc j'ai obtenu les valeurs de R² (nb racine : 18,5%; Ltot : 29,2%, Lmax :41,9%), sachant que mes données donne des probabilités associées au F inférieures à 0.0001 pour les longueurs et 0,003 pour le nb de racine. Je trouve ces résultats plutôt intéressants, mais ce que je ne comprends pas c'est ensuite l'histoire des analyse de type I SS et III SS. Car d'après le tuto, la plus petite valeur permet d'identifier la variable qui a le plus d'impact. OK, mais sauf que si les variables sont rangées différemment au départ dans mon tableau de données, ça change les résultats pour l'analyse I SS --> je ne comprends pas l'implication, car si je choisis l'ordre des variables et influence les résultats, ça va pas aller ....
En plus l'histoire de bidouiller les données ça me plait pas trop non pus, je voudrais lui dire qu'il faisait telle température en juin et telle autre en septembre, et zouuuuu
Bon je sais, c'est pas si facile.
Mais que pensez-vous déjà de tout ça ?
J'aurais vos messages seulement à mon retour de week-end maintenant, mais je croise les doigts pour que le déclic se fasse :-))
Bon week-end à vous, tous
Et merci pour l'aide que vous m'apporterez
Hélène
merci de t'être arrêté sur mon problème.
Je viens de passer la journée dessus (oui je n'ai pas précisé mais je suis en Calédonie, donc forcément pendant que vous dormez ... je travaille :-)
Et j'ai certes progressé, mais je ne suis pas encore arrivée à mes fins !
Voici mes remarques :
- je suis entièrement d'accord que R semble être LE logiciel à utiliser, malheureusement je n'ai pas reçu de formation sur ce logiciel, mais sur statview. Toutefois, j'ai toujours aimé la programmation donc l'idée me plaît ! J'ai passé du temps à lire des tutos ajd, notamment le manuel débutant de Paradis, et les fiches td du site de biostatistique de Lyon 1 ( http://www.fr.embnet.org/R/enseignement.html ) en testant les petits exercices faciles.
Malgré ça, je ne me sens pas du tout prête à analyser me données avec R
- j'ai parallèlement testé plusieurs choses sur xlstat et statview. Du coup j'ai suivi tes conseils et me suis dirigée vers une régression. Mais il en existe beaucoup de sortes différentes. J'ai suivi le tuto suivant : http://www.xlstat.com/fr/support/tutorials/anco.htm pour réaliser une ancova sur mes données. Le problème que j'ai rencontré c'est que j'ai donc mes variables dépendantes que j'ai mesuré (nb de racines, longueur), mais pour mes variables indépendantes, elles ne prennent que deux valeurs, ou bien celles de juin ou bien celles de septembre (température, humidité, etc.). Du coup le logiciel refusait de me faire l'analyse pour cause de multicolinéarité). J'ai bidouillé un peu les données, c'est-à-dire que pour la température de juin de 18,1°C, j'ai mis différentes valeurs autour de 18 en gardant comme moyenne générale le 18,1°C. Du coup là ça a marché.
Avec xlstat donc j'ai obtenu les valeurs de R² (nb racine : 18,5%; Ltot : 29,2%, Lmax :41,9%), sachant que mes données donne des probabilités associées au F inférieures à 0.0001 pour les longueurs et 0,003 pour le nb de racine. Je trouve ces résultats plutôt intéressants, mais ce que je ne comprends pas c'est ensuite l'histoire des analyse de type I SS et III SS. Car d'après le tuto, la plus petite valeur permet d'identifier la variable qui a le plus d'impact. OK, mais sauf que si les variables sont rangées différemment au départ dans mon tableau de données, ça change les résultats pour l'analyse I SS --> je ne comprends pas l'implication, car si je choisis l'ordre des variables et influence les résultats, ça va pas aller ....
En plus l'histoire de bidouiller les données ça me plait pas trop non pus, je voudrais lui dire qu'il faisait telle température en juin et telle autre en septembre, et zouuuuu
Bon je sais, c'est pas si facile.
Mais que pensez-vous déjà de tout ça ?
J'aurais vos messages seulement à mon retour de week-end maintenant, mais je croise les doigts pour que le déclic se fasse :-))
Bon week-end à vous, tous
Et merci pour l'aide que vous m'apporterez
Hélène
-.Ln.-- Nombre de messages : 3
Date d'inscription : 16/06/2010
Re: Stat écologie --> ACP ou autre test ?
salut,
effectivement ton bidouillage de données ne tient pas la route. Tu crées une variabilité dont tu n'as aucune certitude. Donc c'est à proscrire absolument. Si tu n'as que 2 températures alors tu ne peux rien en faire. C'est vouloir faire passer une droite par deux points : c'est inévitable puisque c'est la base même d'une droite.
Tu ne peux introduire des valeurs dans un modèle que si il s'agit d'une variable.
Pour les types d'analyses I et III, je ne sais pas exactement à quoi ils font référence. Mais en tout cas se baser sur une p-value pour mesurer une quantité (celle de l'impact sur la variable à expliquer) me semble absolument foireux. La p-value n'est pas une valeur quantitative.
Mais bon il est vrai que je ne fais pas du tout confiance à xlsstat donc je ne suis pas tout à fait objectif
effectivement ton bidouillage de données ne tient pas la route. Tu crées une variabilité dont tu n'as aucune certitude. Donc c'est à proscrire absolument. Si tu n'as que 2 températures alors tu ne peux rien en faire. C'est vouloir faire passer une droite par deux points : c'est inévitable puisque c'est la base même d'une droite.
Tu ne peux introduire des valeurs dans un modèle que si il s'agit d'une variable.
Pour les types d'analyses I et III, je ne sais pas exactement à quoi ils font référence. Mais en tout cas se baser sur une p-value pour mesurer une quantité (celle de l'impact sur la variable à expliquer) me semble absolument foireux. La p-value n'est pas une valeur quantitative.
Mais bon il est vrai que je ne fais pas du tout confiance à xlsstat donc je ne suis pas tout à fait objectif
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Stat écologie --> ACP ou autre test ?
Bonjour,
Bon oui en effet, c'est foireux ce bidouillage.
J'ai à ma disposition les données températures et cie pour chaque jour de chaque mois de l'année 2009, donc j'ai la variabilité de la donnée.
MAIS j'ai collecté les plantes à deux dates précises, donc je me retrouve bloqué avec seulement deux jours à étudier.
OU alors, j'ai une idée : sans parler des résultats sur les plantes, est-il possible de réaliser une analyse stat qui me dirait que le mois de juin est significativement différent du mois de septembre en utilisant du coup toutes les données, récoltées chaque jour ??
une idée ?
merci
Bon oui en effet, c'est foireux ce bidouillage.
J'ai à ma disposition les données températures et cie pour chaque jour de chaque mois de l'année 2009, donc j'ai la variabilité de la donnée.
MAIS j'ai collecté les plantes à deux dates précises, donc je me retrouve bloqué avec seulement deux jours à étudier.
OU alors, j'ai une idée : sans parler des résultats sur les plantes, est-il possible de réaliser une analyse stat qui me dirait que le mois de juin est significativement différent du mois de septembre en utilisant du coup toutes les données, récoltées chaque jour ??
une idée ?
merci
-.Ln.-- Nombre de messages : 3
Date d'inscription : 16/06/2010
Sujets similaires
» Test du KHI 2 ou autre?
» Puissance d'un test stat
» test chi carré ou autre ?
» Problème test stat
» Choix d'un test stat
» Puissance d'un test stat
» test chi carré ou autre ?
» Problème test stat
» Choix d'un test stat
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|