Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
distribution normale et log-normale
2 participants
Page 1 sur 1
distribution normale et log-normale
Bonjours à toutes et à tous,
je suis en train d'étudier un échantillon de coquilles d'escargots (25 individus). Pour celà, je me base sur plusieurs mesures de la coquille, et plusieurs indices (=rapport entre deux mesures différentes sur une même coquille).
Exemples de mesures : diamètre maximum de la coquille, rayon maximum de la coquille, hauteur du tour, etc.
Exemples d'indices : rapport entre diamètre maxi et hauteur du tour maxi, etc.
Je voudrais connaitre la distribution de chacune de ces mesures et indices dans mon échantillon à l'aide d'histogrammes de fréquence, pour voir s'il y a une ou plusieurs morphologies de coquille au sein de cet échantillon (= pour voir s'il y a une ou plusieurs espèces).
J'ai donc fait des histogrammes avec les valeurs "réelles" des mesures et indices : les résultats sont peu significatifs. La distribution est souvent très asymétrique pour certains paramètres, à tendance binomale pour d'autres, "homogène" (pas vraiment de pic de fréquence) pour d'autres encore. Je ne peux donc rien conclure....
J'ai vu qu'on pouvait aussi utiliser les valeurs log-transformées des mesures et indices pour faire ces histogrammes. Et du coup, avec les valeurs des paramètres log transformées, j'obtiens des distributions globalement normales.
Est ce que dans ce cas il est judicieux d'utiliser des paramètre log transformés? Et si c'est le cas, comme leur distribution est log-normale, on peut dire qu'il n'y a qu'une seule espèce?
Merci d'avance pour vos réponses!
je suis en train d'étudier un échantillon de coquilles d'escargots (25 individus). Pour celà, je me base sur plusieurs mesures de la coquille, et plusieurs indices (=rapport entre deux mesures différentes sur une même coquille).
Exemples de mesures : diamètre maximum de la coquille, rayon maximum de la coquille, hauteur du tour, etc.
Exemples d'indices : rapport entre diamètre maxi et hauteur du tour maxi, etc.
Je voudrais connaitre la distribution de chacune de ces mesures et indices dans mon échantillon à l'aide d'histogrammes de fréquence, pour voir s'il y a une ou plusieurs morphologies de coquille au sein de cet échantillon (= pour voir s'il y a une ou plusieurs espèces).
J'ai donc fait des histogrammes avec les valeurs "réelles" des mesures et indices : les résultats sont peu significatifs. La distribution est souvent très asymétrique pour certains paramètres, à tendance binomale pour d'autres, "homogène" (pas vraiment de pic de fréquence) pour d'autres encore. Je ne peux donc rien conclure....
J'ai vu qu'on pouvait aussi utiliser les valeurs log-transformées des mesures et indices pour faire ces histogrammes. Et du coup, avec les valeurs des paramètres log transformées, j'obtiens des distributions globalement normales.
Est ce que dans ce cas il est judicieux d'utiliser des paramètre log transformés? Et si c'est le cas, comme leur distribution est log-normale, on peut dire qu'il n'y a qu'une seule espèce?
Merci d'avance pour vos réponses!
gasteroman- Nombre de messages : 20
Date d'inscription : 30/07/2011
Re: distribution normale et log-normale
Je détaillerai plus tard si besoin...
Faire une ACP double centrée sur les données log-transformées. Cela donnera une distribtuion des morphologies en prenant en compte tous les paramètres morpho. C'est beaucoup plus puissant que les visions univariées et ça permet des suites intéressantes (rotations procustes etc....)
Nik
Faire une ACP double centrée sur les données log-transformées. Cela donnera une distribtuion des morphologies en prenant en compte tous les paramètres morpho. C'est beaucoup plus puissant que les visions univariées et ça permet des suites intéressantes (rotations procustes etc....)
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: distribution normale et log-normale
Merci pour cette réponse super rapide
Mais c'est quoi une ACP double centrée? C'est une ACP dont on n'utilise que les deux premières composantes principales?
Si c'est le cas, sur la base de cette ACP, sur quels arguments peut on dire que l'échantillon est homogène ou pas?
Mais c'est quoi une ACP double centrée? C'est une ACP dont on n'utilise que les deux premières composantes principales?
Si c'est le cas, sur la base de cette ACP, sur quels arguments peut on dire que l'échantillon est homogène ou pas?
gasteroman- Nombre de messages : 20
Date d'inscription : 30/07/2011
Re: distribution normale et log-normale
Salut,
C'est une ACP centrée en colonne et en ligne. Une recherche google te donneras vite des éléments de réponse. C'est une technique très classique en analyse morphologique. ça élimine l'effet taille et ça met en évidence les éventuelles différences morpho.
Il n'y a pas de test à proprement parlé. Il faut juger de l'interprétabilité des éventuelles groupes.
nik
C'est une ACP centrée en colonne et en ligne. Une recherche google te donneras vite des éléments de réponse. C'est une technique très classique en analyse morphologique. ça élimine l'effet taille et ça met en évidence les éventuelles différences morpho.
Il n'y a pas de test à proprement parlé. Il faut juger de l'interprétabilité des éventuelles groupes.
nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: distribution normale et log-normale
Nik a écrit:
C'est une ACP centrée en colonne et en ligne.
OK, je crois avoir trouvé. Un double centrage modifie les valeurs de chaque ligne et colonne de telle manière que leur valeur moyenne soit égale à 0. En pratique, pour celà, il faut soustraire à chaque valeur d'une colonne ou d'une ligne la valeur de la moyenne de cette ligne ou colonne.
Donc je log-transforme les valeurs des différentes variables, puis je double centre ces valeurs log-transformées, puis je fais une ACP, c'est bien ça?
Et sinon, concrètement, le double centrage, ça sert à quoi? A éliminer un effet de taille? A autre chose?
Nik a écrit:
Il n'y a pas de test à proprement parlé. Il faut juger de l'interprétabilité des éventuelles groupes.
Il faut que je juge "à l'oeuil" la dispersion des points dans le diagramme bivarié représentant les deux plus importantes composantes principales (CP), c'est bien ça?
J'ai lu un travail où les auteurs ont utilisé des histogrammes de fréquence des valeurs des projections des points sur les 2 plus importantes CP pour évaluer la dispersion des points (Dommergues et al., 2006). Ils avaient transformé les valeurs de base de manière différente, en utilisant une analyse de Fourier.
gasteroman- Nombre de messages : 20
Date d'inscription : 30/07/2011
Re: distribution normale et log-normale
Euh, encore une question....
Dans ce cas, quels est l'intérêt de log transformer les données?
A ce que j'ai compris, la log transformation permet de normaliser la distribution d'un échantillon, pour pouvoir y effectuer des tests paramétriques.
Lorsqu'on veut connaitre la distribution d'un échantillon, quel est donc l'intéret de log transformer ses variables (qui, du coup, auront bien plus de chances d'avoir une distribution normale)?
Dans ce cas, quels est l'intérêt de log transformer les données?
A ce que j'ai compris, la log transformation permet de normaliser la distribution d'un échantillon, pour pouvoir y effectuer des tests paramétriques.
Lorsqu'on veut connaitre la distribution d'un échantillon, quel est donc l'intéret de log transformer ses variables (qui, du coup, auront bien plus de chances d'avoir une distribution normale)?
gasteroman- Nombre de messages : 20
Date d'inscription : 30/07/2011
Re: distribution normale et log-normale
Les ACP suivent l'algèbre linéaire et normalement n'échappent pas aux prérequis ce qui inclus une distribution la plus proche possible d'une loi normale afin de pouvoir livrer des interprétations réellement soutenues par les données. D'où l'utilisation d'une transformation log pour réduire l'hétéroscédasticité.Dans ce cas, quels est l'intérêt de log transformer les données?
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: distribution normale et log-normale
Merci beaucoup de t'intéresser à mon problème, Nik
OK, donc il faut normaliser les données pour faire une ACP. Mais à ce moment là, la dispersion des points suit par conséquence une loi normale (au moins leurs coordonnées sur les 2 premières CP)? Autrement dit, en normalisant les données (par une log transfo), on obtient forcément une dispersion "normale" des points lors d'une ACP?
Ma base de données est organisé de cette manière : variables (diamètre, hauteur de tour, etc.) dans les colonnes, individus dans les lignes.
J'ai fait une ACP avec un centrage uniquement des colonnes : j'obtiens des résultats très cohérents : distribution assez homogène des points, distribution normale des projections des points sur les 2 premières CP, directions des vecteurs "variables" cohérentes les unes par rapport aux autres (=cohérentes avec ce que l'on observe concernant la forme des coquilles).
J'ai ensuite fait une autre ACP avec centrage des lignes et colonnes, et là, j'obtiens des résultats très incohérents avec les observations....
Si je comprend bien l'intéret du centrage des colonnes dans mon cas(enfin, je crois...), quel est celui du centrage des lignes ?
OK, donc il faut normaliser les données pour faire une ACP. Mais à ce moment là, la dispersion des points suit par conséquence une loi normale (au moins leurs coordonnées sur les 2 premières CP)? Autrement dit, en normalisant les données (par une log transfo), on obtient forcément une dispersion "normale" des points lors d'une ACP?
Ma base de données est organisé de cette manière : variables (diamètre, hauteur de tour, etc.) dans les colonnes, individus dans les lignes.
J'ai fait une ACP avec un centrage uniquement des colonnes : j'obtiens des résultats très cohérents : distribution assez homogène des points, distribution normale des projections des points sur les 2 premières CP, directions des vecteurs "variables" cohérentes les unes par rapport aux autres (=cohérentes avec ce que l'on observe concernant la forme des coquilles).
J'ai ensuite fait une autre ACP avec centrage des lignes et colonnes, et là, j'obtiens des résultats très incohérents avec les observations....
Si je comprend bien l'intéret du centrage des colonnes dans mon cas(enfin, je crois...), quel est celui du centrage des lignes ?
gasteroman- Nombre de messages : 20
Date d'inscription : 30/07/2011
Re: distribution normale et log-normale
?Si je comprend bien l'intéret du centrage des colonnes dans mon cas(enfin, je crois...), quel est celui du centrage des lignes
Tu élimines la composante taille de chaque individu pour pouvoir comparer les variables de la même manière qu'avec le centrage en colonne tu élimine l'effet taille inter-individuel.
Il n'est pas étonnant de trouver une explication plus facile sans éliminer l'effet taille car tout simplement tu as souvent une ordination selon la taille des individus. A voir dans ton cas...
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: distribution normale et log-normale
Merci Nik, pour cette réponse, c'est plus clair maintenant!
gasteroman- Nombre de messages : 20
Date d'inscription : 30/07/2011
Sujets similaires
» Choix entre une distribution Normale et Log-Normale
» distribution loi normale
» Distribution asymptotique χ²/normale
» Pearson, ACP, distribution normale
» distribution log normale inversée?
» distribution loi normale
» Distribution asymptotique χ²/normale
» Pearson, ACP, distribution normale
» distribution log normale inversée?
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum