Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Choix entre une distribution Normale et Log-Normale
2 participants
Page 1 sur 1
Choix entre une distribution Normale et Log-Normale
Bonjour,
J'ai fait des analyses un peu plus poussées sur la normalité de mes variables continues en fonction du test à appliquer derrière (en prenant en compte les paramètres de la normalité pour lesquels le test statistique est sensible afin d'analyser la normalité).
Après avoir fait cette analyse de normalité sur les résidus d'un modèle en prenant la variable brute et une autre analyse de normalité sur les résidus d'un modèle en prenant la variable logisée, j'ai estimé que certaines variables étaient normales et log-normales.
Ces variables sont en effet des données biologiques strictement positives.
J'essaie de peser le pour et le contre de chaque type de distribution.
La distribution normale :
- Adapté aux distributions symmétriques sans gros biais
- Permet d'avoir une analyse descriptive sur les données brutes
- N'est pas en théorie adapté aux données strictement positives
La distribution log-normale :
- Adapté à certaines distributions avec un skew positif
- Théoriquement adapté aux données strictement positives
- Implique une analyse descriptive sur les données logisées (en prenant la moyenne géométrique)
Le problème, c'est que je ne sais pas quel distribution choisir (entre normale et log-normale) lorsque les deux cas sont vérifiés.
Un expert statistique nous a dit qu'il fallait prendre toutes les variables biologiques en log-normal car les données biologiques ne peuvent être que positives mais ça ne me semble pas suffisant pour devoir faire le choix assez handicapant de prendre une distribution log-normale (qui sera analysée par des professionnels de la santé qui n'ont pas de formation statistique).
Petite appartée.
Concernant les tests, nous utilisons des ANOVAs à 1 facteur et 2 facteurs appariés sur le temps.
ANOVA1: variable numérique ~ traitement (+erreur)
ANOVA2: variable numérique ~ traitement + temps + interaction (+erreur)
Si je ne dis pas de bêtises, le modèle ANOVA1 n'est pas concernée par les modèles additifs et multiplicatifs.
Cependant l'ANOVA2 est concernée par ces deux modèles.
Si je ne compare que le cholestérol en fonction d'un groupe de traitement et du temps et que le cholesterol augmente au niveau du temps, le modèle multiplicatif est le plus adapté ?
S'il n'y a pas de lien avec le temps, le modèle additif est le plus adapté ?
Car dans la théorie, il est indiqué que la loi normale est adaptée aux modèles additifs et que la log-normale est adaptée aux modèles multiplicatifs.
Dans un tout autre ordre d'idée, quelqu'un connaîtrait-il des avantages ou inconvénients qui feraient qu'on penche plus vers une distribution qu'une autre ?
Je vous remerci d'avance.
ps : il me semble que les modèles additifs et multiplicatifs ne sont adaptés que pour les prises de traitement chroniques, ce n'est pas le cas dans mes analyses, il n'y a qu'une seule prise de traitement donc cet information n'est pas utile pour l'analyse de normalité au final
J'ai fait des analyses un peu plus poussées sur la normalité de mes variables continues en fonction du test à appliquer derrière (en prenant en compte les paramètres de la normalité pour lesquels le test statistique est sensible afin d'analyser la normalité).
Après avoir fait cette analyse de normalité sur les résidus d'un modèle en prenant la variable brute et une autre analyse de normalité sur les résidus d'un modèle en prenant la variable logisée, j'ai estimé que certaines variables étaient normales et log-normales.
Ces variables sont en effet des données biologiques strictement positives.
J'essaie de peser le pour et le contre de chaque type de distribution.
La distribution normale :
- Adapté aux distributions symmétriques sans gros biais
- Permet d'avoir une analyse descriptive sur les données brutes
- N'est pas en théorie adapté aux données strictement positives
La distribution log-normale :
- Adapté à certaines distributions avec un skew positif
- Théoriquement adapté aux données strictement positives
- Implique une analyse descriptive sur les données logisées (en prenant la moyenne géométrique)
Le problème, c'est que je ne sais pas quel distribution choisir (entre normale et log-normale) lorsque les deux cas sont vérifiés.
Un expert statistique nous a dit qu'il fallait prendre toutes les variables biologiques en log-normal car les données biologiques ne peuvent être que positives mais ça ne me semble pas suffisant pour devoir faire le choix assez handicapant de prendre une distribution log-normale (qui sera analysée par des professionnels de la santé qui n'ont pas de formation statistique).
Petite appartée.
Concernant les tests, nous utilisons des ANOVAs à 1 facteur et 2 facteurs appariés sur le temps.
ANOVA1: variable numérique ~ traitement (+erreur)
ANOVA2: variable numérique ~ traitement + temps + interaction (+erreur)
Si je ne dis pas de bêtises, le modèle ANOVA1 n'est pas concernée par les modèles additifs et multiplicatifs.
Cependant l'ANOVA2 est concernée par ces deux modèles.
Si je ne compare que le cholestérol en fonction d'un groupe de traitement et du temps et que le cholesterol augmente au niveau du temps, le modèle multiplicatif est le plus adapté ?
S'il n'y a pas de lien avec le temps, le modèle additif est le plus adapté ?
Car dans la théorie, il est indiqué que la loi normale est adaptée aux modèles additifs et que la log-normale est adaptée aux modèles multiplicatifs.
Dans un tout autre ordre d'idée, quelqu'un connaîtrait-il des avantages ou inconvénients qui feraient qu'on penche plus vers une distribution qu'une autre ?
Je vous remerci d'avance.
ps : il me semble que les modèles additifs et multiplicatifs ne sont adaptés que pour les prises de traitement chroniques, ce n'est pas le cas dans mes analyses, il n'y a qu'une seule prise de traitement donc cet information n'est pas utile pour l'analyse de normalité au final
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: Choix entre une distribution Normale et Log-Normale
Bonjour.
Si tu fais une analyse sur les résidus, à priori ils ne sont pas particulièrement positifs, donc la loi Normale ne pose pas de problème (si le modèle est correct, évidemment).
Cordialement.
Si tu fais une analyse sur les résidus, à priori ils ne sont pas particulièrement positifs, donc la loi Normale ne pose pas de problème (si le modèle est correct, évidemment).
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Choix entre une distribution Normale et Log-Normale
Ah mais oui en effet !
Merci pour ta réponse.
Merci pour ta réponse.
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Sujets similaires
» distribution normale et log-normale
» distribution loi normale
» image distribution normale
» Distribution asymptotique χ²/normale
» Pearson, ACP, distribution normale
» distribution loi normale
» image distribution normale
» Distribution asymptotique χ²/normale
» Pearson, ACP, distribution normale
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum