Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Théorie sur les tests
2 participants
Page 1 sur 1
Théorie sur les tests
Bonjour,
J'ai créé plein de variables numériques dans une centaine de centres.
Parmi celles-ci, il y a des variables Normales, des variables Log-Normales et des variables sans lois spécifiques.
Je calcule la moyenne de chaque variable numérique pour chaque centre.
Pour chaque variable numérique je calcule la moyenne globale de tous les centres, je compare ensuite la moyenne de chaque centre avec la moyenne globale.
Je fais donc un test pour voir si la variable numérique du centre est significativement différente de la moyenne globale.
Concernant les variables Normales, le test ne pose pas de problème car la variable est sensée être distribuée symétriquement autour de la moyenne.
Pour les variables Log-Normales, il me suffit de logiser (prendre le log) de la variable du centre et la comparer au log de la moyenne globale (On obtient donc le même cas de figure que le précédent).
Mais concernant les variables ne suivant pas de loi spécifique, je ne pense pas que ce test soit applicable, il peut y avoir énormément de dispersion qui ne seraient dûes que au hasard.
Est-ce que vous pensez que le test est quand même applicable aux variables sans loi spécifique ? (je ne crois pas)
Que préconiseriez-vous pour pouvoir appliquer ce test sur ce type de variable ?
Je vous remercie d'avance
J'ai créé plein de variables numériques dans une centaine de centres.
Parmi celles-ci, il y a des variables Normales, des variables Log-Normales et des variables sans lois spécifiques.
Je calcule la moyenne de chaque variable numérique pour chaque centre.
Pour chaque variable numérique je calcule la moyenne globale de tous les centres, je compare ensuite la moyenne de chaque centre avec la moyenne globale.
Je fais donc un test pour voir si la variable numérique du centre est significativement différente de la moyenne globale.
Concernant les variables Normales, le test ne pose pas de problème car la variable est sensée être distribuée symétriquement autour de la moyenne.
Pour les variables Log-Normales, il me suffit de logiser (prendre le log) de la variable du centre et la comparer au log de la moyenne globale (On obtient donc le même cas de figure que le précédent).
Mais concernant les variables ne suivant pas de loi spécifique, je ne pense pas que ce test soit applicable, il peut y avoir énormément de dispersion qui ne seraient dûes que au hasard.
Est-ce que vous pensez que le test est quand même applicable aux variables sans loi spécifique ? (je ne crois pas)
Que préconiseriez-vous pour pouvoir appliquer ce test sur ce type de variable ?
Je vous remercie d'avance
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: Théorie sur les tests
Mon hypothèse est que en cas de loi Normale / Log-Normale, on applique un Student dans tous les cas.
Par contre si je n'ai pas de loi spécifique mais un grand échantillon (>30), j'applique un TCL donc au final un Student tout de même.
Et enfin si je n 'ai pas de loi spécifique et un petit échantillon, je peux appliquer un Wilcoxon sauf que j'aimerais tout mettre sur un graphique multipliciste avec des bornes standardes qui seraient utilisées pour tester chaque moyenne de centre avec la moyenne globale.
D'où mon problème de savoir si je peux appliquer la même loi pour tous
Par contre si je n'ai pas de loi spécifique mais un grand échantillon (>30), j'applique un TCL donc au final un Student tout de même.
Et enfin si je n 'ai pas de loi spécifique et un petit échantillon, je peux appliquer un Wilcoxon sauf que j'aimerais tout mettre sur un graphique multipliciste avec des bornes standardes qui seraient utilisées pour tester chaque moyenne de centre avec la moyenne globale.
D'où mon problème de savoir si je peux appliquer la même loi pour tous
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: Théorie sur les tests
Au final, le test revient à dessiner les intervalles de confiance de la moyenne globale en fonction des effectifs.
IC = [ mean +/- Zalpha/2 * racine(var/n) ]
Comparer la moyenne d'une variable sans loi d'un centre à cet interval de confiance suffit-il à définir le centre d'outlier/pas outlier ?
IC = [ mean +/- Zalpha/2 * racine(var/n) ]
Comparer la moyenne d'une variable sans loi d'un centre à cet interval de confiance suffit-il à définir le centre d'outlier/pas outlier ?
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: Théorie sur les tests
zezima a écrit:
Concernant les variables Normales, le test ne pose pas de problème car la variable est sensée être distribuée symétriquement autour de la moyenne.
Pour les variables Log-Normales, il me suffit de logiser (prendre le log) de la variable du centre et la comparer au log de la moyenne globale (On obtient donc le même cas de figure que le précédent).
salut,
Pourquoi tu "logises"? ; même si les distributions suivent une loi log-normales, la moyenne suit une loi Normale (TCL). Et si tu fais un test sur les moyennes et que tu as plus de 30 individus, tu peux faire un test Z de différence de moyenne. Mais je ne pense pas que tu aies besoin de "logiser"?
De même pour les centres dont tu n'as a priori pas de loi. Si les centres suivent la même distribution, tu peux appliquer le TCL et faire un test de moyenne en approximant la distribution des moyennes par des lois normales.
Niaboc
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: Théorie sur les tests
Salut Niaboc,
Pour le coup j'ai fait des simulations et ce que tu dis sur la variable ne suivant pas de loi se vérifie, merci .
Cependant, j'ai simulé une variable log-normale et j'ai pris les valeurs brutes pour les comparer aux moyennes. Etant donné qu'une variable log-normale a quelques données très extrêmes, j'en avais qui sortaient significativement différents de la moyenne (ce n'est plus le cas lorsque je logise).
Les paramètres de la loi log-normale est que son log est similaire à une variable normale.
Pour le coup j'ai fait des simulations et ce que tu dis sur la variable ne suivant pas de loi se vérifie, merci .
Cependant, j'ai simulé une variable log-normale et j'ai pris les valeurs brutes pour les comparer aux moyennes. Etant donné qu'une variable log-normale a quelques données très extrêmes, j'en avais qui sortaient significativement différents de la moyenne (ce n'est plus le cas lorsque je logise).
Les paramètres de la loi log-normale est que son log est similaire à une variable normale.
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: Théorie sur les tests
zezima a écrit:Salut Niaboc,
Pour le coup j'ai fait des simulations et ce que tu dis sur la variable ne suivant pas de loi se vérifie, merci .
Cependant, j'ai simulé une variable log-normale et j'ai pris les valeurs brutes pour les comparer aux moyennes. Etant donné qu'une variable log-normale a quelques données très extrêmes, j'en avais qui sortaient significativement différents de la moyenne (ce n'est plus le cas lorsque je logise).
Les paramètres de la loi log-normale est que son log est similaire à une variable normale.
quand tu dis : "j'ai pris des valeurs brutes pour les comparer aux moyennes". Ca veut dire que tu ne compares pas des moyennes entre elles? mais des valeurs d'une distribution à la moyenne de cette dernière?
du coup tu ne fais pas :"je compare ensuite la moyenne de chaque centre avec la moyenne globale" à chaque fois?
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: Théorie sur les tests
Tu pourrais aussi utiliser la théorie des sondages.
Si je comprends bien tu veux vérifier que chacun centre est représentatif de la moyenne globale des centres. En utilise la TDS, le test adéquat est :
moyenne du centre - moyenne globale
T=-----------------------------------------------
racine[ (N-nk)/(n-1))*1/nk*V(globale)]
avec N l'effectif global et nk l'effectif de ton centre.
Niaboc
Si je comprends bien tu veux vérifier que chacun centre est représentatif de la moyenne globale des centres. En utilise la TDS, le test adéquat est :
moyenne du centre - moyenne globale
T=-----------------------------------------------
racine[ (N-nk)/(n-1))*1/nk*V(globale)]
avec N l'effectif global et nk l'effectif de ton centre.
Niaboc
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: Théorie sur les tests
niaboc a écrit:quand tu dis : "j'ai pris des valeurs brutes pour les comparer aux moyennes". Ca veut dire que tu ne compares pas des moyennes entre elles? mais des valeurs d'une distribution à la moyenne de cette dernière?
du coup tu ne fais pas :"je compare ensuite la moyenne de chaque centre avec la moyenne globale" à chaque fois?
Ah si tu as raison, en effet je simule une Loi log-normale qui est distribuée aléatoirement parmi les centres, ce qui fait que certains centres avec de petits effectifs peuvent se trouver avec des valeurs extrêmes de la loi (et c'est pour ça qu'ils sortent significatifs).
Je vais me pencher sur ta formule, merci
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Sujets similaires
» tirage avec remise ou sans remise - theorie
» Tests d'hypothèses
» tests
» les tests statistiques
» tests de fisher
» Tests d'hypothèses
» tests
» les tests statistiques
» tests de fisher
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum