Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Comparaison d'une distribution à une "pseudo-théorique"
3 participants
Page 1 sur 1
Comparaison d'une distribution à une "pseudo-théorique"
Bonjour,
J'ai une variable quantitative continue qui représente une distance.
Dans mon problème j'obtiens une certaine distribution des valeurs de cette variable.
Je souhaite comparer cette distribution à une autre distribution obtenue par tirage aléatoire du même nombre de valeurs. (je vous passe les détails du tirage aléatoire et des valeurs d'origines utilisées pour cela)
Dans un premier temps, j'ai utilisé le test de Kolmogorov-smirnov pour comparer mes deux distributions ainsi observées.
Seulement il me parait plus robuste de créer au moins 10 distributions issues de tirages aléatoires.
Dans ce cas, vaut-il mieux faire 10 tests de Kolmogorov-smirnov entre ma distribution de départ et chacune des distributions aléatoires, et si oui comment conclure si tous les résultats ne sont pas significatifs ?
OU vaut-il mieux prendre mes 10 tirages aléatoires et les cumuler dans une seule et même distribution , pour ainsi créer une pseudo distribution théorique aléatoire ? Est-ce correct statistiquement de procéder ainsi ? et surtout, dans ce cas j'aurais dix fois plus de valeurs dans ma distribution pseudo-théorique, est-ce tout de même possible et juste d'effectuer un test de Kolmogorov-Smirnov de distributions de tailles si différentes?
D'avance merci.
J'ai une variable quantitative continue qui représente une distance.
Dans mon problème j'obtiens une certaine distribution des valeurs de cette variable.
Je souhaite comparer cette distribution à une autre distribution obtenue par tirage aléatoire du même nombre de valeurs. (je vous passe les détails du tirage aléatoire et des valeurs d'origines utilisées pour cela)
Dans un premier temps, j'ai utilisé le test de Kolmogorov-smirnov pour comparer mes deux distributions ainsi observées.
Seulement il me parait plus robuste de créer au moins 10 distributions issues de tirages aléatoires.
Dans ce cas, vaut-il mieux faire 10 tests de Kolmogorov-smirnov entre ma distribution de départ et chacune des distributions aléatoires, et si oui comment conclure si tous les résultats ne sont pas significatifs ?
OU vaut-il mieux prendre mes 10 tirages aléatoires et les cumuler dans une seule et même distribution , pour ainsi créer une pseudo distribution théorique aléatoire ? Est-ce correct statistiquement de procéder ainsi ? et surtout, dans ce cas j'aurais dix fois plus de valeurs dans ma distribution pseudo-théorique, est-ce tout de même possible et juste d'effectuer un test de Kolmogorov-Smirnov de distributions de tailles si différentes?
D'avance merci.
juliech- Nombre de messages : 3
Date d'inscription : 24/05/2013
Re: Comparaison d'une distribution à une "pseudo-théorique"
Bonsoir.
Dans KS, on ne compare pas deux échantillons, mais un échantillon à une loi de répartition connue. Si tu fabriques ta fonction de répartition avec un échantillon, plus ton échantillon sera de grande taille, meilleure sera la précision. Donc tu as intérêt à utiliser un grand nombre de valeurs obtenues par simulation (en 10 groupes ou en un seul, ça ne change rien).
Par contre, si tu fais 10 tests avec à chaque fois le risque 5% de rejeter alors que c'est bon, tu n'as que 2 chances sur 3 environ de ne jamais rejeter, alors même que c'est une erreur ! Et que feras-tu avec 8 tests acceptation et deux rejets ?
Cordialement.
Dans KS, on ne compare pas deux échantillons, mais un échantillon à une loi de répartition connue. Si tu fabriques ta fonction de répartition avec un échantillon, plus ton échantillon sera de grande taille, meilleure sera la précision. Donc tu as intérêt à utiliser un grand nombre de valeurs obtenues par simulation (en 10 groupes ou en un seul, ça ne change rien).
Par contre, si tu fais 10 tests avec à chaque fois le risque 5% de rejeter alors que c'est bon, tu n'as que 2 chances sur 3 environ de ne jamais rejeter, alors même que c'est une erreur ! Et que feras-tu avec 8 tests acceptation et deux rejets ?
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Comparaison d'une distribution à une "pseudo-théorique"
Ce n'est pas tout à fait exact, la version de base dont le nom est le test de Kolmogorov (1933) se limite à comparer un échantillon à une loi de distribution normale (quoi que vue la formule on pourrait facilement étendre à n'importe quel loi de distribution) alors que le test que l'on connait sous Kolmogorov-Smirnov (1939) est une extension du premier par Smirnov qui permet de comparer les distributions de deux échantillons.Dans KS, on ne compare pas deux échantillons, mais un échantillon à une loi de répartition connue.
Re: Comparaison d'une distribution à une "pseudo-théorique"
Merci pour vos réponses.
Je vais donc tenter un test Kolmogorov-Smirnov sur mon échantillon versus une cumulation de 10 groupes en un seul, ça ne me fera qu'un seul test à analyser.
Mais j'ai une autre question concernant mes données et ce test. Disons qu'en réalité j'ai une population de 30 000 valeurs. Et que mon échantillon de départ est une sous-fraction de 2000 valeurs non aléatoire de cette population.
Au départ je vous avez posé cette question car je pensais prendre en comparaison 10 tirages aléatoires, chacun de 2000 valeurs et les comparer à ma sous-fraction avec le KS.
Mais en réalité, je me demande si c'est juste de faire ça. Ou si je ne dois pas faire directement mon test KS entre ma sous-fraction et ma population. Et dans ce cas, est-ce que je conserve dans la population de départ ma sous-fraction pour le test ou est-ce que je la retire.
Pour mieux comprendre, ma question est : est-ce que ma sous-fraction suit la même loi que l'ensemble de la population ou non ?
Merci encore pour vos précédentes réponses.
Je vais donc tenter un test Kolmogorov-Smirnov sur mon échantillon versus une cumulation de 10 groupes en un seul, ça ne me fera qu'un seul test à analyser.
Mais j'ai une autre question concernant mes données et ce test. Disons qu'en réalité j'ai une population de 30 000 valeurs. Et que mon échantillon de départ est une sous-fraction de 2000 valeurs non aléatoire de cette population.
Au départ je vous avez posé cette question car je pensais prendre en comparaison 10 tirages aléatoires, chacun de 2000 valeurs et les comparer à ma sous-fraction avec le KS.
Mais en réalité, je me demande si c'est juste de faire ça. Ou si je ne dois pas faire directement mon test KS entre ma sous-fraction et ma population. Et dans ce cas, est-ce que je conserve dans la population de départ ma sous-fraction pour le test ou est-ce que je la retire.
Pour mieux comprendre, ma question est : est-ce que ma sous-fraction suit la même loi que l'ensemble de la population ou non ?
Merci encore pour vos précédentes réponses.
juliech- Nombre de messages : 3
Date d'inscription : 24/05/2013
Re: Comparaison d'une distribution à une "pseudo-théorique"
Bonjour.
En réponse à Joyeux lapin 13 (amicalement !) je pensais au KS général de comparaison à une distribution, pas à celui dédié à la normalité. Ni à la comparaison de deux échantillons de variables continues (que je ne connais pas).
Pour Juliech : Il n'y a aucune possibilité de répondre à ta question, vu que tu dis "mon échantillon de départ est une sous-fraction de 2000 valeurs non aléatoire de cette population". Le caractère non aléatoire induit un biais que tu es le seul à pouvoir apprécier (je dis bien "apprécier", pas mesurer).
Cordialement.
En réponse à Joyeux lapin 13 (amicalement !) je pensais au KS général de comparaison à une distribution, pas à celui dédié à la normalité. Ni à la comparaison de deux échantillons de variables continues (que je ne connais pas).
Pour Juliech : Il n'y a aucune possibilité de répondre à ta question, vu que tu dis "mon échantillon de départ est une sous-fraction de 2000 valeurs non aléatoire de cette population". Le caractère non aléatoire induit un biais que tu es le seul à pouvoir apprécier (je dis bien "apprécier", pas mesurer).
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Comparaison d'une distribution à une "pseudo-théorique"
Ok, merci.
Ca répond à toutes mes questions
Ca répond à toutes mes questions
juliech- Nombre de messages : 3
Date d'inscription : 24/05/2013
Sujets similaires
» Comparaison d'une moyenne observée à une valeur théorique
» Comparaison moyenne théorique et moyenne expériementale
» Test du khi carré, recherche de l'effectif théorique
» Comment choisir le risque d'erreur pour le Chi2 théorique
» Question sur la moyenne théorique
» Comparaison moyenne théorique et moyenne expériementale
» Test du khi carré, recherche de l'effectif théorique
» Comment choisir le risque d'erreur pour le Chi2 théorique
» Question sur la moyenne théorique
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum