Les posteurs les plus actifs de la semaine


Comparaison de deux populations de taille différente

Aller en bas

Comparaison de deux populations de taille différente

Message par MathildeL le Lun 15 Déc 2014 - 17:10

Bonjour,

Je travaille actuellement sur des données cliniques issues de deux régions que j'appellerai ici R1 et R2.
Les données patients issues de R1 sont 4 fois moins nombreuses que celles issues de R2.
Je dispose de diverses variables (continues, discrètes) et je souhaite mettre en exergue les variables déterminant la réalisation d'un évènement. Pour ce faire je vais réaliser des analyses de survie.
Je pense faire mon étude en deux temps. D'une part, faire l'étude pour chaque sous population (R1 et R2) et d'autre part faire l'étude au global.
Pour l'étude globale, je pense qu'il faudrait prendre en compte la différence de taille entre mes deux populations. L'étude risque sinon d'être moins représentative pour la population issue de R1.
J'ai pensé à extraire un échantillon aléatoire de R2 de la même taille que celui de R1 ou encore à attribuer un poids de 0.25 aux données de R2.
Que pensez-vous de ces solutions ?
Avez-vous d'autres propositions ?

J'espère avoir été claire.
Bien cordialement,

MathildeL

Nombre de messages : 3
Date d'inscription : 15/12/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux populations de taille différente

Message par gg le Lun 15 Déc 2014 - 17:28

Bonjour.

Si tu as des populations, la population globale est bien constituée de tous les individus des deux populations (sauf doublon). Donc si tu veux parler de R1+R2, le fait qu'il y a 4 fois plus de cas dans R1 ne change rien à l'ensemble R1 union R2.

Par contre, si tu as des parties de la vraie population, tout dépend de comment elles ont été obtenues.

Cordialement.

gg

Nombre de messages : 2016
Date d'inscription : 10/01/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux populations de taille différente

Message par MathildeL le Lun 15 Déc 2014 - 22:36

Bonsoir,

Merci pour votre retour.

Vous dites que le fait qu'il y ait 4 fois plus de cas dans R2 ne change rien. Si la population de R2 a des spécificités, l'étude globale va faire ressortir ces spécificités puisque R2 est majoritairement représentée. N'est ce pas ?
C'était en ce sens que je proposais de prendre un échantillon de R2 de la taille de R1 pour faire une population globale ou d'accorder un poids aux patients de R2.

Cdt,

MathildeL

Nombre de messages : 3
Date d'inscription : 15/12/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux populations de taille différente

Message par gg le Mar 16 Déc 2014 - 9:27

Quand tu veux calculer ta moyenne et que tu as 4 fois plus de 20 que de 2, tu ne comptes pas les 2 chacun 4 fois, non ?

Si ce sont les populations, tu ne peux pas changer la réalité : R1 ne représente que 1/5 de l'ensemble.
Si ce sont bien les populations.

gg

Nombre de messages : 2016
Date d'inscription : 10/01/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux populations de taille différente

Message par MathildeL le Mar 16 Déc 2014 - 9:35

Oui, bien sur.
Alors, j'ai mal utilisé le terme population peut-être.
En réalité, il n'y a pas de raison que R1 ne représente que 1/5 de l'ensemble.

MathildeL

Nombre de messages : 3
Date d'inscription : 15/12/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux populations de taille différente

Message par gg le Mar 16 Déc 2014 - 10:03

Alors il est difficile de savoir quoi faire de l'ensemble de tes données. En tout cas, tant que tu restes dans le flou sur ce qu'elles sont vraiment : Population totale, échantillon, parties de la population définies de telle ou telle façon, données récoltées comme on peut, ...

On ne fait pas des statistiques sans connaître vraiment la population, les données collectées et comment elles ont été collectées. Si la collecte est mal faite, on ne peut plus faire quoi que ce soit de sérieux.

En tout cas, pour l'instant, aucun conseil ne peut être donné.

Cordialement.

gg

Nombre de messages : 2016
Date d'inscription : 10/01/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux populations de taille différente

Message par MathildeL le Mar 16 Déc 2014 - 10:20

Bien. En tout cas, merci pour le temps passé sur le sujet.
Cordialement,

MathildeL

Nombre de messages : 3
Date d'inscription : 15/12/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux populations de taille différente

Message par c@ssoulet le Mar 16 Déc 2014 - 10:39

En pratique, je suppose que tu vas tracer tes 2 courbes de kaplan meier puis les comparer avec un test du logrank ou un truc dans le genre. Je ne vois pas trop ou est le problème au niveau de l'effectif déséquilibré. Si tu compares les décès entre un échantillon Français et un échantillon Suisse, l'échantillon suisse sera plus petit. Et tu ne vas pas pondérer la suisse afin de faire "comme si" la Suisse avait 65 millions d'habitants. C'est pareil pour tes régions

Par contre il faudra faire attention à ce que l'échantillon suisse soit sélectionné avec une méthode strictement identique à l'échantillon Français, afin qu'il n'y ait pas de "biais de sélection". Donc pour tes régions, le seul problème à mon sens est plutôt méthodo: les deux échantillons reflètent-ils réellement les populations de chaque région. En d'autres termes, y a t il un risque de biais de sélection ? Si non, décris ce que tu vois et compare tes données sans les tripoter.

c@ssoulet

Nombre de messages : 827
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux populations de taille différente

Message par jeremyJ le Mar 16 Déc 2014 - 10:52

Bonjour,

d'une manière générale, avant de faire n'importe qu'elle analyse multivarié, ou une analyse "poussé", il est toujours intéressant (pour ne pas dire impératif) de regarder les données brutes avec les indicateurs de base (quantile, moyenne, écart-type..), et de les visualiser à l'aide d'une boite à moustache ou d'un histogramme par exemple Smile

Cdt

jeremyJ

Nombre de messages : 78
Date d'inscription : 09/09/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux populations de taille différente

Message par MathildeL le Mer 17 Déc 2014 - 8:54

C@ssoulet,

Merci de ta réponse.

Si on reprends l'exemple de la suisse et de la France. L'étude serait de voir quelles sont les variables qui déterminent la réalisation de l'évènement (dans cette exemple le décès).  Les experts s'attendent à ce que ces déterminants ne soient pas les mêmes en Suisse et en France. Je me suis dit que les spécificités France "absorberaient" celle de la Suisse mais je me suis perdue.
Soit je veux une étude globale et dans ce cas, il me faut garder mon échantillon France et Suisse tel que, soit je fais deux études parallèles. L'effet région sur les déterminants s'étudiera via un autre type d'analyse.

Bref, je vais faire mes études séparées dans un premier temps en tout cas. Les analyses descriptives indiquent assez peu de différence entre les deux régions, il se peut que l'étude conclut à des déterminants similaires dans R1 et dans R2.

(@JeremyJ : oui bien d'accord "impératif", c'était déjà en cours mais merci du conseil Wink )  

Merci pour vos réponses.
Cordialement,

MathildeL

Nombre de messages : 3
Date d'inscription : 15/12/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux populations de taille différente

Message par c@ssoulet le Mer 17 Déc 2014 - 11:19

Le biais de sélection c'est pas ca.

Voilà un biais de sélection caricatural: Tous les patients Français ont été recrutés dans des services spécialisés de CHU et tous les patients suisses en médecine générale de ville. Dans cette situation, il est impossible de comparer les deux pays car tu ne sauras jamais si les différences mises en évidence sont imputables à une "vraie" différence entre les deux pays ou tout simplement au profil clinique des patients à l'inclusion, forcément différent.

Il faut donc dans un premier temps bien décrire les modalités de recrutement de chaque région. Puis décrire les deux populations et rechercher des différences entre elles sur les variables cliniques pertinentes (age, sex ratio, age au diagnostic ... etc ...). Si les modalités de recrut et les deux populations sont similaires, alors tu en conclus que tu vas pouvoir comparer les deux régions entre elles. Sinon, chaque région devra etre analysée séparément.

Si recrut, population et survie sont similaires, alors tu peux probablement pooler tes deux populations pour faire une analyse des déterminants. Ca passera certainement par un modèle de régression pour données censurées, type modèle de cox, dans lequel tu introduiras quelques déterminants et éventuellement la région si tu l'estimes utile et justifié. Le fait d'avoir des effectifs plus faibles dans une région n'est pas un problème en soi: ca limitera juste la puissance de l'analyse lorsque l'effet région sera introduit

c@ssoulet

Nombre de messages : 827
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux populations de taille différente

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum