Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Stats et significativité de tirages
2 participants
Page 1 sur 1
Stats et significativité de tirages
Bonjour/bonsoir
J'ai un problème que je ne sais pas résoudre. Le voici.
Il s'agit de 75 expériences biologiques indépendantes. Chaque expérience, je dirais, est l'équivalent d'un tirage sans remise de Ni boules dans une urne contenant N=20000 boules, dont Mi boules blanches et (N-Mi) boules noires.
Pour chaque expérience, les nombres Ni et Mi sont variables et connus.
Je voudrais montrer que globalement, sur l'ensemble des boules tirées pour les 75 expériences, j'ai tiré un nombre de boules blanches significativement différent (plus important) de celui que j'aurais tiré si la probabilité de tirer les boules blanches était identique à la probabilité de tirer les boules noires.
Comment faire?
Merci pour votre aide,
Gazou
J'ai un problème que je ne sais pas résoudre. Le voici.
Il s'agit de 75 expériences biologiques indépendantes. Chaque expérience, je dirais, est l'équivalent d'un tirage sans remise de Ni boules dans une urne contenant N=20000 boules, dont Mi boules blanches et (N-Mi) boules noires.
Pour chaque expérience, les nombres Ni et Mi sont variables et connus.
Je voudrais montrer que globalement, sur l'ensemble des boules tirées pour les 75 expériences, j'ai tiré un nombre de boules blanches significativement différent (plus important) de celui que j'aurais tiré si la probabilité de tirer les boules blanches était identique à la probabilité de tirer les boules noires.
Comment faire?
Merci pour votre aide,
Gazou
gazou2012- Nombre de messages : 4
Date d'inscription : 03/01/2012
Re: Stats et significativité de tirages
Bonjour.
C'est assez bizarre : Tu as tous les éléments pour répondre à ta question de façon concrète (tu as les probabilités Mi/N de chaque expérience) et tu cherches une validation statistique forcément aléatoire.
Plus précisément, ta question :
Mais je ne comprends pas pourquoi tu te poses ce genre de question.
Cordialement.
C'est assez bizarre : Tu as tous les éléments pour répondre à ta question de façon concrète (tu as les probabilités Mi/N de chaque expérience) et tu cherches une validation statistique forcément aléatoire.
Plus précisément, ta question :
se traite par le test de comparaison de moyennes (test de Student : comparaison à une moyenne connue) qui te donnera éventuellement la réponse oui avec un certain risque de se tromper.Je voudrais montrer que globalement, sur l'ensemble des boules tirées pour les 75 expériences, j'ai tiré un nombre de boules blanches significativement différent (plus important) de celui que j'aurais tiré si la probabilité de tirer les boules blanches était identique à la probabilité de tirer les boules noires.
Mais je ne comprends pas pourquoi tu te poses ce genre de question.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Précisions
Bonjour gg.
Merci pour ton message.
Peut être devrais-je décrire plus concrètement mes expériences car mes histoires de boules et tirage ne reflètent peut etre pas ma situation?? Voila :
En fait je m'intéresse à des protéines humaines. Il existe 20000(N) protéines humaines (pour simplifier...).
Chaque protéine est décrite pour participer (ou pas) à un ou plusieurs processus biologique (qq exemples de processus : régulation de la mort cellulaire, système immunitaire, locomotion, etc). Quand on prend une protéine et qu'on regarde les processus dans lesquels elle est impliquée, on peut connaître le nombre total de protéines (sur les 19999 autres) qui partagent ce ou ces processus avec la protéine d'intérêt.
Je me suis intéressée à 75 protéines particulières (Pi). Pour chacune de ces 75 protéines, je sais avec combien des 19999 autres elles partagent un processus biologique (ce nombre=Mi).
Ensuite pour chaque Pi, j'ai réalisé une expérience pour identifier des protéines avec lesquelles Pi interagit physiquement. Pour chaque Pi, j'ai trouvé un nombre Ni de partenaire.
Si pour toute Pi, le fait d'interagir physiquement avec une protéine est indépendant du fait de partager un processus biologique avec cette protéine, alors je m'attend en moyenne à trouver parmi les Ni, (Ni x Mi / 19999) protéines qui partagent un processus avec Pi.
Je veux montrer que dans mon cas (sur l'ensemble des 75 expériences), j'ai un enrichissement statistiquement significatif en paires de protéines qui interagissent ET qui partagent un même processus.
Est-ce que c'est plus clair :-)
Gazou
Merci pour ton message.
Peut être devrais-je décrire plus concrètement mes expériences car mes histoires de boules et tirage ne reflètent peut etre pas ma situation?? Voila :
En fait je m'intéresse à des protéines humaines. Il existe 20000(N) protéines humaines (pour simplifier...).
Chaque protéine est décrite pour participer (ou pas) à un ou plusieurs processus biologique (qq exemples de processus : régulation de la mort cellulaire, système immunitaire, locomotion, etc). Quand on prend une protéine et qu'on regarde les processus dans lesquels elle est impliquée, on peut connaître le nombre total de protéines (sur les 19999 autres) qui partagent ce ou ces processus avec la protéine d'intérêt.
Je me suis intéressée à 75 protéines particulières (Pi). Pour chacune de ces 75 protéines, je sais avec combien des 19999 autres elles partagent un processus biologique (ce nombre=Mi).
Ensuite pour chaque Pi, j'ai réalisé une expérience pour identifier des protéines avec lesquelles Pi interagit physiquement. Pour chaque Pi, j'ai trouvé un nombre Ni de partenaire.
Si pour toute Pi, le fait d'interagir physiquement avec une protéine est indépendant du fait de partager un processus biologique avec cette protéine, alors je m'attend en moyenne à trouver parmi les Ni, (Ni x Mi / 19999) protéines qui partagent un processus avec Pi.
Je veux montrer que dans mon cas (sur l'ensemble des 75 expériences), j'ai un enrichissement statistiquement significatif en paires de protéines qui interagissent ET qui partagent un même processus.
Est-ce que c'est plus clair :-)
Gazou
gazou2012- Nombre de messages : 4
Date d'inscription : 03/01/2012
Re: Stats et significativité de tirages
Ok.
Alors ta première explication était très confuse sur la fin, car elle semblait parler d'équiprobabilité entre blanches et noires, alors que c'est le tirage de chaque boule qui ne dépend pas de la couleur.
A priori, ici, un test du Khi-deux (comparer les valeurs trouvées aux valeurs modèles calculées par (Ni x Mi / 19999) ) devrait pouvoir se faire. mais avec des tailles d'échantillon aussi grandes, ce test est assez systématiquement significatif. Je ne suis pas spécialiste de ce genre de situation. Espérons que Nik, qui est plus au courant des stats en biologie verra ton message (tu peux éventuellement lui envoyer un message privé).
Cordialement.
Alors ta première explication était très confuse sur la fin, car elle semblait parler d'équiprobabilité entre blanches et noires, alors que c'est le tirage de chaque boule qui ne dépend pas de la couleur.
A priori, ici, un test du Khi-deux (comparer les valeurs trouvées aux valeurs modèles calculées par (Ni x Mi / 19999) ) devrait pouvoir se faire. mais avec des tailles d'échantillon aussi grandes, ce test est assez systématiquement significatif. Je ne suis pas spécialiste de ce genre de situation. Espérons que Nik, qui est plus au courant des stats en biologie verra ton message (tu peux éventuellement lui envoyer un message privé).
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Stats et significativité de tirages
Encore merci gg pour ton aide...
Mes valeurs de Mi et Ni sont assez variables. Elles varient grosso modo entre 50 et 10000 pour les Mi. Mes Ni sont compris entre 1 et 100 et par conséquent, le nombre de protéines qui partagent un même processus avec une Pi donnée varie entre 0 et 40 (et j'ai pas mal de zéro en réalité!).
Mais OK pour le Chi-2, je vais essayer.
Mes valeurs de Mi et Ni sont assez variables. Elles varient grosso modo entre 50 et 10000 pour les Mi. Mes Ni sont compris entre 1 et 100 et par conséquent, le nombre de protéines qui partagent un même processus avec une Pi donnée varie entre 0 et 40 (et j'ai pas mal de zéro en réalité!).
Mais OK pour le Chi-2, je vais essayer.
gazou2012- Nombre de messages : 4
Date d'inscription : 03/01/2012
Re: Stats et significativité de tirages
Attention,
pour le Khi-deux, les classes d'effectif inférieur à 5 posent problème. Il faut éventuellement les regrouper.
pour le Khi-deux, les classes d'effectif inférieur à 5 posent problème. Il faut éventuellement les regrouper.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Sujets similaires
» Régression logistique sur différents tirages
» 20 tirages de 100 boules sans remise
» Significativité du p ?
» Tests de significativité
» Analyse de significativité
» 20 tirages de 100 boules sans remise
» Significativité du p ?
» Tests de significativité
» Analyse de significativité
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum