Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
pb sur échantillon de données ; urgent fin de doctorat
2 participants
Page 1 sur 1
pb sur échantillon de données ; urgent fin de doctorat
Bonjour,
Je vais essayer de synthétiser mon souci d'échantillons. Pas sûre d'être claire, je ne suis pas une pro des stats, et pourtant, je finalise ma thèse avec une analyse quanti...
J'ai demandé à des individus I de me citer P personnes (des amis). Pour chacune de ces P personnes (de chaque individu), j'ai collecté 3 variables de manière expérimentale : qui sont les variables principales de ma recherche (l'une est celle à expliquer (I), et les deux autres sont les explicatives (P) et (C)). Jusque là, ce premier test, ça va.
Mais c'est là que ça se corse : je veux tester une relation de modération par trois autres variables (G; A et T) mais ces variables sont attachées aux individus I et non pas aux personnes P, c'est le Genre et l'Age et la Taille de leur entreprise.
Or j'ai un jeu de données pour I de 35 (ce qui est bien trop faible, mais c'est ce que j'ai), et un jeu de 140 données pour P. Puisque chaque I a cité au moins 3 P.
Alors voilà ce que j'ai fait dans un premier élan :
pour un P, avec les 3 variables principales, j'ai ajouté sur la même ligne le genre de l'individu, l'âge de l'individu et la taille de leur entreprise.
Mais c'est triché, non, enfin ce n'est pas tout à fait juste? Parce que du coup, la variable genre par exemple est multipliée par le nombre de P de chaque I.
Mais ça m'arrange bien, parce qu'au lieu de 35 G, j'en ai 140
J'ai croisé deux collègues qui manient les stats, l'un m'a dit rapidement, ça passe et l'autre, non tu peux pas...mais aucun n'avait vraiment d'arguments et de justifications.
J'espère que c'est clair mais ce n'est pas sûr, vous me dites s'il faut que je sois plus précise.
Alors j'ai deux questions :
1 - est-ce que c'est triché, et si oui, comment faire pour régresser mes variables modératrices de l'échantillon de I sur les variables expliquées de l'échantillon de P, correctement?
2 - et si c'est pas triché, comment je peux justifier clairement et statistiquement que j'ai fait ça?
Merci beaucoup d'avance
Je vais essayer de synthétiser mon souci d'échantillons. Pas sûre d'être claire, je ne suis pas une pro des stats, et pourtant, je finalise ma thèse avec une analyse quanti...
J'ai demandé à des individus I de me citer P personnes (des amis). Pour chacune de ces P personnes (de chaque individu), j'ai collecté 3 variables de manière expérimentale : qui sont les variables principales de ma recherche (l'une est celle à expliquer (I), et les deux autres sont les explicatives (P) et (C)). Jusque là, ce premier test, ça va.
Mais c'est là que ça se corse : je veux tester une relation de modération par trois autres variables (G; A et T) mais ces variables sont attachées aux individus I et non pas aux personnes P, c'est le Genre et l'Age et la Taille de leur entreprise.
Or j'ai un jeu de données pour I de 35 (ce qui est bien trop faible, mais c'est ce que j'ai), et un jeu de 140 données pour P. Puisque chaque I a cité au moins 3 P.
Alors voilà ce que j'ai fait dans un premier élan :
pour un P, avec les 3 variables principales, j'ai ajouté sur la même ligne le genre de l'individu, l'âge de l'individu et la taille de leur entreprise.
Mais c'est triché, non, enfin ce n'est pas tout à fait juste? Parce que du coup, la variable genre par exemple est multipliée par le nombre de P de chaque I.
Mais ça m'arrange bien, parce qu'au lieu de 35 G, j'en ai 140
J'ai croisé deux collègues qui manient les stats, l'un m'a dit rapidement, ça passe et l'autre, non tu peux pas...mais aucun n'avait vraiment d'arguments et de justifications.
J'espère que c'est clair mais ce n'est pas sûr, vous me dites s'il faut que je sois plus précise.
Alors j'ai deux questions :
1 - est-ce que c'est triché, et si oui, comment faire pour régresser mes variables modératrices de l'échantillon de I sur les variables expliquées de l'échantillon de P, correctement?
2 - et si c'est pas triché, comment je peux justifier clairement et statistiquement que j'ai fait ça?
Merci beaucoup d'avance
val21- Nombre de messages : 3
Date d'inscription : 26/07/2011
Re: pb sur échantillon de données ; urgent fin de doctorat
Bonjour.
Si je comprends bien, pour chacun des 35 individus, tu as :
* un échantillon de 3 ou plus individus, et dans chaque échantillon, 3 caractères quantitatifs par élément de l'échantillon.
* trois caractères par individu.
Les deux n'ont évidemment rien à voir (*). Les mélanger n'a aucun intérêt scientifique. En particulier "j'ai 140 G" est à peu près du niveau du paysan qui a deux vaches et 10 poules et qui en conclut qu'il a 20 animaux. Donc tu peux fabriquer des tableaux avec ça, le problème est de savoir s'ils signifient quelque chose.
Un rappel : On peut facilement dire 2+2=4, mais tu mets 2 chèvres dans un enclos avec 2 choux ... tu n'auras pas 4 (quoi au fait ?), et bien vite il te restera ... 2 chèvres.
Cordialement.
(*) je soupçonne que tu en es parfaitement consciente, mais que tu voudrais tellement que ça soit possible...
NB : Tu as vraiment très peu de données. Faire des statistiques ainsi demande d'utiliser des outils très adaptés et peu performants (quand on ne sait pas grand chose, on ne peut pas en conclure grand chose).
Si je comprends bien, pour chacun des 35 individus, tu as :
* un échantillon de 3 ou plus individus, et dans chaque échantillon, 3 caractères quantitatifs par élément de l'échantillon.
* trois caractères par individu.
Les deux n'ont évidemment rien à voir (*). Les mélanger n'a aucun intérêt scientifique. En particulier "j'ai 140 G" est à peu près du niveau du paysan qui a deux vaches et 10 poules et qui en conclut qu'il a 20 animaux. Donc tu peux fabriquer des tableaux avec ça, le problème est de savoir s'ils signifient quelque chose.
Un rappel : On peut facilement dire 2+2=4, mais tu mets 2 chèvres dans un enclos avec 2 choux ... tu n'auras pas 4 (quoi au fait ?), et bien vite il te restera ... 2 chèvres.
Cordialement.
(*) je soupçonne que tu en es parfaitement consciente, mais que tu voudrais tellement que ça soit possible...
NB : Tu as vraiment très peu de données. Faire des statistiques ainsi demande d'utiliser des outils très adaptés et peu performants (quand on ne sait pas grand chose, on ne peut pas en conclure grand chose).
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: pb sur échantillon de données ; urgent fin de doctorat
Je crois que c'est un peu plus compliqué que ça, mais je peux me tromper. j'insiste un peu...
Pour expliquer un peu plus, je travaille sur le lien entre l'influence (Y) d'un type de Personnes, les P, sur des individus I.
Je regarde comment la confiance (C) interfère dans cette relation : modèle théorique : Y = a+bC+ r
le C et le Y dépendent de la relation de P avec I.
J'ai 35 I qui donnent 140 C (1 C pour chaque P ).
J'aimerais savoir si le genre de l'individu I modère ou pas la relation théorique...avec beaucoup trop peu de données certes.
Ca fait vraiment des choux et des carottes? se demander si le genre d'un I a une influence sur le C qu'il donne à un P, ce n'est pas possible?
Je sais que je sais peu de choses, et que j''obtiendrai peu de choses. L'expérience sera recommencée pour publier. En attendant, je dois finaliser le doc. et ce que j'aurais aimé c'est pouvoir montrer des pistes pour la suite.
Vous pensez vraiment que rien est possible dans cette situation et il vaut mieux simplement conclure ça?
Pour expliquer un peu plus, je travaille sur le lien entre l'influence (Y) d'un type de Personnes, les P, sur des individus I.
Je regarde comment la confiance (C) interfère dans cette relation : modèle théorique : Y = a+bC+ r
le C et le Y dépendent de la relation de P avec I.
J'ai 35 I qui donnent 140 C (1 C pour chaque P ).
J'aimerais savoir si le genre de l'individu I modère ou pas la relation théorique...avec beaucoup trop peu de données certes.
Ca fait vraiment des choux et des carottes? se demander si le genre d'un I a une influence sur le C qu'il donne à un P, ce n'est pas possible?
Je sais que je sais peu de choses, et que j''obtiendrai peu de choses. L'expérience sera recommencée pour publier. En attendant, je dois finaliser le doc. et ce que j'aurais aimé c'est pouvoir montrer des pistes pour la suite.
Vous pensez vraiment que rien est possible dans cette situation et il vaut mieux simplement conclure ça?
val21- Nombre de messages : 3
Date d'inscription : 26/07/2011
Re: pb sur échantillon de données ; urgent fin de doctorat
"J'aimerais savoir si le genre de l'individu I modère ou pas la relation théorique."
Oui, c'est une bonne question, qui va t'amener à couper tes 35 individus en deux catégories. Ou à utiliser une matrice ayant une colonne de plus pour tenir compte du genre.
Tu as effectivement 140 C, puisqu'il y a 140 personnes qui disent leur confiance (attention, les C ne sont pas comparables, puisque ce n'est pas la confiance en la même personne), et tu as aussi 140 Y, puisque chaque personne a une influence. mais tu n'as pas 140 G, puisque G n'est pas le genre d'une personne P, mais d'un individu I.
Donc si tu travailles avec une matrice de 35 lignes avec des colonnes qui correspondent à des mesures sur les P de chaque individu, tu peux rajouter le genre, et c'est facile à interpréter. Si tu travailles avec une matrice de 140 personnes avec des mesures sur les individus I correspondant à l'individu P concerné, tu obtiendras, en rajoutant une colonne avec le genre des renseignements sur le lien "genre de I/confiance de P", mais tu perd l'indépendance des mesures (Le fait de mettre M dans la colonne plutôt que F oblige à mettre le même M dans les lignes voisines, puisqu'elles correspondent au même individu). Comme je ne sais pas quel traitement tu fais (et que je ne suis pas spécialiste de ce genre de stats), je ne sais pas quelles conséquences ça a, mais je crains que ça ne soit pas le cadre classique.
Cordialement.
Oui, c'est une bonne question, qui va t'amener à couper tes 35 individus en deux catégories. Ou à utiliser une matrice ayant une colonne de plus pour tenir compte du genre.
Tu as effectivement 140 C, puisqu'il y a 140 personnes qui disent leur confiance (attention, les C ne sont pas comparables, puisque ce n'est pas la confiance en la même personne), et tu as aussi 140 Y, puisque chaque personne a une influence. mais tu n'as pas 140 G, puisque G n'est pas le genre d'une personne P, mais d'un individu I.
Donc si tu travailles avec une matrice de 35 lignes avec des colonnes qui correspondent à des mesures sur les P de chaque individu, tu peux rajouter le genre, et c'est facile à interpréter. Si tu travailles avec une matrice de 140 personnes avec des mesures sur les individus I correspondant à l'individu P concerné, tu obtiendras, en rajoutant une colonne avec le genre des renseignements sur le lien "genre de I/confiance de P", mais tu perd l'indépendance des mesures (Le fait de mettre M dans la colonne plutôt que F oblige à mettre le même M dans les lignes voisines, puisqu'elles correspondent au même individu). Comme je ne sais pas quel traitement tu fais (et que je ne suis pas spécialiste de ce genre de stats), je ne sais pas quelles conséquences ça a, mais je crains que ça ne soit pas le cadre classique.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: pb sur échantillon de données ; urgent fin de doctorat
vraiment merci beaucoup d'avoir pris le temps de me répondre.
Je fais exactement ça :
Je vais continuer à chercher, ce n'est effectivement pas le cadre classique, mais je ne trouve pas de littérature sur cette situation précise. Mais je continue à chercher.
Et encore merci beaucoup
Je fais exactement ça :
gg a écrit:"J'aimerais savoir si le genre de l'individu I modère ou pas la relation théorique."
Si tu travailles avec une matrice de 140 personnes avec des mesures sur les individus I correspondant à l'individu P concerné, tu obtiendras, en rajoutant une colonne avec le genre des renseignements sur le lien "genre de I/confiance de P", mais tu perd l'indépendance des mesures (Le fait de mettre M dans la colonne plutôt que F oblige à mettre le même M dans les lignes voisines, puisqu'elles correspondent au même individu). Comme je ne sais pas quel traitement tu fais (et que je ne suis pas spécialiste de ce genre de stats), je ne sais pas quelles conséquences ça a, mais je crains que ça ne soit pas le cadre classique.
Je vais continuer à chercher, ce n'est effectivement pas le cadre classique, mais je ne trouve pas de littérature sur cette situation précise. Mais je continue à chercher.
Et encore merci beaucoup
val21- Nombre de messages : 3
Date d'inscription : 26/07/2011
Sujets similaires
» Urgent: taille d'échantillon et méthode d'analyse
» cherche base de données URGENT
» URGENT! Choix correct d'un jeu de données
» urgent +++
» Sujet de doctorat
» cherche base de données URGENT
» URGENT! Choix correct d'un jeu de données
» urgent +++
» Sujet de doctorat
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum