Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Analyser des données agrégées
2 participants
Page 1 sur 1
Analyser des données agrégées
Bonjour,
J'ai un jeu de données agrégées (je n'ai pas les microdonnées) et j'aimerais effectuer des tests statistiques là-dessus.
Il ressemble à ceci:
Region......Question.....%positive.......%negative......n
1..............15...............20...................45............2956
1..............15...............24...................38............12 459
1... etc
2
2
2
Je cherche à savoir si la région 1 diffère de la région 2 dans les %positifs et négatifs.
Dans les calculs, les logiciels statistiques prennent pour acquis que mon n= nb de lignes pour chaque catégorie.
Y-a-t'il une façon sur R, SPSS ou autre logiciel de faire en sorte que les tests soient représentatifs du nombre de répondants? (le sont-ils déjà?)
Est-ce que les résultats que j'obtiens sans en tenir compte sont erronés (moyennes, écart-types, conclusions de tests, etc)?
Merci beaucoup pour votre aide,
Sarou
J'ai un jeu de données agrégées (je n'ai pas les microdonnées) et j'aimerais effectuer des tests statistiques là-dessus.
Il ressemble à ceci:
Region......Question.....%positive.......%negative......n
1..............15...............20...................45............2956
1..............15...............24...................38............12 459
1... etc
2
2
2
Je cherche à savoir si la région 1 diffère de la région 2 dans les %positifs et négatifs.
Dans les calculs, les logiciels statistiques prennent pour acquis que mon n= nb de lignes pour chaque catégorie.
Y-a-t'il une façon sur R, SPSS ou autre logiciel de faire en sorte que les tests soient représentatifs du nombre de répondants? (le sont-ils déjà?)
Est-ce que les résultats que j'obtiens sans en tenir compte sont erronés (moyennes, écart-types, conclusions de tests, etc)?
Merci beaucoup pour votre aide,
Sarou
Sarou- Nombre de messages : 1
Date d'inscription : 17/12/2015
Re: Analyser des données agrégées
Il existe de nombreuses approches pour répondre à la question mais on doit aussi s'interroger sur les données pour savoir quelle approche utiliser. En effet, prenons les deux premières lignes, que signifie le fait qu'on ait plusieurs résultats pour la même région et la même question ? Les n=12 459 réponses de la seconde ligne sont-elles obtenues sur un échantillon qui inclut (en partie ?) les n=2956 réponses de la première ligne ? Si c'est le cas, il faut en tenir compte dans la procédure sinon le résultat sera biaisé.
Sinon de manière générale, dans un cas comme celui-là, l'une des manières de tenir compte des effectifs est de pondérer les individus-ligne par leur effectif, ce qui revient à dire qu'on donne plus de poids aux erreurs d'ajustements sur les grands effectifs que sur les petits. Ne pas le faire et garder un poids constant, signifie qu'on considère que toutes les erreurs se valent. C'est donc aussi un problème de choix de l'analyste en fonction du problème posé et d'objectif de l'étude
Une autre approche serait de recalculer les négatifs et les positifs en termes de nombre (ici, % * effectif). Ici aussi peut se poser le problème de la pondération.
Sinon de manière générale, dans un cas comme celui-là, l'une des manières de tenir compte des effectifs est de pondérer les individus-ligne par leur effectif, ce qui revient à dire qu'on donne plus de poids aux erreurs d'ajustements sur les grands effectifs que sur les petits. Ne pas le faire et garder un poids constant, signifie qu'on considère que toutes les erreurs se valent. C'est donc aussi un problème de choix de l'analyste en fonction du problème posé et d'objectif de l'étude
Une autre approche serait de recalculer les négatifs et les positifs en termes de nombre (ici, % * effectif). Ici aussi peut se poser le problème de la pondération.
Florent Aubry- Nombre de messages : 251
Date d'inscription : 02/11/2015
Sujets similaires
» ACM CAH (données qualitatives & grosse base de données)
» HELP Données ACP AFC ACM
» données anthropométriques
» Représentativité de données
» Jeux de données.
» HELP Données ACP AFC ACM
» données anthropométriques
» Représentativité de données
» Jeux de données.
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum