Analyser des données agrégées

Voir le sujet précédent Voir le sujet suivant Aller en bas

Analyser des données agrégées

Message par Sarou le Jeu 17 Déc 2015 - 17:41

Bonjour,
J'ai un jeu de données agrégées (je n'ai pas les microdonnées) et j'aimerais effectuer des tests statistiques là-dessus.
Il ressemble à ceci:

Region......Question.....%positive.......%negative......n
1..............15...............20...................45............2956
1..............15...............24...................38............12 459
1... etc
2
2
2

Je cherche à savoir si la région 1 diffère de la région 2 dans les %positifs et négatifs.
Dans les calculs, les logiciels statistiques prennent pour acquis que mon n= nb de lignes pour chaque catégorie.
Y-a-t'il une façon sur R, SPSS ou autre logiciel de faire en sorte que les tests soient représentatifs du nombre de répondants? (le sont-ils déjà?)
Est-ce que les résultats que j'obtiens sans en tenir compte sont erronés (moyennes, écart-types, conclusions de tests, etc)?


Merci beaucoup pour votre aide,
Sarou

Sarou

Nombre de messages : 1
Date d'inscription : 17/12/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Analyser des données agrégées

Message par Florent Aubry le Ven 18 Déc 2015 - 14:13

Il existe de nombreuses approches pour répondre à la question mais on doit aussi s'interroger sur les données pour savoir quelle approche utiliser. En effet, prenons les deux premières lignes, que signifie le fait qu'on ait plusieurs résultats pour la même région et la même question ? Les n=12 459 réponses de la seconde ligne sont-elles obtenues sur un échantillon qui inclut (en partie ?) les n=2956 réponses de la première ligne ? Si c'est le cas, il faut en tenir compte dans la procédure sinon le résultat sera biaisé.

Sinon de manière générale, dans un cas comme celui-là, l'une des manières de tenir compte des effectifs est de pondérer les individus-ligne par leur effectif, ce qui revient à dire qu'on donne plus de poids aux erreurs d'ajustements sur les grands effectifs que sur les petits. Ne pas le faire et garder un poids constant, signifie qu'on considère que toutes les erreurs se valent. C'est donc aussi un problème de choix de l'analyste en fonction du problème posé et d'objectif de l'étude

Une autre approche serait de recalculer les négatifs et les positifs en termes de nombre (ici, % * effectif). Ici aussi peut se poser le problème de la pondération.

Florent Aubry

Nombre de messages : 121
Date d'inscription : 02/11/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum