Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Le deal à ne pas rater :
Tablette 11″ Xiaomi- Mi Pad 6 global version (coupon + code promo)
224.97 €
Voir le deal
-39%
Le deal à ne pas rater :
Ordinateur portable ASUS Chromebook Vibe CX34 Flip
399 € 649 €
Voir le deal

Analyser des données agrégées

2 participants

Aller en bas

 - Analyser des données agrégées Empty Analyser des données agrégées

Message par Sarou Jeu 17 Déc 2015 - 17:41

Bonjour,
J'ai un jeu de données agrégées (je n'ai pas les microdonnées) et j'aimerais effectuer des tests statistiques là-dessus.
Il ressemble à ceci:

Region......Question.....%positive.......%negative......n
1..............15...............20...................45............2956
1..............15...............24...................38............12 459
1... etc
2
2
2

Je cherche à savoir si la région 1 diffère de la région 2 dans les %positifs et négatifs.
Dans les calculs, les logiciels statistiques prennent pour acquis que mon n= nb de lignes pour chaque catégorie.
Y-a-t'il une façon sur R, SPSS ou autre logiciel de faire en sorte que les tests soient représentatifs du nombre de répondants? (le sont-ils déjà?)
Est-ce que les résultats que j'obtiens sans en tenir compte sont erronés (moyennes, écart-types, conclusions de tests, etc)?


Merci beaucoup pour votre aide,
Sarou

Sarou

Nombre de messages : 1
Date d'inscription : 17/12/2015

Revenir en haut Aller en bas

 - Analyser des données agrégées Empty Re: Analyser des données agrégées

Message par Florent Aubry Ven 18 Déc 2015 - 14:13

Il existe de nombreuses approches pour répondre à la question mais on doit aussi s'interroger sur les données pour savoir quelle approche utiliser. En effet, prenons les deux premières lignes, que signifie le fait qu'on ait plusieurs résultats pour la même région et la même question ? Les n=12 459 réponses de la seconde ligne sont-elles obtenues sur un échantillon qui inclut (en partie ?) les n=2956 réponses de la première ligne ? Si c'est le cas, il faut en tenir compte dans la procédure sinon le résultat sera biaisé.

Sinon de manière générale, dans un cas comme celui-là, l'une des manières de tenir compte des effectifs est de pondérer les individus-ligne par leur effectif, ce qui revient à dire qu'on donne plus de poids aux erreurs d'ajustements sur les grands effectifs que sur les petits. Ne pas le faire et garder un poids constant, signifie qu'on considère que toutes les erreurs se valent. C'est donc aussi un problème de choix de l'analyste en fonction du problème posé et d'objectif de l'étude

Une autre approche serait de recalculer les négatifs et les positifs en termes de nombre (ici, % * effectif). Ici aussi peut se poser le problème de la pondération.

Florent Aubry

Nombre de messages : 251
Date d'inscription : 02/11/2015

Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum