Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Surreprésentation de modalités
Page 1 sur 1
Surreprésentation de modalités
Bonjour à tous,
Après des semaines à chercher l’info, je viens faire appel à vous pour un problème stat que je n’arrive pas à résoudre…
Je vous explique mes données et mon problème.
Je travaille sur des données issues d’un sondage où on a demandé aux gens de nous donner les espèces qu’ils préféraient. En parallèle, on leur a demandé de leur associer 1 à 6 caractéristiques que nous avions prédéfinies (belles, mignonne, etc. => toutes binomiales, 1 ou 0)
Nous avons aussi demandé aux gens de nous donner leur age, genre, language et niveau d’étude. Nous avions également prédéfinie les classes :
Age : 4 modalités
Niveau d'étude : 5 modalités
Language : 3 modalités
Genre : 2 modalités.
Ma question est : existe-t-il une association entre les espèces et les caractéristiques choisies? Pour y répondre, j’ai fais un glm et j’ai regardé l’estimate pour savoir si l’association était positive ou négative (on ne cherche vraiment pas à aller plus loin que ça).
Mais voici où je coince : certaines de nos classes sont surreprésentées… On a 70% de femmes qui ont répondues, 85% de français, 60% de personnes de niveau d’étude 3 et 25% pour les modalités 3 et 4 du niveau d'étude. Du coup, nos résultats sont biaisés (on a vérifié en comparant le glm global à un glm où nous avons fait un rééchantillonage) à cause de certaines classes. Existe-t-il un moyen de résoudre ce problème, pour répondre à ma question ?
Merci d'avance pour votre aide :-)
Après des semaines à chercher l’info, je viens faire appel à vous pour un problème stat que je n’arrive pas à résoudre…
Je vous explique mes données et mon problème.
Je travaille sur des données issues d’un sondage où on a demandé aux gens de nous donner les espèces qu’ils préféraient. En parallèle, on leur a demandé de leur associer 1 à 6 caractéristiques que nous avions prédéfinies (belles, mignonne, etc. => toutes binomiales, 1 ou 0)
Nous avons aussi demandé aux gens de nous donner leur age, genre, language et niveau d’étude. Nous avions également prédéfinie les classes :
Age : 4 modalités
Niveau d'étude : 5 modalités
Language : 3 modalités
Genre : 2 modalités.
Ma question est : existe-t-il une association entre les espèces et les caractéristiques choisies? Pour y répondre, j’ai fais un glm et j’ai regardé l’estimate pour savoir si l’association était positive ou négative (on ne cherche vraiment pas à aller plus loin que ça).
Mais voici où je coince : certaines de nos classes sont surreprésentées… On a 70% de femmes qui ont répondues, 85% de français, 60% de personnes de niveau d’étude 3 et 25% pour les modalités 3 et 4 du niveau d'étude. Du coup, nos résultats sont biaisés (on a vérifié en comparant le glm global à un glm où nous avons fait un rééchantillonage) à cause de certaines classes. Existe-t-il un moyen de résoudre ce problème, pour répondre à ma question ?
Merci d'avance pour votre aide :-)
CelineCece- Nombre de messages : 1
Date d'inscription : 18/04/2016
Sujets similaires
» Régression logistique généralisée, var avec 10 modalités
» Estimation d'une loi discrète à 3 modalités
» Contribution des Modalités à l'intertie (ACM)
» Regression logistique avec variable à 3 modalités
» calcule des taux de differentes modalités
» Estimation d'une loi discrète à 3 modalités
» Contribution des Modalités à l'intertie (ACM)
» Regression logistique avec variable à 3 modalités
» calcule des taux de differentes modalités
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|