Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Analyses sur données déséquilibrées
2 participants
Page 1 sur 1
Analyses sur données déséquilibrées
Bonjour,
Je possède un jeu de données qui provient d'une enquête sur des marques.
J'ai 8 marques d'intérêt pour lesquelles les gens cochent ou non des items selon si cela correspond ou non aux marques (en comparatif).
Je m'interroge sur mes analyses car, du fait des filtres du questionnaire, chaque individu ne voient pas forcément le même set de marques.
Certains en voit 3, d'autres 4, d'autres 5, d'autres 6, d'autres 7, d'autres 8. Et ceux qui comparent, disons 4 marques, ne comparent pas forcément les mêmes (ABCD ou EFGH ou ABGH ...).
Mon jeu de données actuel est sous la forme individus en lignes et les itemsXmarques en colonne. De ce fait, j'ai beaucoup de "données manquantes" puisque certains individus ne voient pas certaines marques dans leur set de comparaison.
Ma problématique est simplement de vouloir comparer les images de chacune des marques entre elles.
Mais comment prendre en compte cette histoire de set différents?
Je pensais réaliser une ACM par marque (ie un tableau Individus X Items pour chaque marque avec en ligne seulement les individus qui ont eu cette marque dans leur set). Le problème c'est que la comparaison va être difficile car ce ne sera pas les mêmes plans factoriels ...
Je suis preneuse de bibliographies ou d'idées!
Merci à vous
Je possède un jeu de données qui provient d'une enquête sur des marques.
J'ai 8 marques d'intérêt pour lesquelles les gens cochent ou non des items selon si cela correspond ou non aux marques (en comparatif).
Je m'interroge sur mes analyses car, du fait des filtres du questionnaire, chaque individu ne voient pas forcément le même set de marques.
Certains en voit 3, d'autres 4, d'autres 5, d'autres 6, d'autres 7, d'autres 8. Et ceux qui comparent, disons 4 marques, ne comparent pas forcément les mêmes (ABCD ou EFGH ou ABGH ...).
Mon jeu de données actuel est sous la forme individus en lignes et les itemsXmarques en colonne. De ce fait, j'ai beaucoup de "données manquantes" puisque certains individus ne voient pas certaines marques dans leur set de comparaison.
Ma problématique est simplement de vouloir comparer les images de chacune des marques entre elles.
Mais comment prendre en compte cette histoire de set différents?
Je pensais réaliser une ACM par marque (ie un tableau Individus X Items pour chaque marque avec en ligne seulement les individus qui ont eu cette marque dans leur set). Le problème c'est que la comparaison va être difficile car ce ne sera pas les mêmes plans factoriels ...
Je suis preneuse de bibliographies ou d'idées!
Merci à vous
Aelinel- Nombre de messages : 4
Date d'inscription : 11/07/2017
Re: Analyses sur données déséquilibrées
L'idée d'une ACM peut être la bonne. Pour chaque marque, il suffit peut de mettre trois choix, pour chaque individu : (1) cochée, (2) pas cochée, et (3) non vue. L'analyse du tableau de Burt correspondant donnera une information, qui risque d'être -on l'espère- pertinente. Ca vaut le coup d'essayer, je pense.
HTH, Eric.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Analyses sur données déséquilibrées
Bonjour Eric,
Votre idée serait de remplacer mes NA actuels par une troisième modalité ?
En effet le tableau de Burt dans cette situation peut être intéressant.
Je me pose une question :
S'il est bien vrai que faire une AFC sur un tableau de Burt issue d'une ACM revient à faire une AFCM sur les variables qualitatives (corrigez moi si je me trompe!) : qu'est ce qui est le mieux ? Toujours dans mon contexte déséquilibré ...
Votre idée serait de remplacer mes NA actuels par une troisième modalité ?
En effet le tableau de Burt dans cette situation peut être intéressant.
Je me pose une question :
S'il est bien vrai que faire une AFC sur un tableau de Burt issue d'une ACM revient à faire une AFCM sur les variables qualitatives (corrigez moi si je me trompe!) : qu'est ce qui est le mieux ? Toujours dans mon contexte déséquilibré ...
Aelinel- Nombre de messages : 4
Date d'inscription : 11/07/2017
Re: Analyses sur données déséquilibrées
PS : En ajoutant une modalité 'Non Vu", j'ai peur d'avoir beaucoup d'informations sur cette modalité (ex : voir des groupes d'individus qui ont pris ensemble cette modalité pour 3 mêmes marques par exemple) et d'ainsi cacher les autres informations portées dans les modalités 1 et 2 (qui sont celles qui m'intéressent !).
Pensez-vous que l'information de cette 3ème modalité serait portée sur les premiers axes et qu'en étudiant davantage les axes suivants, j'aurais plus d'informations sur les modalités 1 et 2 ?
Pensez-vous que l'information de cette 3ème modalité serait portée sur les premiers axes et qu'en étudiant davantage les axes suivants, j'aurais plus d'informations sur les modalités 1 et 2 ?
Aelinel- Nombre de messages : 4
Date d'inscription : 11/07/2017
Re: Analyses sur données déséquilibrées
Oui, c'est ça. Pour le reste de vos questions, je ne peux pas répondre. Ca dépend de l'information qu'il y a dans vos données. Je pense que ca vaut le coup d'essayer et de voir ce que ça donne. C'est une démarche classique en AFCM, notamment dans l'analyse des réponses à des enquêtes.Aelinel a écrit:Votre idée serait de remplacer mes NA actuels par une troisième modalité ?
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Sujets similaires
» Regression logistique sur classes désequilibrées
» Choix prédicteurs - reg.log - classes déséquilibrées
» ACM CAH (données qualitatives & grosse base de données)
» données anthropométriques
» Représentativité de données
» Choix prédicteurs - reg.log - classes déséquilibrées
» ACM CAH (données qualitatives & grosse base de données)
» données anthropométriques
» Représentativité de données
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum