Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Analyse multivariée pour variables binaires
4 participants
Page 1 sur 1
Analyse multivariée pour variables binaires
Bonjours,
J'ai un tableau de donnée binaire de taille XXL (10 variable et 2 mio d'individu), pourrais-je savoir comment représenter au mieux la similarité entre les variable. J'ai pensé à une MDS, pourquoi pas mais je peine à réellement définir la notion de distance, entre les variable. Je me suis penché sur l'AFC, elle me paraît très séduisante mais je peine à trouver des exemple d'AFC sur un tableau de binaire est-ce possible? L'ACM me donne un peu trop d'information sur l'écran. Une 'Binary Factor Analysis', y-a-t-il quelqu'un qui en aurait entendu parler, ça ressemble à une AFC?
Merci
J'ai un tableau de donnée binaire de taille XXL (10 variable et 2 mio d'individu), pourrais-je savoir comment représenter au mieux la similarité entre les variable. J'ai pensé à une MDS, pourquoi pas mais je peine à réellement définir la notion de distance, entre les variable. Je me suis penché sur l'AFC, elle me paraît très séduisante mais je peine à trouver des exemple d'AFC sur un tableau de binaire est-ce possible? L'ACM me donne un peu trop d'information sur l'écran. Une 'Binary Factor Analysis', y-a-t-il quelqu'un qui en aurait entendu parler, ça ressemble à une AFC?
Merci
Léon T- Nombre de messages : 13
Date d'inscription : 30/07/2015
Re: Analyse multivariée pour variables binaires
Bonjour,
Faire un test du khi2 (indépendance) serait pas mal, déjà, pour voir les relations 2 à 2.
L'ACM te permet d'avoir des informations intéressantes, logiquement, uniquement avec la sortie graphique, tu pourrais avoir une réponse à ta question.
Faire un test du khi2 (indépendance) serait pas mal, déjà, pour voir les relations 2 à 2.
L'ACM te permet d'avoir des informations intéressantes, logiquement, uniquement avec la sortie graphique, tu pourrais avoir une réponse à ta question.
12010929- Nombre de messages : 45
Date d'inscription : 24/06/2014
Re: Analyse multivariée pour variables binaires
Bonjour,
Vu comment tu présentes tes données (individus x variables), je ne comprends pas bien pourquoi tu parles de similarité entre les variables? A priori, je dirais que ce qui est intéressant c'est la similarité entre les individus, non ?
Il faudrait que tu explicites un peu mieux ton objectif/ta problématique. ça permettra de mieux t'orienter.
Nik
Vu comment tu présentes tes données (individus x variables), je ne comprends pas bien pourquoi tu parles de similarité entre les variables? A priori, je dirais que ce qui est intéressant c'est la similarité entre les individus, non ?
Il faudrait que tu explicites un peu mieux ton objectif/ta problématique. ça permettra de mieux t'orienter.
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Analyse multivariée pour variables binaires
Merci à tous les deux ,
L’idée des Khi2, j’y avais pas pensé mais ça me paraît être simple et plutôt efficace…
Pour ce qui est de l’ACM, j’hésite, je lui voie 2 défauts. Premièrement, elle « excentrise » beaucoup les modalités peu représentées. Si mes souvenirs sont bons, ce qui n’est pas forcément le but recherchés. Deuxièmement, seule la modalité TRUE m’intéresse, la modalité FAlSE le package qu7e j’utilisais sous R avait beaucoup de mal à rendre ce genre de choses propre.
J’avoue mon manque de clarté, mea culpa. En fait, je travaille sur les hommes politiques via twiitter. J’ai donc téléchargé la liste complète de leurs followers puis j’ai créé un tableau avec les comptes twitter des politiques en ligne et leurs followers en colonne, avec bien évidement, un TRUE à chaque fois qu’un follower est abonné à un compte. Le but étant de représenté graphiquement la part commune des followers qu’il peut exister entre deux compte ou l’absence de proximité.
Encore merci
12010929 a écrit:Bonjour,
Faire un test du khi2 (indépendance) serait pas mal, déjà, pour voir les relations 2 à 2.
L'ACM te permet d'avoir des informations intéressantes, logiquement, uniquement avec la sortie graphique, tu pourrais avoir une réponse à ta question.
L’idée des Khi2, j’y avais pas pensé mais ça me paraît être simple et plutôt efficace…
Pour ce qui est de l’ACM, j’hésite, je lui voie 2 défauts. Premièrement, elle « excentrise » beaucoup les modalités peu représentées. Si mes souvenirs sont bons, ce qui n’est pas forcément le but recherchés. Deuxièmement, seule la modalité TRUE m’intéresse, la modalité FAlSE le package qu7e j’utilisais sous R avait beaucoup de mal à rendre ce genre de choses propre.
Nik a écrit:Bonjour,
Vu comment tu présentes tes données (individus x variables), je ne comprends pas bien pourquoi tu parles de similarité entre les variables? A priori, je dirais que ce qui est intéressant c'est la similarité entre les individus, non ?
Il faudrait que tu explicites un peu mieux ton objectif/ta problématique. ça permettra de mieux t'orienter.
Nik
J’avoue mon manque de clarté, mea culpa. En fait, je travaille sur les hommes politiques via twiitter. J’ai donc téléchargé la liste complète de leurs followers puis j’ai créé un tableau avec les comptes twitter des politiques en ligne et leurs followers en colonne, avec bien évidement, un TRUE à chaque fois qu’un follower est abonné à un compte. Le but étant de représenté graphiquement la part commune des followers qu’il peut exister entre deux compte ou l’absence de proximité.
Encore merci
Léon T- Nombre de messages : 13
Date d'inscription : 30/07/2015
Re: Analyse multivariée pour variables binaires
Partir sur des Chi2 ou une AFC c'est un peu la même chose. Les distances entre les lignes et les colonnes, dans une AFC, n'est rien moins que la distance du Chi2, justement. Vu la taille du tableau, se palucher tous les chi2 deux à deux semble une entreprise assez longue. Il me semble qu'une AFC s'impose. La suite dépend de la structure de l'ordination des lignes et colonnes du tableau sur les plans factoriels, et des contributions des lignes et des colonnes à ces plans.
HTH, Eric.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Analyse multivariée pour variables binaires
Eric Wajnberg a écrit:Partir sur des Chi2 ou une AFC c'est un peu la même chose. Les distances entre les lignes et les colonnes, dans une AFC, n'est rien moins que la distance du Chi2, justement. Vu la taille du tableau, se palucher tous les chi2 deux à deux semble une entreprise assez longue. Il me semble qu'une AFC s'impose. La suite dépend de la structure de l'ordination des lignes et colonnes du tableau sur les plans factoriels, et des contributions des lignes et des colonnes à ces plans.
HTH, Eric.
Merci beaucoup Eric,
Pour ce qui est du Chi2, une fonction, deux boucles dans R et c'est assez vite calculé, le problème, c'est la pertinence de tout ça, à voir dans la littérature scientifique, on remplace facilement le Chi2, par Intersection (A,B)/A + Intersection (A,B)/B puis ont en fait une MDS. Alors j'applique sans être véritablement convaincu... L'inconvénient de toutes ces méthodes, c'est que je n'ai pas le niveau de statistique pour juger de leurs pertinence. Une AFC sur des variables binaires je n'en ai jamais vu. Je n'en trouve pas dans la littérature. Avez-vous, vu ou tester cette méthode?
Merci
Léon T- Nombre de messages : 13
Date d'inscription : 30/07/2015
Re: Analyse multivariée pour variables binaires
Plus précisément, je pensais à une AFCM. La variable binaire (ou les variables binaires) est (sont) codée(s) sur deux colonnes (chacune), et l'on retombe sur l'analyse d'une tableau de Burt. Je continues à penser que c'est probablement la solution que vous devriez essayer, au moins pour commencer. Il est très probable que ca vous donnerait l'information recherchée.
Eric.
Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Sujets similaires
» Régression logistique basé sur des variables binaires
» Choix analyse multivariée pour variables qualitatives
» ACP variables binaires
» Comparaison groupes variables binaires
» Etude de de 103 observations avec 29 variables binaires
» Choix analyse multivariée pour variables qualitatives
» ACP variables binaires
» Comparaison groupes variables binaires
» Etude de de 103 observations avec 29 variables binaires
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum