anipassion.com

Analyse multivariée pour variables binaires

Voir le sujet précédent Voir le sujet suivant Aller en bas

Analyse multivariée pour variables binaires

Message par Léon T le Jeu 30 Juil 2015 - 10:56

Bonjours,
J'ai un tableau de donnée binaire de taille XXL (10 variable et 2 mio d'individu), pourrais-je savoir comment représenter au mieux la similarité entre les variable. J'ai pensé à une MDS, pourquoi pas mais je peine à réellement définir la notion de distance, entre les variable. Je me suis penché sur l'AFC, elle me paraît très séduisante mais je peine à trouver des exemple d'AFC sur un tableau de binaire est-ce possible? L'ACM me donne un peu trop d'information sur l'écran. Une 'Binary Factor Analysis', y-a-t-il quelqu'un qui en aurait entendu parler, ça ressemble à une AFC?

Merci

Léon T

Nombre de messages : 13
Date d'inscription : 30/07/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Analyse multivariée pour variables binaires

Message par 12010929 le Jeu 30 Juil 2015 - 11:47

Bonjour,

Faire un test du khi2 (indépendance) serait pas mal, déjà, pour voir les relations 2 à 2.
L'ACM te permet d'avoir des informations intéressantes, logiquement, uniquement avec la sortie graphique, tu pourrais avoir une réponse à ta question.

12010929

Nombre de messages : 45
Date d'inscription : 24/06/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Analyse multivariée pour variables binaires

Message par Nik le Jeu 30 Juil 2015 - 13:50

Bonjour,

Vu comment tu présentes tes données (individus x variables), je ne comprends pas bien pourquoi tu parles de similarité entre les variables? A priori, je dirais que ce qui est intéressant c'est la similarité entre les individus, non ?

Il faudrait que tu explicites un peu mieux ton objectif/ta problématique. ça permettra de mieux t'orienter.

Nik

Nik

Nombre de messages : 1501
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Analyse multivariée pour variables binaires

Message par Léon T le Jeu 30 Juil 2015 - 15:07

Merci à tous les deux ,


12010929 a écrit:Bonjour,

Faire un test du khi2 (indépendance) serait pas mal, déjà, pour voir les relations 2 à 2.
L'ACM te permet d'avoir des informations intéressantes, logiquement, uniquement avec la sortie graphique, tu pourrais avoir une réponse à ta question.

L’idée des Khi2, j’y avais pas pensé mais ça me paraît être simple et plutôt efficace…
Pour ce qui est de l’ACM, j’hésite, je lui voie 2 défauts. Premièrement, elle « excentrise » beaucoup les modalités peu représentées. Si mes souvenirs sont bons, ce qui n’est pas forcément le but recherchés. Deuxièmement, seule la modalité TRUE m’intéresse, la modalité FAlSE le package qu7e j’utilisais sous R avait beaucoup de mal à rendre ce genre de choses propre.


Nik a écrit:Bonjour,

Vu comment tu présentes tes données (individus x variables), je ne comprends pas bien pourquoi tu parles de similarité entre les variables? A priori, je dirais que ce qui est intéressant c'est la similarité entre les individus, non ?

Il faudrait que tu explicites un peu mieux ton objectif/ta problématique. ça permettra de mieux t'orienter.

Nik

J’avoue mon manque de clarté, mea culpa. En fait, je travaille sur les hommes politiques via twiitter. J’ai donc téléchargé la liste complète de leurs followers puis j’ai créé un tableau avec les comptes twitter des politiques en ligne et leurs followers en colonne, avec bien évidement, un TRUE à chaque fois qu’un follower est abonné à un compte. Le but étant de représenté graphiquement la part commune des followers qu’il peut exister entre deux compte ou l’absence de proximité.

Encore merci

Léon T

Nombre de messages : 13
Date d'inscription : 30/07/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Analyse multivariée pour variables binaires

Message par Eric Wajnberg le Dim 2 Aoû 2015 - 18:24

Partir sur des Chi2 ou une AFC c'est un peu la même chose. Les distances entre les lignes et les colonnes, dans une AFC, n'est rien moins que la distance du Chi2, justement. Vu la taille du tableau, se palucher tous les chi2 deux à deux semble une entreprise assez longue. Il me semble qu'une AFC s'impose. La suite dépend de la structure de l'ordination des lignes et colonnes du tableau sur les plans factoriels, et des contributions des lignes et des colonnes à ces plans.

HTH, Eric.

Eric Wajnberg

Nombre de messages : 308
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Analyse multivariée pour variables binaires

Message par Léon T le Mer 5 Aoû 2015 - 15:24

Eric Wajnberg a écrit:Partir sur des Chi2 ou une AFC c'est un peu la même chose. Les distances entre les lignes et les colonnes, dans une AFC, n'est rien moins que la distance du Chi2, justement. Vu la taille du tableau, se palucher tous les chi2 deux à deux semble une entreprise assez longue. Il me semble qu'une AFC s'impose. La suite dépend de la structure de l'ordination des lignes et colonnes du tableau sur les plans factoriels, et des contributions des lignes et des colonnes à ces plans.

HTH, Eric.

Merci beaucoup Eric,

Pour ce qui est du Chi2, une  fonction, deux boucles dans R et c'est assez vite calculé, le problème, c'est la pertinence de tout ça, à voir dans la littérature   scientifique, on remplace  facilement le Chi2, par Intersection (A,B)/A + Intersection (A,B)/B puis ont en fait une MDS. Alors j'applique sans être véritablement convaincu... L'inconvénient de toutes ces méthodes, c'est que je n'ai pas le niveau de statistique pour juger de leurs pertinence. Une AFC sur  des variables binaires je n'en ai jamais vu. Je n'en  trouve pas dans la littérature. Avez-vous, vu ou tester cette méthode?

Merci

Léon T

Nombre de messages : 13
Date d'inscription : 30/07/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Analyse multivariée pour variables binaires

Message par Eric Wajnberg le Jeu 6 Aoû 2015 - 7:33

Plus précisément, je pensais à une AFCM. La variable binaire (ou les variables binaires) est (sont) codée(s) sur deux colonnes (chacune), et l'on retombe sur l'analyse d'une tableau de Burt. Je continues à penser que c'est probablement la solution que vous devriez essayer, au moins pour commencer. Il est très probable que ca vous donnerait l'information recherchée.

Eric.

Eric Wajnberg

Nombre de messages : 308
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Analyse multivariée pour variables binaires

Message par Contenu sponsorisé Aujourd'hui à 10:45


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum