Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
acp - cah -scoring
Page 1 sur 1
acp - cah -scoring
bonjour a tous,
j'ai besoin de quelques précisions et j'ai beau chercher sur internet, je ne trouve pas de démarche claire pour ce que je veux effectuer.. je dois comparer un individu avec beaucoup d'autres selon des facteurs qualitatifs. Il faut pour cela que j'effectue une analyse de correspondance multiple. Le fait étant que je n'utilise pas de logiciel de statistique (ce sera codé en java) je voulais savoir:
- pour interprèter les axes, comment faire pour savoir, selon les valeurs propres obtenues à quel facteur elles correspondent ?
- d'autre part, on m'a parlé de score de distance et de classification ascendante hierarchique à effectuer à l'aide d'un test du Khi-2 et de l'étude de l'Analyse de correspondance multiple précédemment effectuée. Je ne comprends pas commente exploiter ce renseignement et quelle doit etre la démarche pour savoir rapprocher un des individus à celui qui lui 'ressemble le plus' en utilisant toutes les techniques décrites ci-dessus ?
Merci d'avance pour l'aide que vous m'apporterez !
j'ai besoin de quelques précisions et j'ai beau chercher sur internet, je ne trouve pas de démarche claire pour ce que je veux effectuer.. je dois comparer un individu avec beaucoup d'autres selon des facteurs qualitatifs. Il faut pour cela que j'effectue une analyse de correspondance multiple. Le fait étant que je n'utilise pas de logiciel de statistique (ce sera codé en java) je voulais savoir:
- pour interprèter les axes, comment faire pour savoir, selon les valeurs propres obtenues à quel facteur elles correspondent ?
- d'autre part, on m'a parlé de score de distance et de classification ascendante hierarchique à effectuer à l'aide d'un test du Khi-2 et de l'étude de l'Analyse de correspondance multiple précédemment effectuée. Je ne comprends pas commente exploiter ce renseignement et quelle doit etre la démarche pour savoir rapprocher un des individus à celui qui lui 'ressemble le plus' en utilisant toutes les techniques décrites ci-dessus ?
Merci d'avance pour l'aide que vous m'apporterez !
cokate- Nombre de messages : 5
Date d'inscription : 07/05/2009
Re: acp - cah -scoring
Dommage que tu n'utilises pas de logiciel de stats qcar tu vas pas mal te compliquer la vie la !
Pour ce qui est des valeurs propres, le lien est croissant, la valeur propore la plus forte est associée au premier axe (permier vecteur propre), ect ...
Est-ce que ton individu fait partie de ton analyse, ou est-ce que celui-ci viendra une fois que tu auras fait ton analyse en individu supplémentaire ?
Si ton individu fait partie de ton analyse, alors tu peux effectivement cacluler une matrice de distance a partir des coordonnées de tes individus sur les différents axes que tu auras conserver, puis faire une classification ascendante hierarchique pour voir avec quels autres individus ton individu est regroupé.
micros
Pour ce qui est des valeurs propres, le lien est croissant, la valeur propore la plus forte est associée au premier axe (permier vecteur propre), ect ...
Est-ce que ton individu fait partie de ton analyse, ou est-ce que celui-ci viendra une fois que tu auras fait ton analyse en individu supplémentaire ?
Si ton individu fait partie de ton analyse, alors tu peux effectivement cacluler une matrice de distance a partir des coordonnées de tes individus sur les différents axes que tu auras conserver, puis faire une classification ascendante hierarchique pour voir avec quels autres individus ton individu est regroupé.
micros
Invité- Invité
Re: acp - cah -scoring
pour ce qui est du logiciel de statistiques, je ne pense pas qu'il y ait de lien direct entre java et un de ces logiciels ?
ou peut etre il existe une librairie java pour faire tout ca mais je n'ai pas encore trouvé lol
L'individu fait partie de l'analyse, en fait, on veut trouver parmi les autres celui ou le groupe de ceux qui lui ressemblent le plus.
une fois obtenue la distance de chaque individu par rapport à chacun des axes, je ne vois pas comment effectuer la classification hiérarchique .... dans la matrice des distances, on met quoi ? on aura pour chaque axe la distance de chaque individu par rapport à cet axe et non des individus entre eux ?
merci en tout cas
ou peut etre il existe une librairie java pour faire tout ca mais je n'ai pas encore trouvé lol
L'individu fait partie de l'analyse, en fait, on veut trouver parmi les autres celui ou le groupe de ceux qui lui ressemblent le plus.
une fois obtenue la distance de chaque individu par rapport à chacun des axes, je ne vois pas comment effectuer la classification hiérarchique .... dans la matrice des distances, on met quoi ? on aura pour chaque axe la distance de chaque individu par rapport à cet axe et non des individus entre eux ?
merci en tout cas
cokate- Nombre de messages : 5
Date d'inscription : 07/05/2009
Re: acp - cah -scoring
pour ce qui est des logiciels de stats je sais qu'il existe des liens entre R et java, tu as une librairie qui s'appelle RJAVA, mais je ne sais pas comment ça fonctionne.
En fait tu établis une matrice de distance entre tes individus a partir de leur coordonnées sur les différents axes que tu considères (prends que les axes les plus importants) et a partir de cette matrice de distance tu calcules une CAH. Tu te sers de la matrice de distance des individus entre eux.
tout ça est très facile a faire dans R notamment avec la librairie ade4.
micros
En fait tu établis une matrice de distance entre tes individus a partir de leur coordonnées sur les différents axes que tu considères (prends que les axes les plus importants) et a partir de cette matrice de distance tu calcules une CAH. Tu te sers de la matrice de distance des individus entre eux.
tout ça est très facile a faire dans R notamment avec la librairie ade4.
micros
Invité- Invité
Re: acp - cah -scoring
ok merci je vais me renseigner pour les librairies RJAVA.
je vais également voir du coté de la librairie R
Ce que je ne comprends pas, c'est à propos du calcul de distance. Est-ce que c'est le calcul de score factoriel ?
en gros pour chaque individu, on a ses coordonnées sur chacun des axes factoriels. On fait un produit scalaire des vecteurs des 2 individus pour obtenir la distance entre ceux-ci? j'avais vu qu'il fallait utiliser la distance du Khi-2 mais je en vois pas comment la faire intervenir ici... J'ai essayé de trouver de la doc sur les scores factoriels mais je ne trouve rien de très précis. Connaitrais-tu des docs bien détaillés ?
Merci pr ta réponse
je vais également voir du coté de la librairie R
Ce que je ne comprends pas, c'est à propos du calcul de distance. Est-ce que c'est le calcul de score factoriel ?
en gros pour chaque individu, on a ses coordonnées sur chacun des axes factoriels. On fait un produit scalaire des vecteurs des 2 individus pour obtenir la distance entre ceux-ci? j'avais vu qu'il fallait utiliser la distance du Khi-2 mais je en vois pas comment la faire intervenir ici... J'ai essayé de trouver de la doc sur les scores factoriels mais je ne trouve rien de très précis. Connaitrais-tu des docs bien détaillés ?
Merci pr ta réponse
cokate- Nombre de messages : 5
Date d'inscription : 07/05/2009
Re: acp - cah -scoring
R n'est pas une librairie mais un logiciel.
La démarche que je suivais sous le logiciel R :
1. acm sur le tableau de facteurs
acm1 <- dudi.acm(Tableau)
2. matrice de distance
dist1 <- dist.dudi(acm1$li)
3. CAH
hclust(dist1,method="ward")
Après il existe d'autres distances et d'autres algos que Ward pour la constitution des groupes.
Va voir sur http://pbil.univ-lyon1.fr/R/enseignement.html, il y a pas mal de fiches notamment sur les CAH.
micros
La démarche que je suivais sous le logiciel R :
1. acm sur le tableau de facteurs
acm1 <- dudi.acm(Tableau)
2. matrice de distance
dist1 <- dist.dudi(acm1$li)
3. CAH
hclust(dist1,method="ward")
Après il existe d'autres distances et d'autres algos que Ward pour la constitution des groupes.
Va voir sur http://pbil.univ-lyon1.fr/R/enseignement.html, il y a pas mal de fiches notamment sur les CAH.
micros
Invité- Invité
Re: acp - cah -scoring
oui oui je connais R j'en ai fait un peu en cours lol
merci pour ta démrache j'ai bien compris comment faire le dendogramme et tout
par contre, ce que je voudrais en fait c'est comparer un individu à tous les autres et du coup, je sais pas comment récupérer son" plus proche voisin" a l'issu de la classification ? tu sais comment faire ?
et autre question: comment obtenir le score (compris entre 0 et 1) de chaque individu .
J'ai trouvé pour les modalités mais pas pour les individus
dernière question: en fait ce que je dois faire s'applique à des instruments financiers, et donc si dans ces instruments, il y en a un qui est un indice c'est à dire qu'il est composé de plusieurs éléments de base (qui ont chacun un poids dans l'indice) comment faire pour intégrer l'instrument à l'étude, puisqu'il a plusieurs modalités par variables puisque composé de plusieurs elements qui n'ont chacun qu'une modalité ...
je sais pas si j'ai été claire lol
merci encore pour ton aide :p
merci pour ta démrache j'ai bien compris comment faire le dendogramme et tout
par contre, ce que je voudrais en fait c'est comparer un individu à tous les autres et du coup, je sais pas comment récupérer son" plus proche voisin" a l'issu de la classification ? tu sais comment faire ?
et autre question: comment obtenir le score (compris entre 0 et 1) de chaque individu .
J'ai trouvé pour les modalités mais pas pour les individus
dernière question: en fait ce que je dois faire s'applique à des instruments financiers, et donc si dans ces instruments, il y en a un qui est un indice c'est à dire qu'il est composé de plusieurs éléments de base (qui ont chacun un poids dans l'indice) comment faire pour intégrer l'instrument à l'étude, puisqu'il a plusieurs modalités par variables puisque composé de plusieurs elements qui n'ont chacun qu'une modalité ...
je sais pas si j'ai été claire lol
merci encore pour ton aide :p
cokate- Nombre de messages : 5
Date d'inscription : 07/05/2009
Re: acp - cah -scoring
bonjour,
désolée de relancer le sujet mais je n'ai toujours pas trouvé comment obtenir le score de chaque individu ... si quelqu'un sait ?
autre petit souci :
dist1 <- dist.dudi(acm1$li) : ne marche pas car l'argument de dist.dudi doit être de type dudi ... du coup j'ai utilisé seulement:
dist1<-dist.dudi(acm1) seulement j'ai constaté qu'avec cette méthode, peu importe le nombre de facteurs utilisés pour l'acm, la matrice des distances reste la même ... est-ce normal ? dans ce cas, à quoi sert l'acm ? on n'a pas réduit le problème au nombre d'axes choisis ... et cela m'embête quelque peu ... savez vous comment remédier au problème ...
merci d'avance
désolée de relancer le sujet mais je n'ai toujours pas trouvé comment obtenir le score de chaque individu ... si quelqu'un sait ?
autre petit souci :
dist1 <- dist.dudi(acm1$li) : ne marche pas car l'argument de dist.dudi doit être de type dudi ... du coup j'ai utilisé seulement:
dist1<-dist.dudi(acm1) seulement j'ai constaté qu'avec cette méthode, peu importe le nombre de facteurs utilisés pour l'acm, la matrice des distances reste la même ... est-ce normal ? dans ce cas, à quoi sert l'acm ? on n'a pas réduit le problème au nombre d'axes choisis ... et cela m'embête quelque peu ... savez vous comment remédier au problème ...
merci d'avance
cokate- Nombre de messages : 5
Date d'inscription : 07/05/2009
Sujets similaires
» scoring de recouvrement
» Méthode de scoring
» scoring: régression logistique
» utilisation de SPAD pour faire du scoring
» Scoring Regression Logistique basé sur une Segmentation RFM
» Méthode de scoring
» scoring: régression logistique
» utilisation de SPAD pour faire du scoring
» Scoring Regression Logistique basé sur une Segmentation RFM
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|