Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
ACP Haberman's survival data set
2 participants
Page 1 sur 1
ACP Haberman's survival data set
Bonjour, je travaille actuellement sur le jeu de données d'Haberman, et je rencontre un problème au niveau de l'interprétation du nuage des individus sur le premier plan factoriel. En effet, une grande masse de données se forme (on n'y voit qu'un gros patté) et il devient impossible d'interpréter des oppositions entre les individus (qui serait éventuellement bien représentée).
Je dispose de 3 variables quantitatives et d'une variable qualitative binaire (que j'ai placé en variable supplémentaire),
Je me demande si :
1 - L'ACP a été une méthode judicieuse puisque j'obtiens environ un tiers de l'inertie total par axe, d'où l'ACP ne réduirait donc pas le nombre de dimensions mais me permettrait d'avoir une visualisation ?
2- Le nuage de points des individus sur le premier plan factorielle est-il interprétable? Si oui, comment?
Très cordialement (en plein désespoir) !
(Un grand merci à celui ou celle qui m'apportera une réponse)
le jeu de donnée étant disponible à l'adresse suivante : repository.seasr.org/Datasets/UCI/arff/haberman.arff (ou en fichier txt)
Je dispose de 3 variables quantitatives et d'une variable qualitative binaire (que j'ai placé en variable supplémentaire),
Je me demande si :
1 - L'ACP a été une méthode judicieuse puisque j'obtiens environ un tiers de l'inertie total par axe, d'où l'ACP ne réduirait donc pas le nombre de dimensions mais me permettrait d'avoir une visualisation ?
2- Le nuage de points des individus sur le premier plan factorielle est-il interprétable? Si oui, comment?
Très cordialement (en plein désespoir) !
(Un grand merci à celui ou celle qui m'apportera une réponse)
le jeu de donnée étant disponible à l'adresse suivante : repository.seasr.org/Datasets/UCI/arff/haberman.arff (ou en fichier txt)
- Fichiers joints
Student95- Nombre de messages : 1
Date d'inscription : 19/12/2013
Re: ACP Haberman's survival data set
Bonjour
C'est vrai que si tu n'as que trois variables, tu pourrais directement faire une CAH sur ces trois variables, ou un autre clustering pour regrouper tes individus selon un certain nombre de groupe de manière à augmenter la variance inter.
Tu peux même faire une représentation direct de tes données sur un graphique 3 D ou des graphiques simples var1*var2, var2*var3, var1*var3.
Niaboc
C'est vrai que si tu n'as que trois variables, tu pourrais directement faire une CAH sur ces trois variables, ou un autre clustering pour regrouper tes individus selon un certain nombre de groupe de manière à augmenter la variance inter.
Tu peux même faire une représentation direct de tes données sur un graphique 3 D ou des graphiques simples var1*var2, var2*var3, var1*var3.
Niaboc
niaboc- Nombre de messages : 1001
Age : 36
Localisation : Paris
Date d'inscription : 05/05/2008

» Data mining
» modèle économétrique et data.
» Regarding for Data Science Certification
» xlstat et data mining
» Big data : quel logiciel ?
» modèle économétrique et data.
» Regarding for Data Science Certification
» xlstat et data mining
» Big data : quel logiciel ?
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|