Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
-40%
Le deal à ne pas rater :
-40% sur le Pack Gaming Mario PDP Manette filaire + Casque filaire ...
29.99 € 49.99 €
Voir le deal

ACP Haberman's survival data set

2 participants

Aller en bas

ACP Haberman's survival data set Empty ACP Haberman's survival data set

Message par Student95 Jeu 19 Déc 2013 - 22:27

Bonjour, je travaille actuellement sur le jeu de données d'Haberman, et je rencontre un problème au niveau de l'interprétation du nuage des individus sur le premier plan factoriel. En effet, une grande masse de données se forme (on n'y voit qu'un gros patté) et il devient impossible d'interpréter des oppositions entre les individus (qui serait éventuellement bien représentée).
Je dispose de 3 variables quantitatives et d'une variable qualitative binaire (que j'ai placé en variable supplémentaire),
Je me demande si :
1 - L'ACP a été une méthode judicieuse puisque j'obtiens environ un tiers de l'inertie total par axe, d'où l'ACP ne réduirait donc pas le nombre de dimensions mais me permettrait d'avoir une visualisation ?

2- Le nuage de points des individus sur le premier plan factorielle est-il interprétable? Si oui, comment?

Très cordialement (en plein désespoir) !
(Un grand merci à celui ou celle qui m'apportera une réponse)

le jeu de donnée étant disponible à l'adresse suivante : repository.seasr.org/Datasets/UCI/arff/haberman.arff (ou en fichier txt)
Fichiers joints
ACP Haberman's survival data set Attachment
haberman.txt Vous n'avez pas la permission de télécharger les fichiers joints.(4 Ko) Téléchargé 0 fois
ACP Haberman's survival data set Attachment
Rplot plan indiv.png Vous n'avez pas la permission de télécharger les fichiers joints.(15 Ko) Téléchargé 0 fois

Student95

Nombre de messages : 1
Date d'inscription : 19/12/2013

Revenir en haut Aller en bas

ACP Haberman's survival data set Empty Re: ACP Haberman's survival data set

Message par niaboc Ven 20 Déc 2013 - 7:43

Bonjour

C'est vrai que si tu n'as que trois variables, tu pourrais directement faire une CAH sur ces trois variables, ou un autre clustering pour regrouper tes individus selon un certain nombre de groupe de manière à augmenter la variance inter.

Tu peux même faire une représentation direct de tes données sur un graphique 3 D ou des graphiques simples var1*var2, var2*var3, var1*var3.

Niaboc
niaboc
niaboc

Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum