Les posteurs les plus actifs de la semaine
Eric Wajnberg
 
zezima
 
Nik
 
margotte185
 
c@ssoulet
 
Coco
 
Ayana
 


Classification R

Voir le sujet précédent Voir le sujet suivant Aller en bas

Classification R

Message par klaklar le Mar 29 Aoû 2017 - 14:39

Bonjour à tous !

Je cherche à construire une classification sur R sur une table contenant 5 champs et 69000 lignes.
Chaque ligne contient les éléments suivants :
N° d'adhérant
Pourcentage de livres commandé dans le thème fiction
Pourcentage de livres commandé dans le thème thriller
Pourcentage de livres commandé dans le thème romantique
Pourcentage de livres commandé dans le thème bandes dessinées.

La somme des 4 derniers champs vaut 100.

Voici le code que j'ai réalisé :

1. Normalisation des données

baseNOR <- scale(base[,2:5],center=T,scale=T)

2. Réalisation de la classification :

library(Factominer)
res.hcpc<- HCPC(baseNOR, nb.clust=4,order=TRUE,graph=FALSE,method = "ward",nb.par = 100)

3. Résultats qu'R studio me retourne :

Error: cannot allocate vector of size 17.5 Gb
In addition: Warning messages:
1: In dist(X, method = metric) :
Reached total allocation of 16281Mb: see help(memory.size)
2: In dist(X, method = metric) :
Reached total allocation of 16281Mb: see help(memory.size)
3: In dist(X, method = metric) :
Reached total allocation of 16281Mb: see help(memory.size)
4: In dist(X, method = metric) :
Reached total allocation of 16281Mb: see help(memory.size)

Auriez vous une méthode à me préconiser ?

En vous remerciant !

klaklar

Nombre de messages : 3
Date d'inscription : 21/10/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Classification R

Message par Coco le Mer 30 Aoû 2017 - 7:37

Salut,

Je ne suis pas sûr de ce que je vais dire mais il serait pas préférable d'effectuer une analyse factorielle avant pour ensuite obtenir des classes plus homogènes ?
avatar
Coco

Nombre de messages : 26
Date d'inscription : 23/03/2017

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Classification R

Message par klaklar le Mer 30 Aoû 2017 - 10:09

Bonjour,

J'avais pensé à procéder à une ACP, mais j'ai seulement 4 variables...
Du coup je ne vois pas ce que ça apporterait de faire une ACP :/
Il faudrait que je test

klaklar

Nombre de messages : 3
Date d'inscription : 21/10/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Classification R

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum