Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Classification R
2 participants
Page 1 sur 1
Classification R
Bonjour à tous !
Je cherche à construire une classification sur R sur une table contenant 5 champs et 69000 lignes.
Chaque ligne contient les éléments suivants :
N° d'adhérant
Pourcentage de livres commandé dans le thème fiction
Pourcentage de livres commandé dans le thème thriller
Pourcentage de livres commandé dans le thème romantique
Pourcentage de livres commandé dans le thème bandes dessinées.
La somme des 4 derniers champs vaut 100.
Voici le code que j'ai réalisé :
1. Normalisation des données
baseNOR <- scale(base[,2:5],center=T,scale=T)
2. Réalisation de la classification :
library(Factominer)
res.hcpc<- HCPC(baseNOR, nb.clust=4,order=TRUE,graph=FALSE,method = "ward",nb.par = 100)
3. Résultats qu'R studio me retourne :
Error: cannot allocate vector of size 17.5 Gb
In addition: Warning messages:
1: In dist(X, method = metric) :
Reached total allocation of 16281Mb: see help(memory.size)
2: In dist(X, method = metric) :
Reached total allocation of 16281Mb: see help(memory.size)
3: In dist(X, method = metric) :
Reached total allocation of 16281Mb: see help(memory.size)
4: In dist(X, method = metric) :
Reached total allocation of 16281Mb: see help(memory.size)
Auriez vous une méthode à me préconiser ?
En vous remerciant !
Je cherche à construire une classification sur R sur une table contenant 5 champs et 69000 lignes.
Chaque ligne contient les éléments suivants :
N° d'adhérant
Pourcentage de livres commandé dans le thème fiction
Pourcentage de livres commandé dans le thème thriller
Pourcentage de livres commandé dans le thème romantique
Pourcentage de livres commandé dans le thème bandes dessinées.
La somme des 4 derniers champs vaut 100.
Voici le code que j'ai réalisé :
1. Normalisation des données
baseNOR <- scale(base[,2:5],center=T,scale=T)
2. Réalisation de la classification :
library(Factominer)
res.hcpc<- HCPC(baseNOR, nb.clust=4,order=TRUE,graph=FALSE,method = "ward",nb.par = 100)
3. Résultats qu'R studio me retourne :
Error: cannot allocate vector of size 17.5 Gb
In addition: Warning messages:
1: In dist(X, method = metric) :
Reached total allocation of 16281Mb: see help(memory.size)
2: In dist(X, method = metric) :
Reached total allocation of 16281Mb: see help(memory.size)
3: In dist(X, method = metric) :
Reached total allocation of 16281Mb: see help(memory.size)
4: In dist(X, method = metric) :
Reached total allocation of 16281Mb: see help(memory.size)
Auriez vous une méthode à me préconiser ?
En vous remerciant !
klaklar- Nombre de messages : 3
Date d'inscription : 21/10/2015
Re: Classification R
Salut,
Je ne suis pas sûr de ce que je vais dire mais il serait pas préférable d'effectuer une analyse factorielle avant pour ensuite obtenir des classes plus homogènes ?
Je ne suis pas sûr de ce que je vais dire mais il serait pas préférable d'effectuer une analyse factorielle avant pour ensuite obtenir des classes plus homogènes ?
Coco- Nombre de messages : 57
Date d'inscription : 23/03/2017
Re: Classification R
Bonjour,
J'avais pensé à procéder à une ACP, mais j'ai seulement 4 variables...
Du coup je ne vois pas ce que ça apporterait de faire une ACP :/
Il faudrait que je test
J'avais pensé à procéder à une ACP, mais j'ai seulement 4 variables...
Du coup je ne vois pas ce que ça apporterait de faire une ACP :/
Il faudrait que je test
klaklar- Nombre de messages : 3
Date d'inscription : 21/10/2015
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum