Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Le Deal du moment : -38%
Ecran PC gaming 23,8″ – ACER KG241Y P3bip ...
Voir le deal
99.99 €

tirage aleatoire de données

4 participants

Aller en bas

tirage aleatoire de données Empty tirage aleatoire de données

Message par gatos Lun 9 Nov 2015 - 16:35

Bonjour,

Je dispose d'un jeu de données de taille 150000 observations. Et je veux prendre seulement 10000 observations mais aléatoirement.

Comment je peux faire un tirage aléatoire sous R ?

Cordialement,

gatos

Nombre de messages : 43
Date d'inscription : 04/07/2014

Revenir en haut Aller en bas

tirage aleatoire de données Empty Re: tirage aleatoire de données

Message par Ayana Lun 9 Nov 2015 - 16:55

Re-bonjour,

Si ta base s'appelle tab et l'identifiant de tes observations s'appelle ID, ceci devrait marcher:
Code:
v<-sample(1:150000,10000,replace = F)
tab2<-tab[tab$ID %in% v,]

Ayana
Ayana
Ayana

Nombre de messages : 550
Localisation : Londres
Date d'inscription : 18/08/2009

Revenir en haut Aller en bas

tirage aleatoire de données Empty Re: tirage aleatoire de données

Message par gatos Mar 10 Nov 2015 - 8:31

Merci pour votre réponse ,
mais ça m'a donné un vecteur de longueur =17144 et non pas 10000 Sad

gatos

Nombre de messages : 43
Date d'inscription : 04/07/2014

Revenir en haut Aller en bas

tirage aleatoire de données Empty Re: tirage aleatoire de données

Message par c@ssoulet Mar 10 Nov 2015 - 9:56

Méthode très simple, qui marche quel que soit le logiciel:
- Pour chaque observation, générer une variable ALEA = nombre aleatoire
- Trier ALEA = croissant
- Garder les x premières lignes

c@ssoulet

Nombre de messages : 925
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

tirage aleatoire de données Empty Re: tirage aleatoire de données

Message par gatos Mar 10 Nov 2015 - 11:04

Je vous remercie pour votre réponse

gatos

Nombre de messages : 43
Date d'inscription : 04/07/2014

Revenir en haut Aller en bas

tirage aleatoire de données Empty Re: tirage aleatoire de données

Message par Florent Aubry Mar 10 Nov 2015 - 12:53

Gatos a écrite "mais ça m'a donné un vecteur de longueur =17144 et non pas 10000". Je suppose qu'il veut parler du nombre de lignes de tab2 car il est impossible que v soit de cette longueur. La raison pour laquelle tab2 a plus de 10000 lignes vient du fait que plusieurs lignes de tab doivent avoir la même valeur de ID. Facile à vérifier :
Code:
table( tab$ID) != 1
donnera les ID défectueux.

Une manière de contourner le problème est :
Code:
v <- sample( nrow( tab), size=10000)
tab2 <- tab[v,]

Florent Aubry

Nombre de messages : 251
Date d'inscription : 02/11/2015

Revenir en haut Aller en bas

tirage aleatoire de données Empty Re: tirage aleatoire de données

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum