Les posteurs les plus actifs de la semaine
Eric Wajnberg
 
mvergnat
 
zezima
 
Florent Aubry
 
c@ssoulet
 
fmachou
 
adri6666
 
Nik
 
Aeelim
 
Kouakakou
 


Quartiles

Voir le sujet précédent Voir le sujet suivant Aller en bas

Quartiles

Message par toussaZK le Ven 27 Jan 2017 - 9:16

Bonjour,
J'ai calculé les quartiles d'une variable Age selon une variable à 2 modalité

Code:

> tapply(data$AGE,data$v2,quantile)
$`0`
  0%  25%  50%  75%  100%
26.00 53.25 60.50 70.75 91.00

$`1`
  0%  25%  50%  75% 100%
 9.0 51.5 67.0 77.5 87.0
sachant que AGE ne contient que des entiers, est ce que c'est normal que le 1 er et le 3 quartile contiennent des virgules ( exemple pour 0 : le 3eme quartile =70.75 ) ?

Cordialement

toussaZK

Nombre de messages : 81
Date d'inscription : 02/06/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Quartiles

Message par droopy le Ven 27 Jan 2017 - 9:31

Bonjour,

oui ça peut être normal, tout dépend de la méthode utilisé pour calculer les quartiles. Il peut y avoir une interpolation linéaire qui peut générer ces décimales. Si tu regardes l'aide de la fonction quantile, tu verras qu'avec cette fonction tu as au moins 9 manières différentes de calculer des quantiles. Moralité même si la définition d'un quantile est claire, en pratique leurs estimations peuvent différer d'une méthode à l'autre. C'est d'autant plus vrai que le jeu de données est petit.

cdlt


Dernière édition par droopy le Ven 27 Jan 2017 - 9:56, édité 1 fois
avatar
droopy

Nombre de messages : 1069
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Quartiles

Message par toussaZK le Ven 27 Jan 2017 - 9:33

Merci pour votre réponse.
Quelle est la méthode la plus pertinente à utiliser ?

toussaZK

Nombre de messages : 81
Date d'inscription : 02/06/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Quartiles

Message par droopy le Ven 27 Jan 2017 - 9:54

je n'ai pas la réponse à cette question, je prends toujours la méthode par défaut.
cdlt
avatar
droopy

Nombre de messages : 1069
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Quartiles

Message par toussaZK le Ven 27 Jan 2017 - 10:36

ca sera juste d'arrondir les valeurs ? pour tomber sur des quartiles en entier ?

toussaZK

Nombre de messages : 81
Date d'inscription : 02/06/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Quartiles

Message par droopy le Ven 27 Jan 2017 - 10:46

"Juste" ça dépend du point de vue. Par rapport à la méthode utilisée pour leurs calculs ça ne le sera pas. Si ces valeurs ne te semblent pas correctes, alors essaie les autres estimations par exemple le type 3 qui correspond aux quantiles de SAS.
avatar
droopy

Nombre de messages : 1069
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Quartiles

Message par c@ssoulet le Ven 27 Jan 2017 - 12:42

Du moment que tu as une répartition des données 25-25-25-25, toutes les valeurs frontières quelle que soit la méthode de calcul sont justes.

Si tu arrondis un résultat, ca peut être faux.

ex: je calcule la médiane de 1-110-111-200. Dans ce cas, on calcule basiquement la médiane en faisant la moyenne des 2 valeurs 110 et 111. soit 110.5

J'ai bien 2 valeurs au dessus et 2 valeurs au dessous. C'est bien la médiane.

Imagine faire n'importe quel calcul qui te donne un chiffre entre 110 et 111 (bornes exclues), tu auras toujours 2 valeurs au dessous et 2 valeurs au dessus.

Si j'arrondis à 110, j'ai 1 valeur au dessous et 2 valeurs au dessus. Ca ne correspond plus à la définition de la médiane.

c@ssoulet

Nombre de messages : 752
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Quartiles

Message par droopy le Ven 27 Jan 2017 - 12:50

je me suis amusé avec ton exemple et voilà ce que ça peut donner selon les types de quantiles utilisés (parmi les 9 disponibles dans R) :
Code:
x <- c(1, 110, 111, 200)
sapply(1:9, function(u) quantile(x, type = u))
     [,1]  [,2] [,3] [,4]  [,5]   [,6]   [,7]      [,8]     [,9]
0%      1  1.0    1    1  1.0  1.00  1.00  1.00000  1.0000
25%    1  55.5    1    1  55.5  28.25  82.75  46.41667  48.6875
50%  110 110.5  110  110 110.5 110.50 110.50 110.50000 110.5000
75%  111 155.5  111  111 155.5 177.75 133.25 162.91667 161.0625
100%  200 200.0  200  200 200.0 200.00 200.00 200.00000 200.0000
100%  200 200.0  200  200 200.0 200.00 200.00 200.00000 200.0000
Certaines méthodes donne des médianes à 110. Ces histoires de quartiles c'est toujours déroutant, surtout avec très peu de données.

cdlt
avatar
droopy

Nombre de messages : 1069
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Quartiles

Message par toussaZK le Ven 27 Jan 2017 - 13:11

Je vous remercie pour cet exemple

toussaZK

Nombre de messages : 81
Date d'inscription : 02/06/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Quartiles

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum