Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Quartiles
3 participants
Page 1 sur 1
Quartiles
Bonjour,
J'ai calculé les quartiles d'une variable Age selon une variable à 2 modalité
Cordialement
J'ai calculé les quartiles d'une variable Age selon une variable à 2 modalité
- Code:
> tapply(data$AGE,data$v2,quantile)
$`0`
0% 25% 50% 75% 100%
26.00 53.25 60.50 70.75 91.00
$`1`
0% 25% 50% 75% 100%
9.0 51.5 67.0 77.5 87.0
Cordialement
toussaZK- Nombre de messages : 81
Date d'inscription : 02/06/2014
Re: Quartiles
Bonjour,
oui ça peut être normal, tout dépend de la méthode utilisé pour calculer les quartiles. Il peut y avoir une interpolation linéaire qui peut générer ces décimales. Si tu regardes l'aide de la fonction quantile, tu verras qu'avec cette fonction tu as au moins 9 manières différentes de calculer des quantiles. Moralité même si la définition d'un quantile est claire, en pratique leurs estimations peuvent différer d'une méthode à l'autre. C'est d'autant plus vrai que le jeu de données est petit.
cdlt
oui ça peut être normal, tout dépend de la méthode utilisé pour calculer les quartiles. Il peut y avoir une interpolation linéaire qui peut générer ces décimales. Si tu regardes l'aide de la fonction quantile, tu verras qu'avec cette fonction tu as au moins 9 manières différentes de calculer des quantiles. Moralité même si la définition d'un quantile est claire, en pratique leurs estimations peuvent différer d'une méthode à l'autre. C'est d'autant plus vrai que le jeu de données est petit.
cdlt
Dernière édition par droopy le Ven 27 Jan 2017 - 9:56, édité 1 fois
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Quartiles
Merci pour votre réponse.
Quelle est la méthode la plus pertinente à utiliser ?
Quelle est la méthode la plus pertinente à utiliser ?
toussaZK- Nombre de messages : 81
Date d'inscription : 02/06/2014
Re: Quartiles
je n'ai pas la réponse à cette question, je prends toujours la méthode par défaut.
cdlt
cdlt
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Quartiles
ca sera juste d'arrondir les valeurs ? pour tomber sur des quartiles en entier ?
toussaZK- Nombre de messages : 81
Date d'inscription : 02/06/2014
Re: Quartiles
"Juste" ça dépend du point de vue. Par rapport à la méthode utilisée pour leurs calculs ça ne le sera pas. Si ces valeurs ne te semblent pas correctes, alors essaie les autres estimations par exemple le type 3 qui correspond aux quantiles de SAS.
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Quartiles
Du moment que tu as une répartition des données 25-25-25-25, toutes les valeurs frontières quelle que soit la méthode de calcul sont justes.
Si tu arrondis un résultat, ca peut être faux.
ex: je calcule la médiane de 1-110-111-200. Dans ce cas, on calcule basiquement la médiane en faisant la moyenne des 2 valeurs 110 et 111. soit 110.5
J'ai bien 2 valeurs au dessus et 2 valeurs au dessous. C'est bien la médiane.
Imagine faire n'importe quel calcul qui te donne un chiffre entre 110 et 111 (bornes exclues), tu auras toujours 2 valeurs au dessous et 2 valeurs au dessus.
Si j'arrondis à 110, j'ai 1 valeur au dessous et 2 valeurs au dessus. Ca ne correspond plus à la définition de la médiane.
Si tu arrondis un résultat, ca peut être faux.
ex: je calcule la médiane de 1-110-111-200. Dans ce cas, on calcule basiquement la médiane en faisant la moyenne des 2 valeurs 110 et 111. soit 110.5
J'ai bien 2 valeurs au dessus et 2 valeurs au dessous. C'est bien la médiane.
Imagine faire n'importe quel calcul qui te donne un chiffre entre 110 et 111 (bornes exclues), tu auras toujours 2 valeurs au dessous et 2 valeurs au dessus.
Si j'arrondis à 110, j'ai 1 valeur au dessous et 2 valeurs au dessus. Ca ne correspond plus à la définition de la médiane.
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Re: Quartiles
je me suis amusé avec ton exemple et voilà ce que ça peut donner selon les types de quantiles utilisés (parmi les 9 disponibles dans R) :
cdlt
- Code:
x <- c(1, 110, 111, 200)
sapply(1:9, function(u) quantile(x, type = u))
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9]
0% 1 1.0 1 1 1.0 1.00 1.00 1.00000 1.0000
25% 1 55.5 1 1 55.5 28.25 82.75 46.41667 48.6875
50% 110 110.5 110 110 110.5 110.50 110.50 110.50000 110.5000
75% 111 155.5 111 111 155.5 177.75 133.25 162.91667 161.0625
100% 200 200.0 200 200 200.0 200.00 200.00 200.00000 200.0000
100% 200 200.0 200 200 200.0 200.00 200.00 200.00000 200.0000
cdlt
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Quartiles
Je vous remercie pour cet exemple
toussaZK- Nombre de messages : 81
Date d'inscription : 02/06/2014
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|