Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
question bête : variable quantitative discrète ou continue
2 participants
Page 1 sur 1
question bête : variable quantitative discrète ou continue
Bonjour à tous,
Je me retrouve complètement bête face à un jeu de données qui m'a été fourni. Je m'explique.
Il s'agit d'une concentration d'un élément chimique (ici le cobalt) mesuré dans l'urine, donc j'étais parti sur une variable continue. Or quand j'ai récupéré le jeu de données je me suis retrouvé avec surprise avec des "paquets" de concentrations mesurées avec plusieurs chiffres après la virgule et d'autres arrondies à l'unité.
La première chose à faire je pense est d'uniformiser et donc soit de tout arrondir soit de tout avoir avec plusieurs chiffres après la virgule.
La première option est la plus simple à mettre en œuvre mais dans ce cas je perds de l'information (?) et me demande si la variable peut toujours être considérée comme continue puisqu'elle ne prend plus que des valeurs entières ? doit on la considérer comme discrète dans ce cas ?
Si je me fie à la définition suivante on serait bien dans le cas d'une variable discrète : "Une variable aléatoire X est discrète si l'ensemble des valeurs qu'elle peut prendre est un ensemble numérique fini (c'est-à-dire comprenant un nombre fini d'éléments) ou un ensemble infini dénombrable (c'est-à-dire comprenant une infinité de nombres que l'on peut énumérer)."
Je dois faire une analyse de population sur cette variable et trouver le meilleur ajustement (habituellement à un loi normale). Dans ce cas vaut-il mieux que je conserve le caractère continue de la variable ou non ?
Merci d'avance pour vos réponses.
Je me retrouve complètement bête face à un jeu de données qui m'a été fourni. Je m'explique.
Il s'agit d'une concentration d'un élément chimique (ici le cobalt) mesuré dans l'urine, donc j'étais parti sur une variable continue. Or quand j'ai récupéré le jeu de données je me suis retrouvé avec surprise avec des "paquets" de concentrations mesurées avec plusieurs chiffres après la virgule et d'autres arrondies à l'unité.
La première chose à faire je pense est d'uniformiser et donc soit de tout arrondir soit de tout avoir avec plusieurs chiffres après la virgule.
La première option est la plus simple à mettre en œuvre mais dans ce cas je perds de l'information (?) et me demande si la variable peut toujours être considérée comme continue puisqu'elle ne prend plus que des valeurs entières ? doit on la considérer comme discrète dans ce cas ?
Si je me fie à la définition suivante on serait bien dans le cas d'une variable discrète : "Une variable aléatoire X est discrète si l'ensemble des valeurs qu'elle peut prendre est un ensemble numérique fini (c'est-à-dire comprenant un nombre fini d'éléments) ou un ensemble infini dénombrable (c'est-à-dire comprenant une infinité de nombres que l'on peut énumérer)."
Je dois faire une analyse de population sur cette variable et trouver le meilleur ajustement (habituellement à un loi normale). Dans ce cas vaut-il mieux que je conserve le caractère continue de la variable ou non ?
Merci d'avance pour vos réponses.
bloup- Nombre de messages : 41
Date d'inscription : 13/03/2012
Re: question bête : variable quantitative discrète ou continue
Bonjour.
Pourquoi uniformiser ?
Si les valeurs ont été recueillies de façons différentes suivant les cas, parfois fortement arrondies, parfois non, tu a seulement une série statistique mal recueillie.
la distinction discret/continu pour les variables statistiques est plus une question de traitement que de nature : Des variables discrètes par nature, mais dont le nombre de valeurs possibles est extrêmement grand (par exemple les déclarations de revenus, arrondies à l'euro près, de 0 à 10 milliards) seront traitées comme continues.
Mais en plus si tu veux faire un ajustement à un modèle continu (loi Normale), il serait malsain de partir sur l'idée que c'est discret, il n'y a plus d'ajustement possible.
Pour le traitement, tu ne peux rien faire de mieux que de conserver les valeurs, et de signaler l'hétérogénéité des données.
Cordialement.
Pourquoi uniformiser ?
Si les valeurs ont été recueillies de façons différentes suivant les cas, parfois fortement arrondies, parfois non, tu a seulement une série statistique mal recueillie.
la distinction discret/continu pour les variables statistiques est plus une question de traitement que de nature : Des variables discrètes par nature, mais dont le nombre de valeurs possibles est extrêmement grand (par exemple les déclarations de revenus, arrondies à l'euro près, de 0 à 10 milliards) seront traitées comme continues.
Mais en plus si tu veux faire un ajustement à un modèle continu (loi Normale), il serait malsain de partir sur l'idée que c'est discret, il n'y a plus d'ajustement possible.
Pour le traitement, tu ne peux rien faire de mieux que de conserver les valeurs, et de signaler l'hétérogénéité des données.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: question bête : variable quantitative discrète ou continue
Merci beaucoup pour ces précisions.
Donc arrondir et tenter un ajustement à une loi discrète n'est pas forcément la bonne approche si je comprends bien.
Grosso modo ma variable, si elle est arrondie pour n'être constituée que d'entiers naturels, peut prendre toutes les valeurs entre 0 et 1000. Je pense que c'est suffisant pour la traiter comme une variable continue, non ?
Donc arrondir et tenter un ajustement à une loi discrète n'est pas forcément la bonne approche si je comprends bien.
Grosso modo ma variable, si elle est arrondie pour n'être constituée que d'entiers naturels, peut prendre toutes les valeurs entre 0 et 1000. Je pense que c'est suffisant pour la traiter comme une variable continue, non ?
bloup- Nombre de messages : 41
Date d'inscription : 13/03/2012
Re: question bête : variable quantitative discrète ou continue
Effectivement.
mais encore une fois, pourquoi arrondir ?
mais encore une fois, pourquoi arrondir ?
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: question bête : variable quantitative discrète ou continue
Je trouvais que cela n'était pas forcément une bonne chose de mélanger données arrondies et données non arrondies.
Mais si tu me dis que cela ne pose pas de problème pour le traitement des données et l'ajustement j'abandonne de suite l'idée d'uniformiser.
Je ne suis pas statisticien de formation et me pose peut être des questions inutiles mais je préfère poser la question et avancer que de rester dans mon ignorance ou de faire n'importe quoi ;-)
Merci beaucoup pour ton aide. Il faut vraiment que je trouve à court terme une bonne formation pour renforcer mes connaissances. En attendant, as tu des bouquins (pas trop compliqués) de référence à me conseiller ?
Mais si tu me dis que cela ne pose pas de problème pour le traitement des données et l'ajustement j'abandonne de suite l'idée d'uniformiser.
Je ne suis pas statisticien de formation et me pose peut être des questions inutiles mais je préfère poser la question et avancer que de rester dans mon ignorance ou de faire n'importe quoi ;-)
Merci beaucoup pour ton aide. Il faut vraiment que je trouve à court terme une bonne formation pour renforcer mes connaissances. En attendant, as tu des bouquins (pas trop compliqués) de référence à me conseiller ?
bloup- Nombre de messages : 41
Date d'inscription : 13/03/2012
Re: question bête : variable quantitative discrète ou continue
Effectivement, "ce[la] n'[était]est pas forcément une bonne chose de mélanger données arrondies et données non arrondies". mais arrondir les données modifie la série qu'on a; aussi mal foutue soit elle, c'est celle qu'on a.
Pour des bouquins, je ne connais pas de livres récents (je suis sorti du circuit) simples, peut-être des ouvrages pour AES ou sciences éco. Ceux de statistiques descriptives (j'ai un bon manuel de Bernard Py, par exemple, qui date de 25 ans).
Pour des stats plus larges, on trouve sans doute dans les BU le Wonnacott et Wonnacott, ou quelques ouvrages de Baillargeon. Il y a bien sûr l'incontournable "Probabilités, analyse des données et Statistiques" de Saporta.
Pour les analyse de laboratoire, il y a aussi un bouquin très profond, mais difficile à lire de Michèle Neuilly : "Modélisation et estimation des erreurs de mesure" au Cetama.
Cordialement.
Pour des bouquins, je ne connais pas de livres récents (je suis sorti du circuit) simples, peut-être des ouvrages pour AES ou sciences éco. Ceux de statistiques descriptives (j'ai un bon manuel de Bernard Py, par exemple, qui date de 25 ans).
Pour des stats plus larges, on trouve sans doute dans les BU le Wonnacott et Wonnacott, ou quelques ouvrages de Baillargeon. Il y a bien sûr l'incontournable "Probabilités, analyse des données et Statistiques" de Saporta.
Pour les analyse de laboratoire, il y a aussi un bouquin très profond, mais difficile à lire de Michèle Neuilly : "Modélisation et estimation des erreurs de mesure" au Cetama.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: question bête : variable quantitative discrète ou continue
Merci beaucoup.
Je vais regarder tout ça.
Je vais regarder tout ça.
bloup- Nombre de messages : 41
Date d'inscription : 13/03/2012
Sujets similaires
» démographie: Variable quantitative discrète ou continue?
» Corrélation entre variable continue et variable discrète
» Variable quantitative discrète
» indicateur = variable continue ?
» Décomposer une variable quantitative en variable qualitative
» Corrélation entre variable continue et variable discrète
» Variable quantitative discrète
» indicateur = variable continue ?
» Décomposer une variable quantitative en variable qualitative
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum