Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Statistique sur le nombre de morts en France sur 80 ans
2 participants
Page 1 sur 1
Statistique sur le nombre de morts en France sur 80 ans
Bonjour à tous,
Je dispose d'un fichier CSV décrivant le nombre de morts en France par année, de 1946 à nos jours. C'est un fichier CSV avec un champ correspondant à l'année, et un autre champ correspondant au nombre de morts cette année.
J'aimerais faire un maximum d'études sur ces données, (par exemple, pouvoir anticiper le nombre de nombre en 2020), malheureusement je suis à court d'idée.
J'ai déjà calculé la médiane, et les coefficients de morts par année. J'aimerais faire d'autre choses, que puis faire comme étude avec ce genre de donnée ?
Merci à vous.
Je dispose d'un fichier CSV décrivant le nombre de morts en France par année, de 1946 à nos jours. C'est un fichier CSV avec un champ correspondant à l'année, et un autre champ correspondant au nombre de morts cette année.
J'aimerais faire un maximum d'études sur ces données, (par exemple, pouvoir anticiper le nombre de nombre en 2020), malheureusement je suis à court d'idée.
J'ai déjà calculé la médiane, et les coefficients de morts par année. J'aimerais faire d'autre choses, que puis faire comme étude avec ce genre de donnée ?
Merci à vous.
preliator- Nombre de messages : 42
Date d'inscription : 01/04/2019
Re: Statistique sur le nombre de morts en France sur 80 ans
Bonjour,
As-tu d'autres variables que le nombre de morts et l'année dans ton fichier (des variables qui pourraient expliquer pourquoi il y a un nombre élevé ou faible de morts).
Si non, tu peux faire un modèle du nombre de morts en fonction de l'année, faire un scatter-plot en croisant ces deux variables mais le modèle risque d'être très faible étant donné que tu as peu de variables pour expliquer ta variable "nombre de morts". Le modèle te permettra de "prédire" (avec peu de certitude) le nombre de morts en 2020.
Tu utilises un autre logiciel qu'Excel ?
As-tu d'autres variables que le nombre de morts et l'année dans ton fichier (des variables qui pourraient expliquer pourquoi il y a un nombre élevé ou faible de morts).
Si non, tu peux faire un modèle du nombre de morts en fonction de l'année, faire un scatter-plot en croisant ces deux variables mais le modèle risque d'être très faible étant donné que tu as peu de variables pour expliquer ta variable "nombre de morts". Le modèle te permettra de "prédire" (avec peu de certitude) le nombre de morts en 2020.
Tu utilises un autre logiciel qu'Excel ?
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: Statistique sur le nombre de morts en France sur 80 ans
Merci de ta réponse. J'ai oublié de le préciser, mais il n'y a que 2 champs (année, et nombre de morts), mais la longueur de ce CSV est de plus de 800 données. C'est pour ça que je suis super motivé à faire plein d'études la dessus !
Merci pour cette piste, je ne connaissais pas le scatter-plot.
J'utilise R justement pour ces études. J'ai décidé de laisser de coté Excel.
Merci pour cette piste, je ne connaissais pas le scatter-plot.
J'utilise R justement pour ces études. J'ai décidé de laisser de coté Excel.
preliator- Nombre de messages : 42
Date d'inscription : 01/04/2019
Re: Statistique sur le nombre de morts en France sur 80 ans
Oui en effet, j'avais oublié que tu avais posté ce message dans la rubrique R...
Alors je ne sais pas ce que tu comprends par faire plein d'études sur ce jeu de données mais tu peux étudier plusieurs objectifs sur ce jeu de données même si tu as seulement 2 variables.
Par exemple tu pourrais couper ton jeu de données par période si ça répond à un objectif.
Tu peux créer des graphiques temporels.
Tu peux faire un modèle prédictif (faible).
Dans quel contexte es-tu amené à travailler sur ce jeu de données ?
Est-ce que tu as des objectifs définis sur ton jeu de données ?
Tu as plusieurs fois des mesures de "nombre de morts" pour chaque année ?
Alors je ne sais pas ce que tu comprends par faire plein d'études sur ce jeu de données mais tu peux étudier plusieurs objectifs sur ce jeu de données même si tu as seulement 2 variables.
Par exemple tu pourrais couper ton jeu de données par période si ça répond à un objectif.
Tu peux créer des graphiques temporels.
Tu peux faire un modèle prédictif (faible).
Dans quel contexte es-tu amené à travailler sur ce jeu de données ?
Est-ce que tu as des objectifs définis sur ton jeu de données ?
Je ne comprends pas, comment tu calcules la médiane de morts par année si tu as une variable nombre de morts sur chaque année ?preliator a écrit:J'ai déjà calculé la médiane, et les coefficients de morts par année
Tu as plusieurs fois des mesures de "nombre de morts" pour chaque année ?
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: Statistique sur le nombre de morts en France sur 80 ans
Merci pour toute ces pistes, je débute vraiment sur R et sur les stats.
Je suis amené à faire ce travail tout simplement pour m'autoformer sur R. Je récupère des données sur le site de l'INSEE, et fais toute les études que je suis capable de faire sur ces dernière. En soit, j'ai pas vraiment d'objectif, juste pour m'évaluer.
Pour la médiane, j'ai simplement appliqué un summary pour la trouver ^^
Je suis amené à faire ce travail tout simplement pour m'autoformer sur R. Je récupère des données sur le site de l'INSEE, et fais toute les études que je suis capable de faire sur ces dernière. En soit, j'ai pas vraiment d'objectif, juste pour m'évaluer.
Pour la médiane, j'ai simplement appliqué un summary pour la trouver ^^
preliator- Nombre de messages : 42
Date d'inscription : 01/04/2019
Sujets similaires
» X²: nombre ou %?
» ACP et le nombre d'observations ?
» Nombre de combinaisons
» nombre d'axes factoriels
» nombre de régresseurs maximum
» ACP et le nombre d'observations ?
» Nombre de combinaisons
» nombre d'axes factoriels
» nombre de régresseurs maximum
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|