Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Probabilité dans R
2 participants
Page 1 sur 1
Probabilité dans R
Bonjour à tous,
J'utilise un fichier de donnée qui étudie la population francaise de 1982 à nos jours. Pour chaque année, la population au 1er janvier, le nombre de personne vivante, le nombre de décès. Télécharger ici :
J'aimerais pouvoir trouver les valeurs possible en 2019, 2020, etc. Anticiper avec des probabilités en quelques sortes. Je connais 2 techniques, mais elles me proposent 2 résultats différents, et j'aimerais savoir laquelle prendre.
Première technique :
Deuxième technique; utilisation du package "forecast" :
Conclusion, la première technique qui reprend complètement l'équation de la droite, m'affiche un solde de 234584.7 pour l'année 2019
La deuxième technique qui utilise je ne sais quel algorytme, m'affiche :
Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
2019 159494.4 129879.6 189109.3 114202.4 204786.4
Lequel croire ?
J'utilise un fichier de donnée qui étudie la population francaise de 1982 à nos jours. Pour chaque année, la population au 1er janvier, le nombre de personne vivante, le nombre de décès. Télécharger ici :
J'aimerais pouvoir trouver les valeurs possible en 2019, 2020, etc. Anticiper avec des probabilités en quelques sortes. Je connais 2 techniques, mais elles me proposent 2 résultats différents, et j'aimerais savoir laquelle prendre.
Première technique :
- Code:
reg <- lm(data$Solde ~ Rang , data = data ) #Création de la courbe
coeff=coefficients(reg) #Récupération de l'équation de la courbe; je trouve y = -451.6*x + 251744.9
predict(reg, newdata = data.frame( Rang = nrow(data)+ 1 )) #Afficher la valeur de l'année n + 1, soit 2019. [B]Je trouve un solde de 234584.7[/B]
Deuxième technique; utilisation du package "forecast" :
- Code:
library(forecast)
arima <- auto.arima(ts(data$Solde, start = 1982, frequency = 1))
predict(arima)$pred #La, je trouve [1] 159494.4
forecast( arima , h = 1)
Conclusion, la première technique qui reprend complètement l'équation de la droite, m'affiche un solde de 234584.7 pour l'année 2019
La deuxième technique qui utilise je ne sais quel algorytme, m'affiche :
Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
2019 159494.4 129879.6 189109.3 114202.4 204786.4
Lequel croire ?
preliator- Nombre de messages : 42
Date d'inscription : 01/04/2019
Re: Probabilité dans R
Normalement il est important de tester avant sur des données déjà connus, par exemple exclu l'année 2018 de tes données ainsi tu pourras la prédire et voir quel méthode à les meilleurs résultat.
falques- Nombre de messages : 14
Date d'inscription : 07/05/2019
Re: Probabilité dans R
Merci, je regarderai ça.
J'imagine qu'il faut aussi que cette variable suive une loi normale ?
J'imagine qu'il faut aussi que cette variable suive une loi normale ?
preliator- Nombre de messages : 42
Date d'inscription : 01/04/2019
Re: Probabilité dans R
La fonction lm par exemple se base sur des données linéaires :
Si tu regarde la population par rapport à l’année tu devrait avoir une courbe relativement droite.
Sinon il faut surement transformer tes données pour arriver à ce type de droite.
Les données ne doivent pas êtres normales mais les résidus de la régression doivent eux l'être (erreur de prédiction)
Si tu regarde la population par rapport à l’année tu devrait avoir une courbe relativement droite.
Sinon il faut surement transformer tes données pour arriver à ce type de droite.
Les données ne doivent pas êtres normales mais les résidus de la régression doivent eux l'être (erreur de prédiction)
falques- Nombre de messages : 14
Date d'inscription : 07/05/2019
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum