Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Le Deal du moment :
KTC Écran PC Gaming 24″ (1920 x 1080) ...
Voir le deal
67.39 €

Probabilité dans R

2 participants

Aller en bas

Probabilité dans R Empty Probabilité dans R

Message par preliator Dim 7 Avr 2019 - 11:01

Bonjour à tous,
J'utilise un fichier de donnée qui étudie la population francaise de 1982 à nos jours. Pour chaque année, la population au 1er janvier, le nombre de personne vivante, le nombre de décès. Télécharger ici :

J'aimerais pouvoir trouver les valeurs possible en 2019, 2020, etc. Anticiper avec des probabilités en quelques sortes. Je connais 2 techniques, mais elles me proposent 2 résultats différents, et j'aimerais savoir laquelle prendre.

Première technique :

Code:

reg <- lm(data$Solde ~ Rang , data = data ) #Création de la courbe

coeff=coefficients(reg) #Récupération de l'équation de la courbe; je trouve y = -451.6*x + 251744.9

predict(reg, newdata = data.frame( Rang = nrow(data)+ 1 )) #Afficher la valeur de l'année n + 1, soit 2019. [B]Je trouve un solde de 234584.7[/B]


Deuxième technique; utilisation du package "forecast" :

Code:

library(forecast)

arima <- auto.arima(ts(data$Solde, start = 1982, frequency = 1))

predict(arima)$pred #La, je trouve [1] 159494.4

forecast( arima , h = 1)

Conclusion, la première technique qui reprend complètement l'équation de la droite, m'affiche un solde de 234584.7 pour l'année 2019

La deuxième technique qui utilise je ne sais quel algorytme, m'affiche :

Point Forecast    Lo 80    Hi 80    Lo 95    Hi 95
2019       159494.4 129879.6 189109.3 114202.4 204786.4


Lequel croire ? Smile

preliator

Nombre de messages : 42
Date d'inscription : 01/04/2019

Revenir en haut Aller en bas

Probabilité dans R Empty Re: Probabilité dans R

Message par preliator Jeu 16 Mai 2019 - 17:54

aie

preliator

Nombre de messages : 42
Date d'inscription : 01/04/2019

Revenir en haut Aller en bas

Probabilité dans R Empty Re: Probabilité dans R

Message par falques Lun 3 Juin 2019 - 13:36

Normalement il est important de tester avant sur des données déjà connus, par exemple exclu l'année 2018 de tes données ainsi tu pourras la prédire et voir quel méthode à les meilleurs résultat.

falques

Nombre de messages : 14
Date d'inscription : 07/05/2019

Revenir en haut Aller en bas

Probabilité dans R Empty Re: Probabilité dans R

Message par preliator Lun 3 Juin 2019 - 13:44

Merci, je regarderai ça.

J'imagine qu'il faut aussi que cette variable suive une loi normale ?

preliator

Nombre de messages : 42
Date d'inscription : 01/04/2019

Revenir en haut Aller en bas

Probabilité dans R Empty Re: Probabilité dans R

Message par falques Lun 3 Juin 2019 - 13:51

La fonction lm par exemple se base sur des données linéaires :
Si tu regarde la population par rapport à l’année tu devrait avoir une courbe relativement droite.

Sinon il faut surement transformer tes données pour arriver à ce type de droite.

Les données ne doivent pas êtres normales mais les résidus de la régression doivent eux l'être (erreur de prédiction)

falques

Nombre de messages : 14
Date d'inscription : 07/05/2019

Revenir en haut Aller en bas

Probabilité dans R Empty Re: Probabilité dans R

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut


 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum