Séries temporelles et Modèle ARIMA

Voir le sujet précédent Voir le sujet suivant Aller en bas

Séries temporelles et Modèle ARIMA

Message par maritexas le Jeu 16 Mai 2013 - 7:57

Bonjour,

Dans le cadre d’un projet de recherche, j’ai pour objectif construire un modèle de prévision pour quelques paramètres de qualité de l’eau d’une rivière.

Je dispose de deux années de données au pas de temps horaire. Donc, une année pour la construction du modèle et la deuxième pour simulation et validation du modèle.

L’intérêt c’est à chaque jour reprendre les dernières valeurs enregistrées et faire une prévision pour le lendemain (donc à un horizon de 24 heures= 24 pas de temps).

On s’intéresse spécialement aux épisodes les plus critiques, cad, pour la turbidité par exemple on s’intéresse aux valeurs > 15 FNU (unité de mesure de la turbidité).

On a décidé, dans un premier temps, de construire un modèle du type ARIMA(p,d,q). Et donc je commencé à me poser quelques questions. En espérant que vous pouvez m’aidez…

1) Est-ce qu’il serait correct d’utiliser pour la construction du modèle seulement les valeurs supérieurs à 15 (FNU) et en remplacement les autres valeurs par « NA » ? On aurait ainsi une série temporelle non continue, avec des valeurs manquantes.

2) On utilise le critère d’Akaike (AIC) pour la sélection du meilleur modèle ,cad, pour le choix des ordres p et q du modèle. J’ai calculé (à travers le logiciel R) l’AIC pour tous les modèle possibles en faisant p varier de 0 à 24 et q varier de 0 à 24 (avec d fixe =1). On a ainsi 625 modèles possibles. Ceux qui possèdent l’AIC le plus petit sont les modèles d’ordre élevé, le meilleur est par exemple l’ARIMA (18,1,11).
J’ai fait une petite recherche et j’ai vu qu’en général l’ordre de ce type de modèle est beaucoup plus petite que ça, mais je n’ai pas trouvé des exemples de modèles construits avec des données horaires. Je me demande s’il y a du sens de choisir de modèles d’ordre élevé en se basant sur l’AIC.

3) En ce qui concerne la saisonnalité : à priori les valeurs les plus élevées sont concentrées en hiver et donc on pourrait dire que la série possède une saisonnalité annuelle. Est-ce qu’il est possible de construire un modèle SARIMA de saisonnalité annuelle avec des données horaires (cad on aurait ces cycles que se repetent à chaque 8760 pas de temps) ?
Je pense que de toute façon dans mon cas il n’est pas possible de construire ce type de modèle parce que je dispose d’une seule année pour la construction.


Merci d’avance,

Marina

maritexas

Nombre de messages : 2
Date d'inscription : 16/05/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Séries temporelles et Modèle ARIMA

Message par niaboc le Jeu 16 Mai 2013 - 20:22

maritexas a écrit:
1) Est-ce qu’il serait correct d’utiliser pour la construction du modèle seulement les valeurs supérieurs à 15 (FNU) et en remplacement les autres valeurs par « NA » ? On aurait ainsi une série temporelle non continue, avec des valeurs manquantes.

Non, pas pour un modèle ARIMA. Mais si tes variables supérieurs à 15 appraissent selon une loi temporelle, tu le verras dans ton modèle.

maritexas a écrit:
2) On utilise le critère d’Akaike (AIC) pour la sélection du meilleur modèle ,cad, pour le choix des ordres p et q du modèle. J’ai calculé (à travers le logiciel R) l’AIC pour tous les modèle possibles en faisant p varier de 0 à 24 et q varier de 0 à 24 (avec d fixe =1). On a ainsi 625 modèles possibles. Ceux qui possèdent l’AIC le plus petit sont les modèles d’ordre élevé, le meilleur est par exemple l’ARIMA (18,1,11).
J’ai fait une petite recherche et j’ai vu qu’en général l’ordre de ce type de modèle est beaucoup plus petite que ça, mais je n’ai pas trouvé des exemples de modèles construits avec des données horaires. Je me demande s’il y a du sens de choisir de modèles d’ordre élevé en se basant sur l’AIC.


Utilise les autocorrélogrammes et autocorrélogrammes partiels pour déterminer les paramètres de l'ARIMA. Il faut avoir un modèle interprétable quand même... c'est sûr que le 18,1,11 est le meilleur mathématiquement, mais il est surement pas assez robuste (il colle trop aux données sur lequel tu construits) je pense.


maritexas a écrit:
3) En ce qui concerne la saisonnalité : à priori les valeurs les plus élevées sont concentrées en hiver et donc on pourrait dire que la série possède une saisonnalité annuelle. Est-ce qu’il est possible de construire un modèle SARIMA de saisonnalité annuelle avec des données horaires (cad on aurait ces cycles que se repetent à chaque 8760 pas de temps) ?
Je pense que de toute façon dans mon cas il n’est pas possible de construire ce type de modèle parce que je dispose d’une seule année pour la construction.

effectivement avec une seule année, tu ne verras pas la saisonnalité.
A ta place j'aurai pris les 2 années pour le construire, puis j'aurai vérifié le modèle plus tard, à l'obtention de nouvelles données...

Niaboc

niaboc

Nombre de messages : 865
Age : 29
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Séries temporelles et Modèle ARIMA

Message par maritexas le Ven 17 Mai 2013 - 12:34

Merci pour ta réponse Niaboc.

j'avais essayé, dans un prémier temps, d'interpréter les corrélogrammes. Mais j'ai eu du mal parce qu'il y a un nombre assez élévé de données en dehors de l'intervale de confiance ( et cela n'est pas lié à une possible saisonnalité).

Le fichier ci-joint affiche les corrélogrammes de ma série déjà differentiée.

D'après Box and Jenkins: "En général, pour un processus stationnaire ARMA (p,q) la fonction d'autocorrélation a une décroissance exponentielle ou oscillatoire après le déphasage q tandis que la fonction d’autocorrélation partiale suit le même type de comportement après le déphasage p."

Dans ce cas, je pourrais prendre comme valeurs initales
p= 5
q= 8

c'est bien ça?

Merci d'avance,

MArina
Fichiers joints
acf et pacf.JPG Vous n'avez pas la permission de télécharger les fichiers joints.(39 Ko) Téléchargé 3 fois

maritexas

Nombre de messages : 2
Date d'inscription : 16/05/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Séries temporelles et Modèle ARIMA

Message par niaboc le Ven 17 Mai 2013 - 15:32

Tu peux essayer ça aussi (test quelques modèles):
p=3
q=2


en fait je pense à p=3 pour pour le côté MA(q), tu pourrais tester un q de 2 à 6, voire 7 je pense.

De mémoire il est préférable de tester d'abord le MA(q) et de ressortir les autocorrélogrammes pour fixer l'AR(p) si tu y vas à tâtons.

niaboc

Nombre de messages : 865
Age : 29
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Séries temporelles et Modèle ARIMA

Message par Contenu sponsorisé Aujourd'hui à 0:11


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum