Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Séries temporelles et Modèle ARIMA
2 participants
Page 1 sur 1
Séries temporelles et Modèle ARIMA
Bonjour,
Dans le cadre d’un projet de recherche, j’ai pour objectif construire un modèle de prévision pour quelques paramètres de qualité de l’eau d’une rivière.
Je dispose de deux années de données au pas de temps horaire. Donc, une année pour la construction du modèle et la deuxième pour simulation et validation du modèle.
L’intérêt c’est à chaque jour reprendre les dernières valeurs enregistrées et faire une prévision pour le lendemain (donc à un horizon de 24 heures= 24 pas de temps).
On s’intéresse spécialement aux épisodes les plus critiques, cad, pour la turbidité par exemple on s’intéresse aux valeurs > 15 FNU (unité de mesure de la turbidité).
On a décidé, dans un premier temps, de construire un modèle du type ARIMA(p,d,q). Et donc je commencé à me poser quelques questions. En espérant que vous pouvez m’aidez…
1) Est-ce qu’il serait correct d’utiliser pour la construction du modèle seulement les valeurs supérieurs à 15 (FNU) et en remplacement les autres valeurs par « NA » ? On aurait ainsi une série temporelle non continue, avec des valeurs manquantes.
2) On utilise le critère d’Akaike (AIC) pour la sélection du meilleur modèle ,cad, pour le choix des ordres p et q du modèle. J’ai calculé (à travers le logiciel R) l’AIC pour tous les modèle possibles en faisant p varier de 0 à 24 et q varier de 0 à 24 (avec d fixe =1). On a ainsi 625 modèles possibles. Ceux qui possèdent l’AIC le plus petit sont les modèles d’ordre élevé, le meilleur est par exemple l’ARIMA (18,1,11).
J’ai fait une petite recherche et j’ai vu qu’en général l’ordre de ce type de modèle est beaucoup plus petite que ça, mais je n’ai pas trouvé des exemples de modèles construits avec des données horaires. Je me demande s’il y a du sens de choisir de modèles d’ordre élevé en se basant sur l’AIC.
3) En ce qui concerne la saisonnalité : à priori les valeurs les plus élevées sont concentrées en hiver et donc on pourrait dire que la série possède une saisonnalité annuelle. Est-ce qu’il est possible de construire un modèle SARIMA de saisonnalité annuelle avec des données horaires (cad on aurait ces cycles que se repetent à chaque 8760 pas de temps) ?
Je pense que de toute façon dans mon cas il n’est pas possible de construire ce type de modèle parce que je dispose d’une seule année pour la construction.
Merci d’avance,
Marina
Dans le cadre d’un projet de recherche, j’ai pour objectif construire un modèle de prévision pour quelques paramètres de qualité de l’eau d’une rivière.
Je dispose de deux années de données au pas de temps horaire. Donc, une année pour la construction du modèle et la deuxième pour simulation et validation du modèle.
L’intérêt c’est à chaque jour reprendre les dernières valeurs enregistrées et faire une prévision pour le lendemain (donc à un horizon de 24 heures= 24 pas de temps).
On s’intéresse spécialement aux épisodes les plus critiques, cad, pour la turbidité par exemple on s’intéresse aux valeurs > 15 FNU (unité de mesure de la turbidité).
On a décidé, dans un premier temps, de construire un modèle du type ARIMA(p,d,q). Et donc je commencé à me poser quelques questions. En espérant que vous pouvez m’aidez…
1) Est-ce qu’il serait correct d’utiliser pour la construction du modèle seulement les valeurs supérieurs à 15 (FNU) et en remplacement les autres valeurs par « NA » ? On aurait ainsi une série temporelle non continue, avec des valeurs manquantes.
2) On utilise le critère d’Akaike (AIC) pour la sélection du meilleur modèle ,cad, pour le choix des ordres p et q du modèle. J’ai calculé (à travers le logiciel R) l’AIC pour tous les modèle possibles en faisant p varier de 0 à 24 et q varier de 0 à 24 (avec d fixe =1). On a ainsi 625 modèles possibles. Ceux qui possèdent l’AIC le plus petit sont les modèles d’ordre élevé, le meilleur est par exemple l’ARIMA (18,1,11).
J’ai fait une petite recherche et j’ai vu qu’en général l’ordre de ce type de modèle est beaucoup plus petite que ça, mais je n’ai pas trouvé des exemples de modèles construits avec des données horaires. Je me demande s’il y a du sens de choisir de modèles d’ordre élevé en se basant sur l’AIC.
3) En ce qui concerne la saisonnalité : à priori les valeurs les plus élevées sont concentrées en hiver et donc on pourrait dire que la série possède une saisonnalité annuelle. Est-ce qu’il est possible de construire un modèle SARIMA de saisonnalité annuelle avec des données horaires (cad on aurait ces cycles que se repetent à chaque 8760 pas de temps) ?
Je pense que de toute façon dans mon cas il n’est pas possible de construire ce type de modèle parce que je dispose d’une seule année pour la construction.
Merci d’avance,
Marina
maritexas- Nombre de messages : 2
Date d'inscription : 16/05/2013
Re: Séries temporelles et Modèle ARIMA
maritexas a écrit:
1) Est-ce qu’il serait correct d’utiliser pour la construction du modèle seulement les valeurs supérieurs à 15 (FNU) et en remplacement les autres valeurs par « NA » ? On aurait ainsi une série temporelle non continue, avec des valeurs manquantes.
Non, pas pour un modèle ARIMA. Mais si tes variables supérieurs à 15 appraissent selon une loi temporelle, tu le verras dans ton modèle.
maritexas a écrit:
2) On utilise le critère d’Akaike (AIC) pour la sélection du meilleur modèle ,cad, pour le choix des ordres p et q du modèle. J’ai calculé (à travers le logiciel R) l’AIC pour tous les modèle possibles en faisant p varier de 0 à 24 et q varier de 0 à 24 (avec d fixe =1). On a ainsi 625 modèles possibles. Ceux qui possèdent l’AIC le plus petit sont les modèles d’ordre élevé, le meilleur est par exemple l’ARIMA (18,1,11).
J’ai fait une petite recherche et j’ai vu qu’en général l’ordre de ce type de modèle est beaucoup plus petite que ça, mais je n’ai pas trouvé des exemples de modèles construits avec des données horaires. Je me demande s’il y a du sens de choisir de modèles d’ordre élevé en se basant sur l’AIC.
Utilise les autocorrélogrammes et autocorrélogrammes partiels pour déterminer les paramètres de l'ARIMA. Il faut avoir un modèle interprétable quand même... c'est sûr que le 18,1,11 est le meilleur mathématiquement, mais il est surement pas assez robuste (il colle trop aux données sur lequel tu construits) je pense.
maritexas a écrit:
3) En ce qui concerne la saisonnalité : à priori les valeurs les plus élevées sont concentrées en hiver et donc on pourrait dire que la série possède une saisonnalité annuelle. Est-ce qu’il est possible de construire un modèle SARIMA de saisonnalité annuelle avec des données horaires (cad on aurait ces cycles que se repetent à chaque 8760 pas de temps) ?
Je pense que de toute façon dans mon cas il n’est pas possible de construire ce type de modèle parce que je dispose d’une seule année pour la construction.
effectivement avec une seule année, tu ne verras pas la saisonnalité.
A ta place j'aurai pris les 2 années pour le construire, puis j'aurai vérifié le modèle plus tard, à l'obtention de nouvelles données...
Niaboc
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: Séries temporelles et Modèle ARIMA
Merci pour ta réponse Niaboc.
j'avais essayé, dans un prémier temps, d'interpréter les corrélogrammes. Mais j'ai eu du mal parce qu'il y a un nombre assez élévé de données en dehors de l'intervale de confiance ( et cela n'est pas lié à une possible saisonnalité).
Le fichier ci-joint affiche les corrélogrammes de ma série déjà differentiée.
D'après Box and Jenkins: "En général, pour un processus stationnaire ARMA (p,q) la fonction d'autocorrélation a une décroissance exponentielle ou oscillatoire après le déphasage q tandis que la fonction d’autocorrélation partiale suit le même type de comportement après le déphasage p."
Dans ce cas, je pourrais prendre comme valeurs initales
p= 5
q= 8
c'est bien ça?
Merci d'avance,
MArina
j'avais essayé, dans un prémier temps, d'interpréter les corrélogrammes. Mais j'ai eu du mal parce qu'il y a un nombre assez élévé de données en dehors de l'intervale de confiance ( et cela n'est pas lié à une possible saisonnalité).
Le fichier ci-joint affiche les corrélogrammes de ma série déjà differentiée.
D'après Box and Jenkins: "En général, pour un processus stationnaire ARMA (p,q) la fonction d'autocorrélation a une décroissance exponentielle ou oscillatoire après le déphasage q tandis que la fonction d’autocorrélation partiale suit le même type de comportement après le déphasage p."
Dans ce cas, je pourrais prendre comme valeurs initales
p= 5
q= 8
c'est bien ça?
Merci d'avance,
MArina
- Fichiers joints
maritexas- Nombre de messages : 2
Date d'inscription : 16/05/2013
Re: Séries temporelles et Modèle ARIMA
Tu peux essayer ça aussi (test quelques modèles):
p=3
q=2
en fait je pense à p=3 pour pour le côté MA(q), tu pourrais tester un q de 2 à 6, voire 7 je pense.
De mémoire il est préférable de tester d'abord le MA(q) et de ressortir les autocorrélogrammes pour fixer l'AR(p) si tu y vas à tâtons.
p=3
q=2
en fait je pense à p=3 pour pour le côté MA(q), tu pourrais tester un q de 2 à 6, voire 7 je pense.
De mémoire il est préférable de tester d'abord le MA(q) et de ressortir les autocorrélogrammes pour fixer l'AR(p) si tu y vas à tâtons.
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Sujets similaires
» Quel modèle choisir pour mes séries temporelles ?
» GLM et séries temporelles en écologie
» Séries temporelles
» Series temporelles
» Comparaison de séries temporelles
» GLM et séries temporelles en écologie
» Séries temporelles
» Series temporelles
» Comparaison de séries temporelles
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum