Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Quel modèle choisir pour mes séries temporelles ?
Page 1 sur 1
Quel modèle choisir pour mes séries temporelles ?
Bonjour,
ça serait ma première question sur ce forum, je m'excuse d'avance si vous pensez que la question doit être posée sur la partie logiciel (en l'occurrence R)
J'explique le contexte, j'ai des données de concentration de différents polluants, dans un premier temps, je traite le benzène, sur plusieurs stations, installées dans différentes villes, l'article scientifique qui traite le sujet, veut prouver que les données relevées sur une seule station (station Ada) suffisent à suivre le phénomène, l'auteur fait des covariances, des cross corrélations entre les données de la dite station et la moyenne des données de toutes les stations, je veux aller plus loin et essayer de voir si les deux sets de données (ADA) et la moyenne de toutes les autres (ALL) s'ajustent par le même modèle, suivent le même AR, MA ou ARMA
Les données de ADA couvrent 10 ans, les autres stations s'arrêtent à mi 2009, je choisi de travailler sur une seule année 2007 (j'ai fait le même travail avec 2 ans, ça n'a rien changé) les données sont horaires, sur un an, 24*365 = 8760 observations
J'ai testé la stationnarité des deux séries dans un premiers temps (ok stationnaires)
les ACF et PACF étaient difficiles à lire avant la différentiation de la série, ACF est décroissante mais lentement
Après la différentiations des séries, ACF est périodique, PACF aussi
J'essaie EACF aussi (bien que difficile à interpréter) et je tente des modèle AR puis MA puis des ARMA
J'utilise la fonction auto.arima en variant ses paramètres (Approxiamtion = False, Stepwise = False)
J'ai un panel de modèle pour chaque set de données, je calcule les AIC et je choisi les modèles qui le minimise
Je cherche les paramètres ar1, ar2... et ma1, ma2... de l'ARMA grâce à la fonction Arima de R que j'ajuste sur mes données puis je génère des simulation arima.sim avec le même nombre de données pour comparer les plots (l'amplitude du plot sim me dérange, mais en passant par plusieurs modèle ça ne s'arrange pas)
Au moment de la validation, je vérifie l'ACF des résidus, de tous les modèles que j'ai sous la main, AUCUN ne fonctionne,
Je désespère,
Est ce que la démarche vous semble logique ?
Que me reste-t-il à faire? un modèle GARCH, mais même lui il se base sur un ARMA, si le ARMA ne colle pas je dois tout de même essayer un GARCH? si oui, des pistes pour l'ajustement sur R? d'autres modèles à me suggérer svp?
Une série chronologique "doit" bien avoir un modèle? peut-on avoir des séries avec des combinaisons de modèles qu'il est très difficile de les ajuster ?
Merci de me lire et de m'aider si possible, j'ai trop hésité, mais la deadline de ma soutenance est fin de cette semaine
PS1 : je n'arrive pas à joindre les fichiers pour les ACF, PACF
PS2 : Apparemment c'est mon deuxième sujet, le premier était en 2015
ça serait ma première question sur ce forum, je m'excuse d'avance si vous pensez que la question doit être posée sur la partie logiciel (en l'occurrence R)
J'explique le contexte, j'ai des données de concentration de différents polluants, dans un premier temps, je traite le benzène, sur plusieurs stations, installées dans différentes villes, l'article scientifique qui traite le sujet, veut prouver que les données relevées sur une seule station (station Ada) suffisent à suivre le phénomène, l'auteur fait des covariances, des cross corrélations entre les données de la dite station et la moyenne des données de toutes les stations, je veux aller plus loin et essayer de voir si les deux sets de données (ADA) et la moyenne de toutes les autres (ALL) s'ajustent par le même modèle, suivent le même AR, MA ou ARMA
Les données de ADA couvrent 10 ans, les autres stations s'arrêtent à mi 2009, je choisi de travailler sur une seule année 2007 (j'ai fait le même travail avec 2 ans, ça n'a rien changé) les données sont horaires, sur un an, 24*365 = 8760 observations
J'ai testé la stationnarité des deux séries dans un premiers temps (ok stationnaires)
les ACF et PACF étaient difficiles à lire avant la différentiation de la série, ACF est décroissante mais lentement
Après la différentiations des séries, ACF est périodique, PACF aussi
J'essaie EACF aussi (bien que difficile à interpréter) et je tente des modèle AR puis MA puis des ARMA
J'utilise la fonction auto.arima en variant ses paramètres (Approxiamtion = False, Stepwise = False)
J'ai un panel de modèle pour chaque set de données, je calcule les AIC et je choisi les modèles qui le minimise
Je cherche les paramètres ar1, ar2... et ma1, ma2... de l'ARMA grâce à la fonction Arima de R que j'ajuste sur mes données puis je génère des simulation arima.sim avec le même nombre de données pour comparer les plots (l'amplitude du plot sim me dérange, mais en passant par plusieurs modèle ça ne s'arrange pas)
Au moment de la validation, je vérifie l'ACF des résidus, de tous les modèles que j'ai sous la main, AUCUN ne fonctionne,
Je désespère,
Est ce que la démarche vous semble logique ?
Que me reste-t-il à faire? un modèle GARCH, mais même lui il se base sur un ARMA, si le ARMA ne colle pas je dois tout de même essayer un GARCH? si oui, des pistes pour l'ajustement sur R? d'autres modèles à me suggérer svp?
Une série chronologique "doit" bien avoir un modèle? peut-on avoir des séries avec des combinaisons de modèles qu'il est très difficile de les ajuster ?
Merci de me lire et de m'aider si possible, j'ai trop hésité, mais la deadline de ma soutenance est fin de cette semaine
PS1 : je n'arrive pas à joindre les fichiers pour les ACF, PACF
PS2 : Apparemment c'est mon deuxième sujet, le premier était en 2015
NALI- Nombre de messages : 5
Date d'inscription : 26/11/2015
Sujets similaires
» Quel modèle choisir pour des ventes sur un navire?
» Séries temporelles et Modèle ARIMA
» Quel modèle choisir?
» Quel critère pour le choix du meilleur modèle en Regression
» Quel test choisir pour ce genre de données?
» Séries temporelles et Modèle ARIMA
» Quel modèle choisir?
» Quel critère pour le choix du meilleur modèle en Regression
» Quel test choisir pour ce genre de données?
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum