Modélisation Série temporelle

Voir le sujet précédent Voir le sujet suivant Aller en bas

Modélisation Série temporelle

Message par statgg le Mer 12 Juin 2013 - 13:18

Bonjour tout le monde, 

Je cherche à faire de la prévision sur deux variables temporelles : une représentant l'investissement et l'autre le nombre de ventes à la date t. 
Je ne sais pas si il est plus malin de travailler avec l'évolution de l'investissement cumulée et/ou évolution des ventes cumulées (là ce n'est pas le cas c'est au jour le jour ce que j'ai représenté)? Sur ces séries d'effectifs cumulés on se rapproche de quelque chose de linéaire mais lorsque je fais une régression dessus je n'ai pas assez la prise en compte de "l'évolution court terme". En gros si l'investissement a augmenté de façon significative les 2 derniers jours même si avant c'était pas un gros investissement il y a fort à parier que l'investissement à une date future sera assez élevée. Et c'est ça que je n'arrive pas à modéliser. 

N'ayant aucune connaissance dans le domaine j'aurai voulu savoir si quelqu'un pouvait m'orienter un peu dans la démarche à suivre. 
Je vous joins l'évolution des 2 séries que je peux observer. L'idée c'est de prévoir à partir des valeurs à Jours < 15 les valeurs de 2 séries à J = 30 environ. Est-ce possible? 

A priori les deux séries évoluent conjointement donc peut être que de calculer la covariance, ou voir si il y a stationnarité serait intéressant ... 

Vraiment je suis preneur de toute aide car là c'est le grand début Smile 



En vous remerciant par avance, 

Gu.

statgg

Nombre de messages : 21
Date d'inscription : 06/06/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modélisation Série temporelle

Message par niaboc le Mer 12 Juin 2013 - 14:11

Tu peux tenter de passer au log et si la série est stationnaire, tu peux essayer de voir s'il n'y a pas un processus ARMA qui pourrait modéliser ça.

Si tu n'as jamais vu de quoi je parle, renseigne-toi sur les série temporelles ARM

niaboc

Nombre de messages : 865
Age : 29
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modélisation Série temporelle

Message par statgg le Mer 12 Juin 2013 - 14:17

Bonjour niaboc, 

Merci pour ta réponse tout d'abord! 
Là je suis en train de lire 2 cours sur les séries temporelles (outch!). 

Je ne comprends pas comment on peut arriver à la conclusion d'étudier le log des séries? 
Tu penses qu'il est plus malin de regarder la série qui représente les ventes/jour ou la série qui représente les ventes cumulées/jour (fonction croissante ici)? 

Autre question, comment vérifier numériquement si une série est stationnaire ou pas (ici la fréquence est journalière)? 
Autant je vois la définition autant sur un logiciel je ne vois pas ^^ ... 

Encore merci je vais essayer d'avancer vite sur la lecture des pdf sur les séries temporelles! 

Gu.

statgg

Nombre de messages : 21
Date d'inscription : 06/06/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modélisation Série temporelle

Message par niaboc le Mer 12 Juin 2013 - 15:19

Voir le log car la série ne paraît pas du tout stationnaire.

Vu la forme, peut-être qu'avec un log ça ressemblera plus à une série stationnaire... à voir.
Comme tu n'as pas de saisonnalité ou de tendance, il faut espérer que le log fera l'affaire...

Il est préférable de regarder la série brute des ventes/jour plutôt que le cumul.

Il existe des tests pour vérifier la stationnarité d'une série. De mémoire il y a Dickey-Fuller.

niaboc

Nombre de messages : 865
Age : 29
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modélisation Série temporelle

Message par statgg le Mer 12 Juin 2013 - 15:34

niaboc a écrit:Voir le log car la série ne paraît pas du tout stationnaire.

Vu la forme, peut-être qu'avec un log ça ressemblera plus à une série stationnaire... à voir.
Comme tu n'as pas de saisonnalité ou de tendance, il faut espérer que le log fera l'affaire...

Il est préférable de regarder la série brute des ventes/jour plutôt que le cumul.

Il existe des tests pour vérifier la stationnarité d'une série. De mémoire il y a Dickey-Fuller.


Merci pour la réponse. 
Là et bien avec le log j'ai quelque chose de pas du tout stationnaire non plus ... du coup je ne sais pas du tout comment faire ... 

La seule idée c'est de passer au cumul qui a une tendance linéaire (fortement) et de me dire que la valeur du cumul à la date t+k ne dépend que du cumul à la date t ou quelque chose comme ça. Mais là encore ça reste des idées .... 

Si tu as d'autres conseils je suis preneur Smile 

Gu.

statgg

Nombre de messages : 21
Date d'inscription : 06/06/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modélisation Série temporelle

Message par niaboc le Mer 12 Juin 2013 - 15:39

Ben l'embêtant avec le cumul, c'est qu'à cause de la tendance linéaire, tu vas devoir différencier ta série... et tu retombes donc sur ta série d'origine.

Essaye de trouver une tendance de type fonction polynomiale sur ta série brute des ventes, peut-être que tu retomberas sur une série stationnaire?

niaboc

Nombre de messages : 865
Age : 29
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modélisation Série temporelle

Message par statgg le Mer 12 Juin 2013 - 15:47

niaboc a écrit:Ben l'embêtant avec le cumul, c'est qu'à cause de la tendance linéaire, tu vas devoir différencier ta série... et tu retombes donc sur ta série d'origine.

Essaye de trouver une tendance de type fonction polynomiale sur ta série brute des ventes, peut-être que tu retomberas sur une série stationnaire?

Je me dis surtout que les investissements "causent" les ventes et qu'il y a un lien fort là dedans mais je ne sais pas le montrer. Et après je ne sais pas comment le modéliser ou même me donner une idée de modélisation. 

La seule "modélisation" qui me paraissait acceptable était la régression linéaire sur les cumuls avec l'un expliquant l'autre mais malheureusement la régression linéaire ne prend pas en compte les variations à la date t-1 (ou du moins un temps court avant ... même si je peux la forcer). 

Je vais regarder ça pour trouver une tendance pour la série brute mais pour le moment ça ne donne pas grand chose. 

Gu.

statgg

Nombre de messages : 21
Date d'inscription : 06/06/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modélisation Série temporelle

Message par niaboc le Mer 12 Juin 2013 - 16:04

tu peux aller voir du côté des processus ARMAX, tu pourras injecter l'investissement dans ton modèle.

niaboc

Nombre de messages : 865
Age : 29
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modélisation Série temporelle

Message par statgg le Mer 12 Juin 2013 - 16:13

niaboc a écrit:tu peux aller voir du côté des processus ARMAX, tu pourras injecter l'investissement dans ton modèle.

Je viens de voir cela. Effectivement c'est une possibilité. 

M'enfin j'en reviens quand même à me dire, puisqu'au final c'est les ventes globales qui m'intéressent ainsi que l'investissement global afin d'avoir une idée de mon "rendement", de considérer les cumul et de faire une régression là dessus, mais peut être en forçant la régression à se faire à partir des 5 jours avant (histoire d'avoir une sorte de tendance "immédiate"?) ... mais je ne suis pas certain que cela ait un sens. 

En parallèle pour justifier le fait que je cherchais à modéliser cela j'avais fait une ACP sur l'ensemble de mes individus avec l'ensemble de mes variables quantitatives (investissement pour chaque individu, vente pour chaque individu, contribution à l'investissement globale pour chaque individu, etc.). 
J'avais bien très clairement mes individus avec fort investissement pour peu de ventes en retour et ce sont ces individus que je veux "prévoir" 15 jours avant. 

Aurais-tu une idée à part de partir comme je l'ai fait? 

Encore merci Wink 

Gu.

statgg

Nombre de messages : 21
Date d'inscription : 06/06/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modélisation Série temporelle

Message par niaboc le Jeu 13 Juin 2013 - 6:31

Comme t'as fait c'est ok pour moi.

ACP puis CAH (si nécessaire car si tu n'as pas bcp d'indivdus, tu peux le faire à la mano) pour classer les individus avec les axes qui t'intéressent et qui permettent d'avoir un groupe sur ces individus.

niaboc

Nombre de messages : 865
Age : 29
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modélisation Série temporelle

Message par statgg le Jeu 13 Juin 2013 - 7:33

niaboc a écrit:Comme t'as fait c'est ok pour moi.

ACP puis CAH (si nécessaire car si tu n'as pas bcp d'indivdus, tu peux le faire à la mano) pour classer les individus avec les axes qui t'intéressent et qui permettent d'avoir un groupe sur ces individus.


C'est ce que j'ai fait. 
Mais bon malheureusement les axes ne viennent pas automatiquement (pas tout le temps - je suppose - car l'axe 1 peut très bien représenter sur un autre échantillon exactement l'inverse et idem pour l'axe 2). 
Donc du coup si je lance sur le mois en cours une ACP j'aurai peut être autre chose (et pourquoi pas meilleur d'ailleurs si je vois que l'investissement et les ventes sont très proches ^^). 


Et sinon j'ai pas bien compris le coup de la CAH ... pour le faire en manuel suivant les axes qui me plaisent? Car typiquement ce qui me plait c'est les axes sur lesquels la contribution aux ventes et la contribution à l'investissement (qui sont des variables qui participent à la construction des axes) et si c'est possible d'automatiser cela ... 

Encore merci 

Gu.

statgg

Nombre de messages : 21
Date d'inscription : 06/06/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modélisation Série temporelle

Message par niaboc le Jeu 13 Juin 2013 - 8:33

undefined a écrit:Et sinon j'ai pas bien compris le coup de la CAH ... pour le faire en manuel suivant les axes qui me plaisent? Car typiquement ce qui me plait c'est les axes sur lesquels la contribution aux ventes et la contribution à l'investissement (qui sont des variables qui participent à la construction des axes) et si c'est possible d'automatiser cela ... 



Non, ce n'est pas ce que je voulais dire.
C'est le nombre d'axes que tu pouvais choisir, mais il n'est pas du tout recommandé de choisir des axes par ci par là. En effet, le premier axe apporte beaucoup d'information, le deuxième un peu moins, etc.

Donc si tu choisis par exemple le troisième et quatrième axe parce que tes variables sont bien représentés dessus tu perds quand même beaucoup d'information sur l'ensemble de tes données.

Tu peux donc soit mettre QUE les variables qui t'intéressent ; ou S'il n'y en as pas beaucoup, tu peux faire plutôt un clustering de type k-means avec les variables qui t'intéresses.

niaboc

Nombre de messages : 865
Age : 29
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modélisation Série temporelle

Message par statgg le Jeu 13 Juin 2013 - 9:06

niaboc a écrit:
undefined a écrit:Et sinon j'ai pas bien compris le coup de la CAH ... pour le faire en manuel suivant les axes qui me plaisent? Car typiquement ce qui me plait c'est les axes sur lesquels la contribution aux ventes et la contribution à l'investissement (qui sont des variables qui participent à la construction des axes) et si c'est possible d'automatiser cela ... 





Non, ce n'est pas ce que je voulais dire.
C'est le nombre d'axes que tu pouvais choisir, mais il n'est pas du tout recommandé de choisir des axes par ci par là. En effet, le premier axe apporte beaucoup d'information, le deuxième un peu moins, etc.

Donc si tu choisis par exemple le troisième et quatrième axe parce que tes variables sont bien représentés dessus tu perds quand même beaucoup d'information sur l'ensemble de tes données.

Tu peux donc soit mettre QUE les variables qui t'intéressent ; ou S'il n'y en as pas beaucoup, tu peux faire plutôt un clustering de type k-means avec les variables qui t'intéresses.


Aussi oui, j'avais pensé au clustering direct avec k-means avec les 3/4 variables qui m'intéressent. 

Mais j'aimerai utiliser une méthode prédictive surtout car l'évolution de l'investissement et l'évolution des ventes dépendent du temps. Et l'idée comme je le disais plus haut c'est d'avoir une valeur à J+15 avec des données à court terme (d'une quinzaine de jours environ) mais sur beaucoup d'individus (produits) et avec beaucoup d'indicateurs (variables souvent colinéaires). 

J'avais pensé à "créer une variable cible" qui pourrait être l'appartenance à une classe (produits rentables/produits pas rentables?) en me servant du kmeans (ou ACP+CAH ?) mais j'ai du mal à formaliser tout ça. 
Ca te parait cohérent? 

Encore merci pour ton aide!! 

Gu.

statgg

Nombre de messages : 21
Date d'inscription : 06/06/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modélisation Série temporelle

Message par Contenu sponsorisé Aujourd'hui à 20:24


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum