Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Modélisation Série temporelle
2 participants
Page 1 sur 1
Modélisation Série temporelle
Bonjour tout le monde,
Je cherche à faire de la prévision sur deux variables temporelles : une représentant l'investissement et l'autre le nombre de ventes à la date t.
Je ne sais pas si il est plus malin de travailler avec l'évolution de l'investissement cumulée et/ou évolution des ventes cumulées (là ce n'est pas le cas c'est au jour le jour ce que j'ai représenté)? Sur ces séries d'effectifs cumulés on se rapproche de quelque chose de linéaire mais lorsque je fais une régression dessus je n'ai pas assez la prise en compte de "l'évolution court terme". En gros si l'investissement a augmenté de façon significative les 2 derniers jours même si avant c'était pas un gros investissement il y a fort à parier que l'investissement à une date future sera assez élevée. Et c'est ça que je n'arrive pas à modéliser.
N'ayant aucune connaissance dans le domaine j'aurai voulu savoir si quelqu'un pouvait m'orienter un peu dans la démarche à suivre.
Je vous joins l'évolution des 2 séries que je peux observer. L'idée c'est de prévoir à partir des valeurs à Jours < 15 les valeurs de 2 séries à J = 30 environ. Est-ce possible?
A priori les deux séries évoluent conjointement donc peut être que de calculer la covariance, ou voir si il y a stationnarité serait intéressant ...
Vraiment je suis preneur de toute aide car là c'est le grand début
En vous remerciant par avance,
Gu.
Je cherche à faire de la prévision sur deux variables temporelles : une représentant l'investissement et l'autre le nombre de ventes à la date t.
Je ne sais pas si il est plus malin de travailler avec l'évolution de l'investissement cumulée et/ou évolution des ventes cumulées (là ce n'est pas le cas c'est au jour le jour ce que j'ai représenté)? Sur ces séries d'effectifs cumulés on se rapproche de quelque chose de linéaire mais lorsque je fais une régression dessus je n'ai pas assez la prise en compte de "l'évolution court terme". En gros si l'investissement a augmenté de façon significative les 2 derniers jours même si avant c'était pas un gros investissement il y a fort à parier que l'investissement à une date future sera assez élevée. Et c'est ça que je n'arrive pas à modéliser.
N'ayant aucune connaissance dans le domaine j'aurai voulu savoir si quelqu'un pouvait m'orienter un peu dans la démarche à suivre.
Je vous joins l'évolution des 2 séries que je peux observer. L'idée c'est de prévoir à partir des valeurs à Jours < 15 les valeurs de 2 séries à J = 30 environ. Est-ce possible?
A priori les deux séries évoluent conjointement donc peut être que de calculer la covariance, ou voir si il y a stationnarité serait intéressant ...
Vraiment je suis preneur de toute aide car là c'est le grand début
En vous remerciant par avance,
Gu.
statgg- Nombre de messages : 21
Date d'inscription : 06/06/2013
Re: Modélisation Série temporelle
Tu peux tenter de passer au log et si la série est stationnaire, tu peux essayer de voir s'il n'y a pas un processus ARMA qui pourrait modéliser ça.
Si tu n'as jamais vu de quoi je parle, renseigne-toi sur les série temporelles ARM
Si tu n'as jamais vu de quoi je parle, renseigne-toi sur les série temporelles ARM
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: Modélisation Série temporelle
Bonjour niaboc,
Merci pour ta réponse tout d'abord!
Là je suis en train de lire 2 cours sur les séries temporelles (outch!).
Je ne comprends pas comment on peut arriver à la conclusion d'étudier le log des séries?
Tu penses qu'il est plus malin de regarder la série qui représente les ventes/jour ou la série qui représente les ventes cumulées/jour (fonction croissante ici)?
Autre question, comment vérifier numériquement si une série est stationnaire ou pas (ici la fréquence est journalière)?
Autant je vois la définition autant sur un logiciel je ne vois pas ^^ ...
Encore merci je vais essayer d'avancer vite sur la lecture des pdf sur les séries temporelles!
Gu.
Merci pour ta réponse tout d'abord!
Là je suis en train de lire 2 cours sur les séries temporelles (outch!).
Je ne comprends pas comment on peut arriver à la conclusion d'étudier le log des séries?
Tu penses qu'il est plus malin de regarder la série qui représente les ventes/jour ou la série qui représente les ventes cumulées/jour (fonction croissante ici)?
Autre question, comment vérifier numériquement si une série est stationnaire ou pas (ici la fréquence est journalière)?
Autant je vois la définition autant sur un logiciel je ne vois pas ^^ ...
Encore merci je vais essayer d'avancer vite sur la lecture des pdf sur les séries temporelles!
Gu.
statgg- Nombre de messages : 21
Date d'inscription : 06/06/2013
Re: Modélisation Série temporelle
Voir le log car la série ne paraît pas du tout stationnaire.
Vu la forme, peut-être qu'avec un log ça ressemblera plus à une série stationnaire... à voir.
Comme tu n'as pas de saisonnalité ou de tendance, il faut espérer que le log fera l'affaire...
Il est préférable de regarder la série brute des ventes/jour plutôt que le cumul.
Il existe des tests pour vérifier la stationnarité d'une série. De mémoire il y a Dickey-Fuller.
Vu la forme, peut-être qu'avec un log ça ressemblera plus à une série stationnaire... à voir.
Comme tu n'as pas de saisonnalité ou de tendance, il faut espérer que le log fera l'affaire...
Il est préférable de regarder la série brute des ventes/jour plutôt que le cumul.
Il existe des tests pour vérifier la stationnarité d'une série. De mémoire il y a Dickey-Fuller.
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: Modélisation Série temporelle
niaboc a écrit:Voir le log car la série ne paraît pas du tout stationnaire.
Vu la forme, peut-être qu'avec un log ça ressemblera plus à une série stationnaire... à voir.
Comme tu n'as pas de saisonnalité ou de tendance, il faut espérer que le log fera l'affaire...
Il est préférable de regarder la série brute des ventes/jour plutôt que le cumul.
Il existe des tests pour vérifier la stationnarité d'une série. De mémoire il y a Dickey-Fuller.
Merci pour la réponse.
Là et bien avec le log j'ai quelque chose de pas du tout stationnaire non plus ... du coup je ne sais pas du tout comment faire ...
La seule idée c'est de passer au cumul qui a une tendance linéaire (fortement) et de me dire que la valeur du cumul à la date t+k ne dépend que du cumul à la date t ou quelque chose comme ça. Mais là encore ça reste des idées ....
Si tu as d'autres conseils je suis preneur
Gu.
statgg- Nombre de messages : 21
Date d'inscription : 06/06/2013
Re: Modélisation Série temporelle
Ben l'embêtant avec le cumul, c'est qu'à cause de la tendance linéaire, tu vas devoir différencier ta série... et tu retombes donc sur ta série d'origine.
Essaye de trouver une tendance de type fonction polynomiale sur ta série brute des ventes, peut-être que tu retomberas sur une série stationnaire?
Essaye de trouver une tendance de type fonction polynomiale sur ta série brute des ventes, peut-être que tu retomberas sur une série stationnaire?
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: Modélisation Série temporelle
niaboc a écrit:Ben l'embêtant avec le cumul, c'est qu'à cause de la tendance linéaire, tu vas devoir différencier ta série... et tu retombes donc sur ta série d'origine.
Essaye de trouver une tendance de type fonction polynomiale sur ta série brute des ventes, peut-être que tu retomberas sur une série stationnaire?
Je me dis surtout que les investissements "causent" les ventes et qu'il y a un lien fort là dedans mais je ne sais pas le montrer. Et après je ne sais pas comment le modéliser ou même me donner une idée de modélisation.
La seule "modélisation" qui me paraissait acceptable était la régression linéaire sur les cumuls avec l'un expliquant l'autre mais malheureusement la régression linéaire ne prend pas en compte les variations à la date t-1 (ou du moins un temps court avant ... même si je peux la forcer).
Je vais regarder ça pour trouver une tendance pour la série brute mais pour le moment ça ne donne pas grand chose.
Gu.
statgg- Nombre de messages : 21
Date d'inscription : 06/06/2013
Re: Modélisation Série temporelle
tu peux aller voir du côté des processus ARMAX, tu pourras injecter l'investissement dans ton modèle.
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: Modélisation Série temporelle
niaboc a écrit:tu peux aller voir du côté des processus ARMAX, tu pourras injecter l'investissement dans ton modèle.
Je viens de voir cela. Effectivement c'est une possibilité.
M'enfin j'en reviens quand même à me dire, puisqu'au final c'est les ventes globales qui m'intéressent ainsi que l'investissement global afin d'avoir une idée de mon "rendement", de considérer les cumul et de faire une régression là dessus, mais peut être en forçant la régression à se faire à partir des 5 jours avant (histoire d'avoir une sorte de tendance "immédiate"?) ... mais je ne suis pas certain que cela ait un sens.
En parallèle pour justifier le fait que je cherchais à modéliser cela j'avais fait une ACP sur l'ensemble de mes individus avec l'ensemble de mes variables quantitatives (investissement pour chaque individu, vente pour chaque individu, contribution à l'investissement globale pour chaque individu, etc.).
J'avais bien très clairement mes individus avec fort investissement pour peu de ventes en retour et ce sont ces individus que je veux "prévoir" 15 jours avant.
Aurais-tu une idée à part de partir comme je l'ai fait?
Encore merci
Gu.
statgg- Nombre de messages : 21
Date d'inscription : 06/06/2013
Re: Modélisation Série temporelle
Comme t'as fait c'est ok pour moi.
ACP puis CAH (si nécessaire car si tu n'as pas bcp d'indivdus, tu peux le faire à la mano) pour classer les individus avec les axes qui t'intéressent et qui permettent d'avoir un groupe sur ces individus.
ACP puis CAH (si nécessaire car si tu n'as pas bcp d'indivdus, tu peux le faire à la mano) pour classer les individus avec les axes qui t'intéressent et qui permettent d'avoir un groupe sur ces individus.
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: Modélisation Série temporelle
niaboc a écrit:Comme t'as fait c'est ok pour moi.
ACP puis CAH (si nécessaire car si tu n'as pas bcp d'indivdus, tu peux le faire à la mano) pour classer les individus avec les axes qui t'intéressent et qui permettent d'avoir un groupe sur ces individus.
C'est ce que j'ai fait.
Mais bon malheureusement les axes ne viennent pas automatiquement (pas tout le temps - je suppose - car l'axe 1 peut très bien représenter sur un autre échantillon exactement l'inverse et idem pour l'axe 2).
Donc du coup si je lance sur le mois en cours une ACP j'aurai peut être autre chose (et pourquoi pas meilleur d'ailleurs si je vois que l'investissement et les ventes sont très proches ^^).
Et sinon j'ai pas bien compris le coup de la CAH ... pour le faire en manuel suivant les axes qui me plaisent? Car typiquement ce qui me plait c'est les axes sur lesquels la contribution aux ventes et la contribution à l'investissement (qui sont des variables qui participent à la construction des axes) et si c'est possible d'automatiser cela ...
Encore merci
Gu.
statgg- Nombre de messages : 21
Date d'inscription : 06/06/2013
Re: Modélisation Série temporelle
undefined a écrit:Et sinon j'ai pas bien compris le coup de la CAH ... pour le faire en manuel suivant les axes qui me plaisent? Car typiquement ce qui me plait c'est les axes sur lesquels la contribution aux ventes et la contribution à l'investissement (qui sont des variables qui participent à la construction des axes) et si c'est possible d'automatiser cela ...
Non, ce n'est pas ce que je voulais dire.
C'est le nombre d'axes que tu pouvais choisir, mais il n'est pas du tout recommandé de choisir des axes par ci par là. En effet, le premier axe apporte beaucoup d'information, le deuxième un peu moins, etc.
Donc si tu choisis par exemple le troisième et quatrième axe parce que tes variables sont bien représentés dessus tu perds quand même beaucoup d'information sur l'ensemble de tes données.
Tu peux donc soit mettre QUE les variables qui t'intéressent ; ou S'il n'y en as pas beaucoup, tu peux faire plutôt un clustering de type k-means avec les variables qui t'intéresses.
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: Modélisation Série temporelle
niaboc a écrit:undefined a écrit:Et sinon j'ai pas bien compris le coup de la CAH ... pour le faire en manuel suivant les axes qui me plaisent? Car typiquement ce qui me plait c'est les axes sur lesquels la contribution aux ventes et la contribution à l'investissement (qui sont des variables qui participent à la construction des axes) et si c'est possible d'automatiser cela ...
Non, ce n'est pas ce que je voulais dire.
C'est le nombre d'axes que tu pouvais choisir, mais il n'est pas du tout recommandé de choisir des axes par ci par là. En effet, le premier axe apporte beaucoup d'information, le deuxième un peu moins, etc.
Donc si tu choisis par exemple le troisième et quatrième axe parce que tes variables sont bien représentés dessus tu perds quand même beaucoup d'information sur l'ensemble de tes données.
Tu peux donc soit mettre QUE les variables qui t'intéressent ; ou S'il n'y en as pas beaucoup, tu peux faire plutôt un clustering de type k-means avec les variables qui t'intéresses.
Aussi oui, j'avais pensé au clustering direct avec k-means avec les 3/4 variables qui m'intéressent.
Mais j'aimerai utiliser une méthode prédictive surtout car l'évolution de l'investissement et l'évolution des ventes dépendent du temps. Et l'idée comme je le disais plus haut c'est d'avoir une valeur à J+15 avec des données à court terme (d'une quinzaine de jours environ) mais sur beaucoup d'individus (produits) et avec beaucoup d'indicateurs (variables souvent colinéaires).
J'avais pensé à "créer une variable cible" qui pourrait être l'appartenance à une classe (produits rentables/produits pas rentables?) en me servant du kmeans (ou ACP+CAH ?) mais j'ai du mal à formaliser tout ça.
Ca te parait cohérent?
Encore merci pour ton aide!!
Gu.
statgg- Nombre de messages : 21
Date d'inscription : 06/06/2013
Sujets similaires
» série temporelle
» série temporelle
» Série temporelle
» Analyse de série temporelle
» Analyse exploratoire temporelle
» série temporelle
» Série temporelle
» Analyse de série temporelle
» Analyse exploratoire temporelle
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|