Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Construction d'un indicateur synthétique à partir d'une ACP
Page 1 sur 1
Construction d'un indicateur synthétique à partir d'une ACP
Bonjour à tous,
Je souhaiterais construire un indicateur synthétique de dynamisme à l'échelle des communes belges. Pour ce, j'ai sélectionné une série de variables et ai réalisé une ACP. Grâce à celle-ci, j'ai sélectionné 7 variables plus intéressantes que les autres.
Pour la suite, j'aimerais construire un indicateur en sommant les variables pondérées. J'ai alors réalisé une deuxième ACP pour savoir comment pondérer les variables. C'est là que j'hésite un peu :
Soit pondérer les variables avec les coefficient de corrélation à la première composante
Ne garder que les variables au dessus d'une valeur de corrélation avec la première composante
Pondérer les variables par le pourcentage d'information des composantes*coefficients de corrélation avec chacune des variables
Bref, tous les avis sont les bienvenus sur ces 3 possibilités mais également d'autres idées
Merci
Je souhaiterais construire un indicateur synthétique de dynamisme à l'échelle des communes belges. Pour ce, j'ai sélectionné une série de variables et ai réalisé une ACP. Grâce à celle-ci, j'ai sélectionné 7 variables plus intéressantes que les autres.
Pour la suite, j'aimerais construire un indicateur en sommant les variables pondérées. J'ai alors réalisé une deuxième ACP pour savoir comment pondérer les variables. C'est là que j'hésite un peu :
Soit pondérer les variables avec les coefficient de corrélation à la première composante
Ne garder que les variables au dessus d'une valeur de corrélation avec la première composante
Pondérer les variables par le pourcentage d'information des composantes*coefficients de corrélation avec chacune des variables
Bref, tous les avis sont les bienvenus sur ces 3 possibilités mais également d'autres idées
Merci
Matchieu- Nombre de messages : 16
Date d'inscription : 29/05/2011
Matchieu- Nombre de messages : 16
Date d'inscription : 29/05/2011
Re: Construction d'un indicateur synthétique à partir d'une ACP
Bonjour Matchieu,
difficile de rentrer dans le problème sans lisibilité sur les données... Mais je vais me lancer...
La création d'un indicateur est toujours difficile car très subjective...
Tout d'abord, comment as-tu sélectionné les variables d'intéret? En effet, celles-ci doivent décrire les différents axes que tu cherches à interpréter dans ton ACP, et pas se contenter à un seul axe... Enfin à mon humble avis.
Tu cherches à construire un indicateur pour chaque commune, c'est à dire pour chaque individu statistique dans ton ACP, donc à noter, tu n'as pas forcément besoin de revenir aux variables de départ...
2 choix, à mon avis, mais comme je te l'ai dit, tout cela est très subjectif...
Premier choix: Utiliser les coordonnées factorielles de tes individus.
Étant donné que l'ACP a structuré tes données d'une façon qui te semble pertinentte, tu peux déjà repartir de cette ACP. Tu peux alors utiliser les coordonnées factorielles de chaque individus, en les additionnant par exemple.
A noter, il est possible que tu inverses le sens de tes facteurs pour que ton indicateur soit crédible et colle à ton expertise (ex: une commune dynamique est à 2 sur l'axe 1 et -1 sur l'axe 2, tu inverse l'axe 2 pour que ton indicateur ait un sens, soit 2 + -(-1) =3...)
Second choix: Repartir des variables mesurées.
Cela peut etre intéressant si tu ajoutes de nouvelles communes par la suite, car tu ne fais pas une nouvelle ACP, mais du coup il faut que tu sois sur de l'ACP initiale...
Les axes principaux, que tu trouves intéressant, sont une combinaison linéaire des variables étudiées. Tu as donc pour chaque axe une sorte de "pondération" de ta variable (qui est en fait le coef d'une régression multiple). Tu peux alors pour chaque individu appliquer les coefs sur chaque variable. Ensuite, à toi de voir si tu pondères tes différents axes (en fonction de l'inertie expliquée par exemple)
A noter, cela revient plus ou moins au même que la première option, mais est plus lisible pour un non initié.
Voila, très subjectif, mais bon...
Enfin, tu peux faire cela, soit avec l'ensemble des variables de départ, soit avec celles sélectionnées, mais par conséquent, attention à la sélection...
difficile de rentrer dans le problème sans lisibilité sur les données... Mais je vais me lancer...
La création d'un indicateur est toujours difficile car très subjective...
Tout d'abord, comment as-tu sélectionné les variables d'intéret? En effet, celles-ci doivent décrire les différents axes que tu cherches à interpréter dans ton ACP, et pas se contenter à un seul axe... Enfin à mon humble avis.
Tu cherches à construire un indicateur pour chaque commune, c'est à dire pour chaque individu statistique dans ton ACP, donc à noter, tu n'as pas forcément besoin de revenir aux variables de départ...
2 choix, à mon avis, mais comme je te l'ai dit, tout cela est très subjectif...
Premier choix: Utiliser les coordonnées factorielles de tes individus.
Étant donné que l'ACP a structuré tes données d'une façon qui te semble pertinentte, tu peux déjà repartir de cette ACP. Tu peux alors utiliser les coordonnées factorielles de chaque individus, en les additionnant par exemple.
A noter, il est possible que tu inverses le sens de tes facteurs pour que ton indicateur soit crédible et colle à ton expertise (ex: une commune dynamique est à 2 sur l'axe 1 et -1 sur l'axe 2, tu inverse l'axe 2 pour que ton indicateur ait un sens, soit 2 + -(-1) =3...)
Second choix: Repartir des variables mesurées.
Cela peut etre intéressant si tu ajoutes de nouvelles communes par la suite, car tu ne fais pas une nouvelle ACP, mais du coup il faut que tu sois sur de l'ACP initiale...
Les axes principaux, que tu trouves intéressant, sont une combinaison linéaire des variables étudiées. Tu as donc pour chaque axe une sorte de "pondération" de ta variable (qui est en fait le coef d'une régression multiple). Tu peux alors pour chaque individu appliquer les coefs sur chaque variable. Ensuite, à toi de voir si tu pondères tes différents axes (en fonction de l'inertie expliquée par exemple)
A noter, cela revient plus ou moins au même que la première option, mais est plus lisible pour un non initié.
Voila, très subjectif, mais bon...
Enfin, tu peux faire cela, soit avec l'ensemble des variables de départ, soit avec celles sélectionnées, mais par conséquent, attention à la sélection...
Invité- Invité
Re: Construction d'un indicateur synthétique à partir d'une ACP
Bonjour,
Je vais peut être commencer par t'expliquer un peu plus en détails ce que j'ai fait :
Concernant le choix des variables, j'ai réalisé une première ACP. J'ai supprimé les variables qui n'étaient que peu corrélées aux quatre premières composantes.
Ensuite, j'avais deux fois deux variables qui étaient corrélées quasi de la même manière à chaque composante, dans chaque cas, j'ai garder celle qui avait une meilleure corrélation pour le plus de composantes.
Ce qui m'a amené à 7 variables.
Là j'ai réalisé une deuxième ACP avec ces 7 variables. Selon le critère de Kaiser, je dois prendre en compte les 3 premières composantes (valeur propre supérieure à 1) mais j'hésite à prendre la quatrième composante aussi, elle a une valeur propre de 0,99.
L'analyse a été réalisée sur 286 communes.
Je risque de devoir utiliser cet indicateur sur d'autres zones, raison pour laquelle j'avais opté pour un indicateur construit à partir des variables.
Par ailleurs, pour la suite, je dois pouvoir expliquer le résultat pour les communes ayant des résultats extrêmes, il vaut donc mieux je pense limiter le nombre de variables sinon, l'indicateur risque de rapidement devenir illisible, non?
Je vais peut être commencer par t'expliquer un peu plus en détails ce que j'ai fait :
Concernant le choix des variables, j'ai réalisé une première ACP. J'ai supprimé les variables qui n'étaient que peu corrélées aux quatre premières composantes.
Ensuite, j'avais deux fois deux variables qui étaient corrélées quasi de la même manière à chaque composante, dans chaque cas, j'ai garder celle qui avait une meilleure corrélation pour le plus de composantes.
Ce qui m'a amené à 7 variables.
Là j'ai réalisé une deuxième ACP avec ces 7 variables. Selon le critère de Kaiser, je dois prendre en compte les 3 premières composantes (valeur propre supérieure à 1) mais j'hésite à prendre la quatrième composante aussi, elle a une valeur propre de 0,99.
L'analyse a été réalisée sur 286 communes.
Je risque de devoir utiliser cet indicateur sur d'autres zones, raison pour laquelle j'avais opté pour un indicateur construit à partir des variables.
Par ailleurs, pour la suite, je dois pouvoir expliquer le résultat pour les communes ayant des résultats extrêmes, il vaut donc mieux je pense limiter le nombre de variables sinon, l'indicateur risque de rapidement devenir illisible, non?
Matchieu- Nombre de messages : 16
Date d'inscription : 29/05/2011
Re: Construction d'un indicateur synthétique à partir d'une ACP
La démarche est assez complexe...
En effet, tu fais une première ACP, qui te donne plein d'axe et tu en sélectionne 4 qui sont intéressant. Tu te dis ensuite que parmi toutes les variables, 7 d'entre elles décrivent bien les 4 axes là.
Jusqu'ici je suis d'accord
(dans la mesure ou tu as bien vérifié que les variables sélectionnées contribuent bien à la formation de tes axes, et pas seulement sont corrélées)
Après, pourquoi faire une nouvelle ACP de tes 7 variables, car automatiquement, les axes ne seront plus les memes (bon, pas loin mais quand meme...)
Du coup, à ta place, je conserverai l'ACP initiale, meme si tu ne conserve que certaines variables (bien choisies) pour ensuite calculer l'indicateur sur la base de tes variables.
Ensuite, limiter le nombre de variables... A priori tu as 7 variables sur 4 axes... Beaucoup de démarches possibles:
1 variable = 1 axe (en gros), alors tu as 7 coefs
1 variable = plusieurs axes, tu peux appliquer jusqu'à 28 coefs (4 par variables)
La construction d'indicateurs est toujours difficile, car souvent des boites noires, difficile à expliquer... (ex: pourquoi l'IMC est calculé comme ça???)
En effet, tu fais une première ACP, qui te donne plein d'axe et tu en sélectionne 4 qui sont intéressant. Tu te dis ensuite que parmi toutes les variables, 7 d'entre elles décrivent bien les 4 axes là.
Jusqu'ici je suis d'accord
(dans la mesure ou tu as bien vérifié que les variables sélectionnées contribuent bien à la formation de tes axes, et pas seulement sont corrélées)
Après, pourquoi faire une nouvelle ACP de tes 7 variables, car automatiquement, les axes ne seront plus les memes (bon, pas loin mais quand meme...)
Du coup, à ta place, je conserverai l'ACP initiale, meme si tu ne conserve que certaines variables (bien choisies) pour ensuite calculer l'indicateur sur la base de tes variables.
Ensuite, limiter le nombre de variables... A priori tu as 7 variables sur 4 axes... Beaucoup de démarches possibles:
1 variable = 1 axe (en gros), alors tu as 7 coefs
1 variable = plusieurs axes, tu peux appliquer jusqu'à 28 coefs (4 par variables)
La construction d'indicateurs est toujours difficile, car souvent des boites noires, difficile à expliquer... (ex: pourquoi l'IMC est calculé comme ça???)
Invité- Invité
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum