Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Catégories "homogènes" de communes
2 participants
Page 1 sur 1
Catégories "homogènes" de communes
Bonjour,
J'aimerais classer les communes de Belgique en différentes catégories "homogènes" pour pouvoir faire des comparaisons judicieuses (il ne s agit pas d'être ultra précis, le but de mon travail n'est pas cette classification).
Je dispose de différentes données pour chaque commune (population, revenus/hab, taux de chômage, affectation du sol et du bâti, etc etc). Comment classer ces communes sur base de ces nombreuses variables ? Analyse factorielle puis méthode de clustering ? Que logiciel utiliser ?
Il faudrait regrouper dans des classes aussi homogènes que possible des communes caractérisées par des environnements socio-économiques similaires).
Pourriez-vous m'expliquer la démarche à suivre (en terme de statistiques).
Merci pour votre aide !
J'aimerais classer les communes de Belgique en différentes catégories "homogènes" pour pouvoir faire des comparaisons judicieuses (il ne s agit pas d'être ultra précis, le but de mon travail n'est pas cette classification).
Je dispose de différentes données pour chaque commune (population, revenus/hab, taux de chômage, affectation du sol et du bâti, etc etc). Comment classer ces communes sur base de ces nombreuses variables ? Analyse factorielle puis méthode de clustering ? Que logiciel utiliser ?
Il faudrait regrouper dans des classes aussi homogènes que possible des communes caractérisées par des environnements socio-économiques similaires).
Pourriez-vous m'expliquer la démarche à suivre (en terme de statistiques).
Merci pour votre aide !
Jack777- Nombre de messages : 10
Date d'inscription : 27/10/2010
Re: Catégories "homogènes" de communes
Bonjour,
en effet tu peux faire une AFC ou une ACM afin de projeter tes variables explicatives (qu'il te faudra catégoriser) ainsi que tes individus (soit tes communes) et tu pourras alors voir les communes qui sont les plus semblables en terme d'effectifs communs (ou plutot croisés). Etant donné que les ACM projetent les individus et les variables selon deux formules plus ou moins indépendantes tu peux trés bien te restreindre à une projection des individus uniquement (communes dans ton cas).
Si tu as accés à SAS à ce moment là tu dois regarder la procédure CORRESP et rajouter les lignes de codes pour attribuer une ANNOTATE et tracer joliment avec GPLOT. Sinon tu peux utiliser gratuitement R en regardant le package ade4 et la fonction dudi.acm (ou un truc du genre...)
Ensuite, en effet, tu peux continuer dans la classification non supervisée en faisant du clustering hiérarchique et en essayant plusieurs méthodes de classification (il y en a en tout plus d'une dizaine), sous SAS c'est la procédure CLUSTER, sous R je ne sais pas. Pour le clustering en gros tu vas lancer ta méthode et tu choisiras le nombre de noeuds otpimal via un compromis des valeurs de CCC, pseudo-R2 et R2. Dés lors tu auras un arbre hiérarchique et en fonction de ton choix de noeuds tu auras tes groupes. Pense à regarder les méthodes de WARDS et celle des K plus proches voisins.
en effet tu peux faire une AFC ou une ACM afin de projeter tes variables explicatives (qu'il te faudra catégoriser) ainsi que tes individus (soit tes communes) et tu pourras alors voir les communes qui sont les plus semblables en terme d'effectifs communs (ou plutot croisés). Etant donné que les ACM projetent les individus et les variables selon deux formules plus ou moins indépendantes tu peux trés bien te restreindre à une projection des individus uniquement (communes dans ton cas).
Si tu as accés à SAS à ce moment là tu dois regarder la procédure CORRESP et rajouter les lignes de codes pour attribuer une ANNOTATE et tracer joliment avec GPLOT. Sinon tu peux utiliser gratuitement R en regardant le package ade4 et la fonction dudi.acm (ou un truc du genre...)
Ensuite, en effet, tu peux continuer dans la classification non supervisée en faisant du clustering hiérarchique et en essayant plusieurs méthodes de classification (il y en a en tout plus d'une dizaine), sous SAS c'est la procédure CLUSTER, sous R je ne sais pas. Pour le clustering en gros tu vas lancer ta méthode et tu choisiras le nombre de noeuds otpimal via un compromis des valeurs de CCC, pseudo-R2 et R2. Dés lors tu auras un arbre hiérarchique et en fonction de ton choix de noeuds tu auras tes groupes. Pense à regarder les méthodes de WARDS et celle des K plus proches voisins.
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum