Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Choix du test + préparation des données
Page 1 sur 1
Choix du test + préparation des données
Bonjour,
J'aurais deux questions à vous soumettre. Alors, cela se passe dans le cadre d'une étude sur le dynamisme d'une région, je dois essayer de mettre en évidence des secteurs statistiques plus dynamiques que les autres. Voici comment je suis sensé procéder :
1) sélection d'une série d'indicateurs
2) analyse de la variance pour essayer de repérer les secteurs plus dynamiques
Et les questions :
1) Comme test, je pense qu'il s'agit d'une ANOVA. Cependant, je me demande si je dois en réaliser une pour chacun des indicateurs ou si je dois réaliser une ANOVA multiple (je n'en ai jamais fait mais il me semble que ça existe, d'après mes souvenirs de mes cours de stat..)
2) Les indicateurs sont d'ordres différents et dans des unités différentes (taux de croissance de la population, taux de chômage, revenu par habitant et pourcentage de la population ayant un diplôme post secondaire). Faut-il les standardiser auparavant?
Merci.
J'aurais deux questions à vous soumettre. Alors, cela se passe dans le cadre d'une étude sur le dynamisme d'une région, je dois essayer de mettre en évidence des secteurs statistiques plus dynamiques que les autres. Voici comment je suis sensé procéder :
1) sélection d'une série d'indicateurs
2) analyse de la variance pour essayer de repérer les secteurs plus dynamiques
Et les questions :
1) Comme test, je pense qu'il s'agit d'une ANOVA. Cependant, je me demande si je dois en réaliser une pour chacun des indicateurs ou si je dois réaliser une ANOVA multiple (je n'en ai jamais fait mais il me semble que ça existe, d'après mes souvenirs de mes cours de stat..)
2) Les indicateurs sont d'ordres différents et dans des unités différentes (taux de croissance de la population, taux de chômage, revenu par habitant et pourcentage de la population ayant un diplôme post secondaire). Faut-il les standardiser auparavant?
Merci.
Matchieu- Nombre de messages : 16
Date d'inscription : 29/05/2011
Matchieu- Nombre de messages : 16
Date d'inscription : 29/05/2011
Re: Choix du test + préparation des données
Bonjour Matchieu, plusieurs questions:
Est ce que tu disposes déjà de tes secteurs et donc des données par secteur, ou bien est-ce à toi de les "créer"?
Dans le premier cas, tu peux faire toutes les ANOVAs indicateur ~ secteur, pour isoler les indicateurs qui permettent au mieux de discriminer les différents secteurs. Une autre alternative serait de faire une analyse factorielle (ACP ou autre) sur tes données, afin de voir quels indicateurs structurent tes données, et quels autres ne sont en quelques sortes que du bruit, puis de faire l'ANOVA sur les premiers.
Dans l'autre cas, ou tu dois créer tes clusters, pourquoi pas le traditionnel analyse factorielle + CAH sur les coordonnées factorielles.
Pour ce qui est de la standardisation... Je ne connais pas trop tes données, donc difficile à dire. Si c'est pour faire toutes tes ANOVAs, pas de problème vu que tu les fait de façon indépendantes. Si tu fais une ACP, je te conseille de faire une ACP normée, étant donnée que tes données ne s'expriment pas dans la même échelle (densité, revenu par habitant, taux de croissance...) et donc n'ont pas la même amplitude. L'ACP non normée sera trop influencée par des variables aux variances fortes.
En espérant avoir répondu à tes questions
Est ce que tu disposes déjà de tes secteurs et donc des données par secteur, ou bien est-ce à toi de les "créer"?
Dans le premier cas, tu peux faire toutes les ANOVAs indicateur ~ secteur, pour isoler les indicateurs qui permettent au mieux de discriminer les différents secteurs. Une autre alternative serait de faire une analyse factorielle (ACP ou autre) sur tes données, afin de voir quels indicateurs structurent tes données, et quels autres ne sont en quelques sortes que du bruit, puis de faire l'ANOVA sur les premiers.
Dans l'autre cas, ou tu dois créer tes clusters, pourquoi pas le traditionnel analyse factorielle + CAH sur les coordonnées factorielles.
Pour ce qui est de la standardisation... Je ne connais pas trop tes données, donc difficile à dire. Si c'est pour faire toutes tes ANOVAs, pas de problème vu que tu les fait de façon indépendantes. Si tu fais une ACP, je te conseille de faire une ACP normée, étant donnée que tes données ne s'expriment pas dans la même échelle (densité, revenu par habitant, taux de croissance...) et donc n'ont pas la même amplitude. L'ACP non normée sera trop influencée par des variables aux variances fortes.
En espérant avoir répondu à tes questions
Invité- Invité
Re: Choix du test + préparation des données
Bonjour,
Ce sont des secteurs statistiques qui sont fixés (les données sont recueillies sur le terrain sur ces secteurs) et donc je dispose déjà des données par secteur.
Donc tu me conseillerais de faire une ANOVA pour chacun de mes indicateurs? Et là du coup pas besoin de standardiser. Et ensuite seulement faire une ANOVA reprenant les indicateurs significatifs?
L'ACP vient après, c'est un choix de mon promoteur de travailler d'abord avec une ANOVA. Elle sert à mettre en évidence les secteurs statistiques sur lesquels je devrai travailler et notamment réaliser une ACP englobant nettement plus de variables.
Merci pour ta réponse, elle m'apporte pas mal d'éclaircissements
Ce sont des secteurs statistiques qui sont fixés (les données sont recueillies sur le terrain sur ces secteurs) et donc je dispose déjà des données par secteur.
Donc tu me conseillerais de faire une ANOVA pour chacun de mes indicateurs? Et là du coup pas besoin de standardiser. Et ensuite seulement faire une ANOVA reprenant les indicateurs significatifs?
L'ACP vient après, c'est un choix de mon promoteur de travailler d'abord avec une ANOVA. Elle sert à mettre en évidence les secteurs statistiques sur lesquels je devrai travailler et notamment réaliser une ACP englobant nettement plus de variables.
Merci pour ta réponse, elle m'apporte pas mal d'éclaircissements
Matchieu- Nombre de messages : 16
Date d'inscription : 29/05/2011
Re: Choix du test + préparation des données
Voila, personellement je te conseillerai de faire les ANOVA une à une, pour identifier les indicateurs variant d'un secteur à l'autre.
Par contre je ne vois pas ce que tu veux dire quand tu parles de refaire une ANOVA derrière en ne prenant que les indicateurs intéressants...
Par contre je ne vois pas ce que tu veux dire quand tu parles de refaire une ANOVA derrière en ne prenant que les indicateurs intéressants...
Invité- Invité
Re: Choix du test + préparation des données
Désolé pour le retard, petit problème de pc^^
je parlais de ça mais en ayant lu un peu trop vite..
Sinon, d'un point de vue pratique, j'ai toujours réalisé des ANOVA avec excell, les données formant un tableau de x lignes * y colonnes. Ici, en réalisant une ANOVA pour chacun de mes indicateurs, je me retrouverais avec une colonne * 83 lignes. Ca ne pose pas de problèmes d'avoir une seule colonne?
Hadrien35 a écrit: Une autre alternative serait de faire une analyse factorielle (ACP ou autre) sur tes données, afin de voir quels indicateurs structurent tes données, et quels autres ne sont en quelques sortes que du bruit, puis de faire l'ANOVA sur les premiers.
je parlais de ça mais en ayant lu un peu trop vite..
Sinon, d'un point de vue pratique, j'ai toujours réalisé des ANOVA avec excell, les données formant un tableau de x lignes * y colonnes. Ici, en réalisant une ANOVA pour chacun de mes indicateurs, je me retrouverais avec une colonne * 83 lignes. Ca ne pose pas de problèmes d'avoir une seule colonne?
Matchieu- Nombre de messages : 16
Date d'inscription : 29/05/2011
Sujets similaires
» Choix de test, données appariées, 3 groupes
» Choix du test et interprétation pour des données qualitative
» Choix de transformation de données
» URGENT! Choix correct d'un jeu de données
» Choix d'une analyse statistique pour données de fréquence
» Choix du test et interprétation pour des données qualitative
» Choix de transformation de données
» URGENT! Choix correct d'un jeu de données
» Choix d'une analyse statistique pour données de fréquence
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum