Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Choisir entre deux méthodes: modèle logistique ou Ancova
2 participants
Page 1 sur 1
Choisir entre deux méthodes: modèle logistique ou Ancova
Bonjour à tous,
Je me permets d'écrire ici car un doute me taraude. Je vous explique mon cas de manière simplifiée : je ne suis pas spécialiste de statistique mais je dois m'en servir constamment dans mon travail. Je travaille sur la conversion de parcelles préalablement classées dans ma base de données d'occupation du sol comme terres agricoles, forêts, milieux naturels divers et variés, friches. Par conversion, j'entends ici "artificialisation", transformation de ces parcelles en parcelles de type urbain. Je cherche à savoir si le fait d'être proche d'une infrastructure de transport (ce sont des points: stations, entrées d'autoroute...) conduit à une plus grande tendance à la conversion: plus on est proche d'une infra, plus la conversion est probable, mais pas nécessairement de manière linéaire. Je dispose d'un certain nombre de variables de contrôle liées à la caractérisation de mes parcelles et à l'environnement communal (population et tout ce genre de choses). Pour des raisons qu'il serait trop long d'expliquer ici, j'ai établi trois anneaux autour des mes stations: 0-800 mètres, 800-1200 mètres, > 1200 mètres. Donc, mon hypothèse de travail, c'est que la conversion a tendance à s'opérer de manière privilégiée dans le premier anneau. J'hésite ici entre deux méthodes:
1) Un modèle logistique, qui me fait poser la question suivante: "la probabilité de conversion d'une parcelle est-elle significativement plus grande dans le premier anneau que dans les autres ?", dans lequel je pose la conversion (oui = 1, non = 0) comme variable dépendante, l'appartenance à l'un des trois anneaux comme variable indépendante, et toute une série d'autres variables comme variables de contrôle.
2) Une Ancova, qui me fait poser la question de manière différente, tout en me faisant travailler non plus à l'échelle de ma parcelle, mais des communes (auquel cas, je prends des % de conversion par communexanneau) : "y a-t-il une différence significative entre les % de conversion dans les différents anneaux considérés?" Là, je pose comme variable dépendante le % de conversion, je pose comme variable indépendante l'appartenance à l'un des 3 anneaux, et tout plein d'autres variables sont des co-variables.
Avant de me décider sur la méthode, et avant de commettre une décision mal argumentée, je me demandais quelles étaient les bonnes questions à se poser en matière de statistiques, qui pourraient m'orienter vers l'une ou l'autre.
Merci d'avance pour votre aide,
jmnp
Je me permets d'écrire ici car un doute me taraude. Je vous explique mon cas de manière simplifiée : je ne suis pas spécialiste de statistique mais je dois m'en servir constamment dans mon travail. Je travaille sur la conversion de parcelles préalablement classées dans ma base de données d'occupation du sol comme terres agricoles, forêts, milieux naturels divers et variés, friches. Par conversion, j'entends ici "artificialisation", transformation de ces parcelles en parcelles de type urbain. Je cherche à savoir si le fait d'être proche d'une infrastructure de transport (ce sont des points: stations, entrées d'autoroute...) conduit à une plus grande tendance à la conversion: plus on est proche d'une infra, plus la conversion est probable, mais pas nécessairement de manière linéaire. Je dispose d'un certain nombre de variables de contrôle liées à la caractérisation de mes parcelles et à l'environnement communal (population et tout ce genre de choses). Pour des raisons qu'il serait trop long d'expliquer ici, j'ai établi trois anneaux autour des mes stations: 0-800 mètres, 800-1200 mètres, > 1200 mètres. Donc, mon hypothèse de travail, c'est que la conversion a tendance à s'opérer de manière privilégiée dans le premier anneau. J'hésite ici entre deux méthodes:
1) Un modèle logistique, qui me fait poser la question suivante: "la probabilité de conversion d'une parcelle est-elle significativement plus grande dans le premier anneau que dans les autres ?", dans lequel je pose la conversion (oui = 1, non = 0) comme variable dépendante, l'appartenance à l'un des trois anneaux comme variable indépendante, et toute une série d'autres variables comme variables de contrôle.
2) Une Ancova, qui me fait poser la question de manière différente, tout en me faisant travailler non plus à l'échelle de ma parcelle, mais des communes (auquel cas, je prends des % de conversion par communexanneau) : "y a-t-il une différence significative entre les % de conversion dans les différents anneaux considérés?" Là, je pose comme variable dépendante le % de conversion, je pose comme variable indépendante l'appartenance à l'un des 3 anneaux, et tout plein d'autres variables sont des co-variables.
Avant de me décider sur la méthode, et avant de commettre une décision mal argumentée, je me demandais quelles étaient les bonnes questions à se poser en matière de statistiques, qui pourraient m'orienter vers l'une ou l'autre.
Merci d'avance pour votre aide,
jmnp
jmnp- Nombre de messages : 2
Date d'inscription : 21/05/2012
Re: Choisir entre deux méthodes: modèle logistique ou Ancova
Salut,
ce n'est pas une question de stat mais une question d'échelle de travail. Tes deux modèles sont identiques dans leur construction à l'échelle près. Ce sont tous les deux des régressions logistiques car ta variable expiquée est de type 0/1 et il s'agit dans les deux cas d'un modèle de type ANCOVA car tu as une variable indépendante catégorielle sur laquelle tu vas regarder les différences de paramètres entre les catégories.
C'est donc à toi de voir si tu entres la variable commune comme variable de regroupement en plus des anneaux ou toute seule...TU peux faire de la sélection de modèle pour savoir quel modèle est le mieux porté par les données.
nik
ce n'est pas une question de stat mais une question d'échelle de travail. Tes deux modèles sont identiques dans leur construction à l'échelle près. Ce sont tous les deux des régressions logistiques car ta variable expiquée est de type 0/1 et il s'agit dans les deux cas d'un modèle de type ANCOVA car tu as une variable indépendante catégorielle sur laquelle tu vas regarder les différences de paramètres entre les catégories.
C'est donc à toi de voir si tu entres la variable commune comme variable de regroupement en plus des anneaux ou toute seule...TU peux faire de la sélection de modèle pour savoir quel modèle est le mieux porté par les données.
nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Choisir entre deux méthodes: modèle logistique ou Ancova
Merci pour la réponse !
jmnp- Nombre de messages : 2
Date d'inscription : 21/05/2012
Sujets similaires
» Comparaison entre deux méthodes statistiques
» choix entre méthodes de selection régression logistique
» Différences entre deux populations SAS / Modèle Logit
» Correlation entre méthodes diagnostiques
» test Z: deux méthodes de lecture?
» choix entre méthodes de selection régression logistique
» Différences entre deux populations SAS / Modèle Logit
» Correlation entre méthodes diagnostiques
» test Z: deux méthodes de lecture?
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|