Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Modèle GEE
2 participants
Page 1 sur 1
Modèle GEE
Bonjour à tous,
Je dois utiliser un modèle GEE mais je me demande si il y a un critère de sélection de variables?
Par exemple, dans une regression logistique, il faut d'abord faire une analyse univariée et mettre dans le modèle les variables avec un p<0.20 mais qu'en est-il pour un modèle GEE?
Doit on faire une analyse univariée? faire un modèle avec une seule variable et la sélectionner si significative?
Puis ensuite, une fois les variables choisies, est-ce comme la régression logistique descendante, on retire celle qui a le p le plus important et ainsi de suite?
Merci de votre aide.
Anastasia
Je dois utiliser un modèle GEE mais je me demande si il y a un critère de sélection de variables?
Par exemple, dans une regression logistique, il faut d'abord faire une analyse univariée et mettre dans le modèle les variables avec un p<0.20 mais qu'en est-il pour un modèle GEE?
Doit on faire une analyse univariée? faire un modèle avec une seule variable et la sélectionner si significative?
Puis ensuite, une fois les variables choisies, est-ce comme la régression logistique descendante, on retire celle qui a le p le plus important et ainsi de suite?
Merci de votre aide.
Anastasia
anastasia024- Nombre de messages : 1
Date d'inscription : 12/04/2011
Re: Modèle GEE
C'est marrant, c'est pas la première fois que je lis que la sélection de variable est faite par une analyse univariée et la conservation des variables pour lesquelles la proba est inférieure à 20%... Est ce que je pourrais savoir où vous avez appris ça? (simple question, vu que j'en ai jamais entendu parlé, mais bon, j'ai pas fait une école de stats).
Sinon pour répondre à ton problème, je ne sais pas ce qu'est un GEE donc...
Mais je vais essayer de répondre quand même...
Ta méthode est une des méthodes possible, seulement tu ne considère pas le fait que ta première variable supprimée puisse devenir intéressante quand tu en as supprimé plusieurs autres... (et puis quand est ce que tu t'arretes?)
Tu peux peut-être, en fonction du logiciel que tu utilise, effectuer une procédure de sélection de variable à la fois ascendante et descendante, qui remet donc en cause les étapes de sélections antérieures...
Sinon pour répondre à ton problème, je ne sais pas ce qu'est un GEE donc...
Mais je vais essayer de répondre quand même...
Ta méthode est une des méthodes possible, seulement tu ne considère pas le fait que ta première variable supprimée puisse devenir intéressante quand tu en as supprimé plusieurs autres... (et puis quand est ce que tu t'arretes?)
Tu peux peut-être, en fonction du logiciel que tu utilise, effectuer une procédure de sélection de variable à la fois ascendante et descendante, qui remet donc en cause les étapes de sélections antérieures...
Invité- Invité
Re: Modèle GEE
GEE : "Generelized Estimated Equation"
Pour la sélection de variable dans les modèles, il n'y a pas de critère particulier sur une p-value quel que soit le type de modèle choisi (GLM logistique, GEE, GAM etc...). Le critère p<0.20 n'a aucune signification ni justification théorique. Si la p-value a un sens pour la distribution de la statistique du test associé à chaque paramètre, elle n'en a aucun pour le modèle qui t'intéresse à savoir le modèle qui ajuste au mieux tes données et qui permet les prédiction les plus fiables.
Les sélection type stepwise (ascendantes, descendantes, et dans les deux sens) ne permettent pas d'obtenir le "meilleur" modèle et en plus ce sont de jolies boites noires dans lesquelles tout repose sur le choix de l'algorithme de sélection.
En ce qui concerne la sélection de modèle pour les GEE, il faut juste vérifier si l'estimation des paramètres se fait au maximum de vraisemblance ou pas. Si oui alors il faut regarder la sélection de modèle sur critère d'information qui est beaucoup plus adapté pour définir un modèle adapté au données.
voir par exemple ICI pour des éléments d'information
Nik
Pour la sélection de variable dans les modèles, il n'y a pas de critère particulier sur une p-value quel que soit le type de modèle choisi (GLM logistique, GEE, GAM etc...). Le critère p<0.20 n'a aucune signification ni justification théorique. Si la p-value a un sens pour la distribution de la statistique du test associé à chaque paramètre, elle n'en a aucun pour le modèle qui t'intéresse à savoir le modèle qui ajuste au mieux tes données et qui permet les prédiction les plus fiables.
Les sélection type stepwise (ascendantes, descendantes, et dans les deux sens) ne permettent pas d'obtenir le "meilleur" modèle et en plus ce sont de jolies boites noires dans lesquelles tout repose sur le choix de l'algorithme de sélection.
En ce qui concerne la sélection de modèle pour les GEE, il faut juste vérifier si l'estimation des paramètres se fait au maximum de vraisemblance ou pas. Si oui alors il faut regarder la sélection de modèle sur critère d'information qui est beaucoup plus adapté pour définir un modèle adapté au données.
voir par exemple ICI pour des éléments d'information
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum