Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
GLM binomial et pb de données considérées comme manquantes
2 participants
Page 1 sur 1
GLM binomial et pb de données considérées comme manquantes
Bonsoir à tous,
Pour mon analyse statistique, je cherche à savoir si des facteurs ont une influence ou non sur des taux de germination de semences (mesuré au cours du temps, mais pas sur les mêmes individus, après fin floraison donc avec un certain nombre de données ou le taux est 0 puis un certain nombre de données ou le taux se rapproche de 100). Ma variable dépendante est donc un pourcentage, à expliquer par des variables qualitatives (3) et quantitatives (9 dont 5 sont en fait la décomposition d’une variable de couleur et une autre est un pourcentage). Après plusieurs recherches, le modèle qui me semble convenir le plus est un GLM avec comme famille d’erreur la loi binomial et la fonction de lien logit. J’ai fais tourner le modèle dans R et cela semble fonctionne à peu près, par contre pour certaines modalités R me transforme (ou m’indique) que des données sont manquantes (NA), ce qui n’est pas le cas.
Par exemple pour un extrait du « summary »
Estimate Std. Error z value Pr(>|z|)
AreaB -1.043309 0.545676 -1.912 0.055882 .
AreaC 0.271209 0.512446 0.529 0.596637
AreaD -0.672717 0.306689 -2.193 0.028272 *
AreaE -1.741699 0.314163 -5.544 2.96e-08 ***
AreaF NA NA NA NA
AreaG -0.100634 0.249968 -0.403 0.687252
AreaH -0.066565 0.272800 -0.244 0.807227
AreaI NA NA NA NA
Je ne comprends pas pourquoi cela arrive, quelqu’un aurait-il une réponse à m’apporter ?
Par ailleurs, en lisant plusieurs posts sur le forum, j’ai tenté de changer mon modèle avec la loi « quasibinomial » au lieu de binomial et la valeur du coefficient de dispersion est 6,93. Cela est-il trop éloigné de 1 ? Dans ce cas la loi binomial ne convient-elle pas pour le modèle (peut-être qu’une loi de poisson serait plus appropriée, j’ai 63 échantillons) ?
Merci par avance, et bonne soirée !
Pour mon analyse statistique, je cherche à savoir si des facteurs ont une influence ou non sur des taux de germination de semences (mesuré au cours du temps, mais pas sur les mêmes individus, après fin floraison donc avec un certain nombre de données ou le taux est 0 puis un certain nombre de données ou le taux se rapproche de 100). Ma variable dépendante est donc un pourcentage, à expliquer par des variables qualitatives (3) et quantitatives (9 dont 5 sont en fait la décomposition d’une variable de couleur et une autre est un pourcentage). Après plusieurs recherches, le modèle qui me semble convenir le plus est un GLM avec comme famille d’erreur la loi binomial et la fonction de lien logit. J’ai fais tourner le modèle dans R et cela semble fonctionne à peu près, par contre pour certaines modalités R me transforme (ou m’indique) que des données sont manquantes (NA), ce qui n’est pas le cas.
Par exemple pour un extrait du « summary »
Estimate Std. Error z value Pr(>|z|)
AreaB -1.043309 0.545676 -1.912 0.055882 .
AreaC 0.271209 0.512446 0.529 0.596637
AreaD -0.672717 0.306689 -2.193 0.028272 *
AreaE -1.741699 0.314163 -5.544 2.96e-08 ***
AreaF NA NA NA NA
AreaG -0.100634 0.249968 -0.403 0.687252
AreaH -0.066565 0.272800 -0.244 0.807227
AreaI NA NA NA NA
Je ne comprends pas pourquoi cela arrive, quelqu’un aurait-il une réponse à m’apporter ?
Par ailleurs, en lisant plusieurs posts sur le forum, j’ai tenté de changer mon modèle avec la loi « quasibinomial » au lieu de binomial et la valeur du coefficient de dispersion est 6,93. Cela est-il trop éloigné de 1 ? Dans ce cas la loi binomial ne convient-elle pas pour le modèle (peut-être qu’une loi de poisson serait plus appropriée, j’ai 63 échantillons) ?
Merci par avance, et bonne soirée !
FenneR2- Nombre de messages : 1
Date d'inscription : 24/09/2016
Re: GLM binomial et pb de données considérées comme manquantes
Bonjour,
Tu as deux possibilités pour que ce genre de résultats arrivent, soit la modalité est réellement manquante et donc tu ne peux pas estimer de coefficients, soit cette modalité est déjà "exprimée" par les autres modalités, elle se retrouve entièrement dans les autres (elles sont colinéaires) et dans ces cas là tu n'estimeras pas non plus de coefficients.
cdlt
Tu as deux possibilités pour que ce genre de résultats arrivent, soit la modalité est réellement manquante et donc tu ne peux pas estimer de coefficients, soit cette modalité est déjà "exprimée" par les autres modalités, elle se retrouve entièrement dans les autres (elles sont colinéaires) et dans ces cas là tu n'estimeras pas non plus de coefficients.
cdlt
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Sujets similaires
» Données manquantes
» Boxplot, problème données manquantes - debutante
» GLM pour deux données quantitatives comme VD
» Colloques "Données manquantes"
» Données manquantes MAR vs MNAR
» Boxplot, problème données manquantes - debutante
» GLM pour deux données quantitatives comme VD
» Colloques "Données manquantes"
» Données manquantes MAR vs MNAR
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum