Les posteurs les plus actifs de la semaine
Eric Wajnberg
 


GLM binomial et pb de données considérées comme manquantes

Aller en bas

GLM binomial et pb de données considérées comme manquantes

Message par FenneR2 le Sam 24 Sep 2016 - 20:48

Bonsoir à tous,
Pour mon analyse statistique, je cherche à savoir si des facteurs ont une influence ou non sur des taux de germination de semences (mesuré au cours du temps, mais pas sur les mêmes individus, après fin floraison donc avec un certain nombre de données ou le taux est 0 puis un certain nombre de données ou le taux se rapproche de 100). Ma variable dépendante est donc un pourcentage, à expliquer par des variables qualitatives (3) et quantitatives (9 dont 5 sont en fait la décomposition d’une variable de couleur et une autre est un pourcentage). Après plusieurs recherches, le modèle qui me semble convenir le plus est un GLM avec comme famille d’erreur la loi binomial et la fonction de lien logit. J’ai fais tourner le modèle dans R et cela semble fonctionne à peu près, par contre pour certaines modalités R me transforme (ou m’indique) que des données sont manquantes (NA), ce qui n’est pas le cas.
Par exemple pour un extrait du « summary »
                 Estimate Std. Error z value Pr(>|z|)
AreaB            -1.043309   0.545676  -1.912 0.055882 .  
AreaC             0.271209   0.512446   0.529 0.596637    
AreaD            -0.672717   0.306689  -2.193 0.028272 *  
AreaE            -1.741699   0.314163  -5.544 2.96e-08 ***
AreaF                   NA         NA      NA       NA    
AreaG            -0.100634   0.249968  -0.403 0.687252    
AreaH            -0.066565   0.272800  -0.244 0.807227    
AreaI                   NA         NA      NA       NA

Je ne comprends pas pourquoi cela arrive, quelqu’un aurait-il une réponse à m’apporter ?
Par ailleurs, en lisant plusieurs posts sur le forum, j’ai tenté de changer mon modèle avec la loi « quasibinomial » au lieu de binomial et la valeur du coefficient de dispersion est 6,93. Cela est-il trop éloigné de 1 ? Dans ce cas la loi binomial ne convient-elle pas pour le modèle (peut-être qu’une loi de poisson serait plus appropriée, j’ai 63 échantillons) ?

Merci par avance, et bonne soirée !

FenneR2

Nombre de messages : 1
Date d'inscription : 24/09/2016

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: GLM binomial et pb de données considérées comme manquantes

Message par droopy le Lun 26 Sep 2016 - 7:57

Bonjour,

Tu as deux possibilités pour que ce genre de résultats arrivent, soit la modalité est réellement manquante et donc tu ne peux pas estimer de coefficients, soit cette modalité est déjà "exprimée" par les autres modalités, elle se retrouve entièrement dans les autres (elles sont colinéaires) et dans ces cas là tu n'estimeras pas non plus de coefficients.

cdlt
avatar
droopy

Nombre de messages : 1109
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum