Les posteurs les plus actifs de la semaine


Prise en compte valeurs NA dans GLM

Aller en bas

Prise en compte valeurs NA dans GLM Empty Prise en compte valeurs NA dans GLM

Message par kevin135 le Mar 20 Aoû 2013 - 17:38

Bonsoir à tous,

nouveau sur le forum, et débutant en statistiques, j'ai un important jeu de données à traiter. J'ai donc une dizaine de variables que je veux intégrer dans un GLM, j'utilise une loi de poisson.

Dans ce jeu de données certaines variables possèdent des absences de données que j'ai nommées NA. Or quand je lance le GLM il fait automatiquement le tri et ne considère pas les lignes présentant un NA, car j'obtiens un nombre de ddl nettement inférieur à mon nombre de lignes.
Le problème est que ces NA sont répartis selon les variables assez aléatoirement, et le fait que mon GLM me retire une ligne à chaque fois qu'une variable possède un NA, au bout du compte je me retrouve avec moins de 20 lignes sur 150, et ce simplement à cause 2 variables qui possèdent des NA sur les 10, rendant ainsi mon modèle bien moins robuste.

J'ai fais des recherches mais je bloque vraiment complètement, tout ce que j'ai trouvé sur les NA se rapportent au na.omit ou autre qui ne répondent pas à mon problème.

En vous remerciant sincèrement pour votre aide,

Kévin

kevin135

Nombre de messages : 1
Date d'inscription : 20/08/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Prise en compte valeurs NA dans GLM Empty Re: Prise en compte valeurs NA dans GLM

Message par Ayana le Mer 21 Aoû 2013 - 7:18

Bonjour,

Quel que soit le logiciel utilisé, il est possible de faire une régression multivariée seulement quand il n'y a aucune donnée manquante, tout simplement car le but est d'exprimer la variable dépendante comme une combinaison( linéaire, log-linéaire ou autre) des covariables. Avec les données manquantes deux possibilités :
- soit réduire le nombre de variables (en éliminant si c'est possibles celles pour lesquelles on a le plus de données manquantes)
- utiliser des stratégies d'imputation pour les données manquantes. Il existe toute une littérature là-dessus. cela permet de combler les "trous" dans ta base de données

Ayana
Ayana
Ayana

Nombre de messages : 524
Localisation : Londres
Date d'inscription : 18/08/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum