Régression logistique pour petit échantillon

Voir le sujet précédent Voir le sujet suivant Aller en bas

Régression logistique pour petit échantillon

Message par Virginielc le Mar 29 Mar 2016 - 13:03

Bonjour,

J'ai un jeu de données avec :
- une variable qualitative à expliquer à deux modalités
- une variable explicative qualitative à 10 modalités et 18 variables explicatives quantitatives.
- 20 observations

Je voudrais prédire la variable qualitative à expliquer par le reste des variables. J'ai donc pensé à un modèle de régression logistique.

Je sais que j'ai plus de paramètres à estimer que d'observations mais je peux éventuellement supprimer ou regrouper des variables.

La question que je me pose est si on peut faire de la régression logistique sur un petit échantillon ?
Est-ce que ça a du sens de faire de la prédiction dans un cas comme celui la ?

Merci,

Virginie

Virginielc

Nombre de messages : 25
Date d'inscription : 29/03/2016

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Régression logistique pour petit échantillon

Message par Nik le Mar 29 Mar 2016 - 13:13

Bonjour,

Un modèle peut juste avoir une visée descriptive, notamment si on a un jeu de données restreint. il est clair que tu ne pourras pas faire de la prédiction avec ce jeux de données sans avoir une incertitude élevée autour de la prédiction.

Je sais que j'ai plus de paramètres à estimer que d'observations mais je peux éventuellement...
C'est pas éventuellement, c'est incontournable. Par contre, si les catégories ont été choisies de manière sensée, tu vas te retrouver avec des valeurs très variables de la variable à expliquer au sein des regroupements. Tu pourrais donc te retrouver avec des effets non-significatifs simplement parce que tu auras regroupé des vaches et des cochons...

Nik

Nik

Nombre de messages : 1501
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Régression logistique pour petit échantillon

Message par Virginielc le Mar 29 Mar 2016 - 13:38

Merci pour la réponse.

Mais qu'est ce que je peux faire alors ?

Je ne comprends pas trop, je vais pouvoir faire un modèle mais je ne pourrais pas prédire correctement ?

Si je ne conserve pas la variable explicative à 10 modalités, je serais dans une meilleure situation, car moins de paramètres à estimer ?

Y-a-t-il des hypothèses à vérifier sur les variables ? La normalité ?

Virginielc

Nombre de messages : 25
Date d'inscription : 29/03/2016

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Régression logistique pour petit échantillon

Message par Virginielc le Mar 29 Mar 2016 - 13:46

Une autre question peut être un peu bête..

Lorsque que l'on compare le modèle complet au modèle nul, et que le test est non significatif, cela veut dire que nos données ne permettent pas d'expliquer la variable Y ?

Il n'y a pas d’intérêt à faire une sélection de modèle si déjà le modèle complet n'est pas intéressant ?

Virginielc

Nombre de messages : 25
Date d'inscription : 29/03/2016

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Régression logistique pour petit échantillon

Message par c@ssoulet le Mar 29 Mar 2016 - 14:46

Normalement, il y a une règle de base toute simple à respecter pour éviter les biais d'interprétation les plus grossiers: avoir au moins 10 fois plus d'observations que de prédicteurs introduits dans le modèle.

Pose toi 2 secondes et oublie les maths compliqués. Tu as 20 observations et 19 prédicteurs => il est fort probable que beaucoup des "combinaisons" ne soient caractérisées que par 1 ou 2 points maxi, et que certaines aient un effectif nul.

Vouloir effectuer des prédictions fiables basées sur des nuages de 1 ou 2 points ca n'a pas de sens. Quel que soit le modèle, quelle que soit la magie que tu espères voir émerger des chiffres, tu es dans une situation sans issue. L'ordinateur te calculera peut etre des trucs, mais tu ne pourras accorder aucune confiance à ces trucs. Il est con l'ordinateur, il calcule connement ce qu'on lui demande. C'est pas à lui de décider si ce qu'on lui demande a un sens. C'est à toi.

Tout ca pour dire exactement la même chose que Nick finalement: tu ne peux pas aller au delà du descriptif.

c@ssoulet

Nombre de messages : 649
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Régression logistique pour petit échantillon

Message par Contenu sponsorisé Aujourd'hui à 0:16


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum