Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Régression logistique pour petit échantillon
3 participants
Page 1 sur 1
Régression logistique pour petit échantillon
Bonjour,
J'ai un jeu de données avec :
- une variable qualitative à expliquer à deux modalités
- une variable explicative qualitative à 10 modalités et 18 variables explicatives quantitatives.
- 20 observations
Je voudrais prédire la variable qualitative à expliquer par le reste des variables. J'ai donc pensé à un modèle de régression logistique.
Je sais que j'ai plus de paramètres à estimer que d'observations mais je peux éventuellement supprimer ou regrouper des variables.
La question que je me pose est si on peut faire de la régression logistique sur un petit échantillon ?
Est-ce que ça a du sens de faire de la prédiction dans un cas comme celui la ?
Merci,
Virginie
J'ai un jeu de données avec :
- une variable qualitative à expliquer à deux modalités
- une variable explicative qualitative à 10 modalités et 18 variables explicatives quantitatives.
- 20 observations
Je voudrais prédire la variable qualitative à expliquer par le reste des variables. J'ai donc pensé à un modèle de régression logistique.
Je sais que j'ai plus de paramètres à estimer que d'observations mais je peux éventuellement supprimer ou regrouper des variables.
La question que je me pose est si on peut faire de la régression logistique sur un petit échantillon ?
Est-ce que ça a du sens de faire de la prédiction dans un cas comme celui la ?
Merci,
Virginie
Virginielc- Nombre de messages : 26
Date d'inscription : 29/03/2016
Re: Régression logistique pour petit échantillon
Bonjour,
Un modèle peut juste avoir une visée descriptive, notamment si on a un jeu de données restreint. il est clair que tu ne pourras pas faire de la prédiction avec ce jeux de données sans avoir une incertitude élevée autour de la prédiction.
Nik
Un modèle peut juste avoir une visée descriptive, notamment si on a un jeu de données restreint. il est clair que tu ne pourras pas faire de la prédiction avec ce jeux de données sans avoir une incertitude élevée autour de la prédiction.
C'est pas éventuellement, c'est incontournable. Par contre, si les catégories ont été choisies de manière sensée, tu vas te retrouver avec des valeurs très variables de la variable à expliquer au sein des regroupements. Tu pourrais donc te retrouver avec des effets non-significatifs simplement parce que tu auras regroupé des vaches et des cochons...Je sais que j'ai plus de paramètres à estimer que d'observations mais je peux éventuellement...
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Régression logistique pour petit échantillon
Merci pour la réponse.
Mais qu'est ce que je peux faire alors ?
Je ne comprends pas trop, je vais pouvoir faire un modèle mais je ne pourrais pas prédire correctement ?
Si je ne conserve pas la variable explicative à 10 modalités, je serais dans une meilleure situation, car moins de paramètres à estimer ?
Y-a-t-il des hypothèses à vérifier sur les variables ? La normalité ?
Mais qu'est ce que je peux faire alors ?
Je ne comprends pas trop, je vais pouvoir faire un modèle mais je ne pourrais pas prédire correctement ?
Si je ne conserve pas la variable explicative à 10 modalités, je serais dans une meilleure situation, car moins de paramètres à estimer ?
Y-a-t-il des hypothèses à vérifier sur les variables ? La normalité ?
Virginielc- Nombre de messages : 26
Date d'inscription : 29/03/2016
Re: Régression logistique pour petit échantillon
Une autre question peut être un peu bête..
Lorsque que l'on compare le modèle complet au modèle nul, et que le test est non significatif, cela veut dire que nos données ne permettent pas d'expliquer la variable Y ?
Il n'y a pas d’intérêt à faire une sélection de modèle si déjà le modèle complet n'est pas intéressant ?
Lorsque que l'on compare le modèle complet au modèle nul, et que le test est non significatif, cela veut dire que nos données ne permettent pas d'expliquer la variable Y ?
Il n'y a pas d’intérêt à faire une sélection de modèle si déjà le modèle complet n'est pas intéressant ?
Virginielc- Nombre de messages : 26
Date d'inscription : 29/03/2016
Re: Régression logistique pour petit échantillon
Normalement, il y a une règle de base toute simple à respecter pour éviter les biais d'interprétation les plus grossiers: avoir au moins 10 fois plus d'observations que de prédicteurs introduits dans le modèle.
Pose toi 2 secondes et oublie les maths compliqués. Tu as 20 observations et 19 prédicteurs => il est fort probable que beaucoup des "combinaisons" ne soient caractérisées que par 1 ou 2 points maxi, et que certaines aient un effectif nul.
Vouloir effectuer des prédictions fiables basées sur des nuages de 1 ou 2 points ca n'a pas de sens. Quel que soit le modèle, quelle que soit la magie que tu espères voir émerger des chiffres, tu es dans une situation sans issue. L'ordinateur te calculera peut etre des trucs, mais tu ne pourras accorder aucune confiance à ces trucs. Il est con l'ordinateur, il calcule connement ce qu'on lui demande. C'est pas à lui de décider si ce qu'on lui demande a un sens. C'est à toi.
Tout ca pour dire exactement la même chose que Nick finalement: tu ne peux pas aller au delà du descriptif.
Pose toi 2 secondes et oublie les maths compliqués. Tu as 20 observations et 19 prédicteurs => il est fort probable que beaucoup des "combinaisons" ne soient caractérisées que par 1 ou 2 points maxi, et que certaines aient un effectif nul.
Vouloir effectuer des prédictions fiables basées sur des nuages de 1 ou 2 points ca n'a pas de sens. Quel que soit le modèle, quelle que soit la magie que tu espères voir émerger des chiffres, tu es dans une situation sans issue. L'ordinateur te calculera peut etre des trucs, mais tu ne pourras accorder aucune confiance à ces trucs. Il est con l'ordinateur, il calcule connement ce qu'on lui demande. C'est pas à lui de décider si ce qu'on lui demande a un sens. C'est à toi.
Tout ca pour dire exactement la même chose que Nick finalement: tu ne peux pas aller au delà du descriptif.
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Sujets similaires
» Quel test statistique pour ce petit échantillon?
» Régression logistique et taille d'échantillon
» Regression Logistique / Taille échantillon / STATISTICA
» Calculer un sample-size pour régression logistique ordinale
» Quel indicateur pour un bon modèle de régression logistique
» Régression logistique et taille d'échantillon
» Regression Logistique / Taille échantillon / STATISTICA
» Calculer un sample-size pour régression logistique ordinale
» Quel indicateur pour un bon modèle de régression logistique
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum