Les posteurs les plus actifs de la semaine
Jeric
regression - Régression logistique pondérée Vote_lcapregression - Régression logistique pondérée Voting_barregression - Régression logistique pondérée Vote_rcap 
Schwarzlowe
regression - Régression logistique pondérée Vote_lcapregression - Régression logistique pondérée Voting_barregression - Régression logistique pondérée Vote_rcap 
mimran
regression - Régression logistique pondérée Vote_lcapregression - Régression logistique pondérée Voting_barregression - Régression logistique pondérée Vote_rcap 
gtoubonstras
regression - Régression logistique pondérée Vote_lcapregression - Régression logistique pondérée Voting_barregression - Régression logistique pondérée Vote_rcap 


Régression logistique pondérée

Aller en bas

regression - Régression logistique pondérée Empty Régression logistique pondérée

Message par damgui le Jeu 25 Aoû 2016 - 13:09

Bonjour tout le monde,

Je souhaite calculer un score via une régression logistique. Par contre, mes lignes contiennent 1 ou plusieurs individus. Je dois donc passer par une régression logistique pondérée.
Ma question porte sur le rééquilibrage des données. Dans mes données, j'ai pour la variable à expliquer un fort déséquilibre au niveau du nombre de lignes et du nombre d'individus. Je vais donc rééquilibrer les données car j'ai assez d'effectif.

Ma question est la suivante : dois-je rééquilibrer les données en fonction du nombre de lignes ou du nombre d'individus ? Car dans un cas j'ai pour la modalité oui 11% des lignes contre 1% des individus ? Dois-je obtenir environ 50-50 au niveau des lignes ou du nombre d'individus ?

Pour essayer d'être plus clair voici un extrait de mes données :

IDYPoids
1Oui50
2Non2
3Oui20
4Non10

Merci par avance,
Damien

damgui

Nombre de messages : 39
Age : 29
Date d'inscription : 14/06/2012

http://www.apprenti-webmarketeur.com

Revenir en haut Aller en bas

regression - Régression logistique pondérée Empty Re: Régression logistique pondérée

Message par Eric Wajnberg le Ven 26 Aoû 2016 - 4:59

Je ne comprends pas ce que veut dire ici "rééquilibrer". S'agit-il de virer des données ? J'espère que non.

Je ne comprends pas non plus la question sur les lignes ou les individus. Vous dites que vos lignes contiennent un ou plusieurs individus, mais il n'y a qu'un individu par ligne dans l'extrait de vos données que vous fournissez. Pouvez-vous expliquer d'avantage, et donner également un extrait de vos données avec plusieurs individus par ligne ?

Eric.
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1111
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum