Les posteurs les plus actifs de la semaine


Simulation d'une variable DÉPENDANTE Y par variables ind. Xn

Aller en bas

Simulation d'une variable DÉPENDANTE Y par variables ind. Xn

Message par Clement_mtl le Jeu 7 Juin 2018 - 17:59

Bonjour bonjour !

je viens aujourd'hui vers vous car je suis actuellement devant une impasse. J'ai un bagage en Mathématique Appliquées (Msc MIASHS) et souhaiterai réaliser une méthode DISQUAL sur mes données afin de créer un score de propension pour Y=1 ou Y=0.

Le problème est le suivant :

je souhaite réaliser une régression (quelconque) sur mes individus, j'ai plusieurs variables qualitatives. Je ne possède pas ma variable Y. Je peux déduire si des individus prennent Y=1 ou Y=0, mais je ne pourrai jamais en être sûr. Cependant, je connais les caractéristiques communes et conditions minimum pour Y=1 (la tranche d'âge nécéssaire, le pays de naissance que je souhaite étudier, le niveau de scolarité minimum...), au travers de mes variables indépendantes X.


Comment simuler une variable dépendante Y à partir de variables indépendantes X ?

On m'a recommandé de simplement simuler Y par génération aléatoire d'individus. Cependant, j'aimerai pouvoir inclure dans la simulation de Y les informations contenues dans mes X et ne pas simplement compter sur l'aléatoire... Puisqu'une fois que j'aurai cette variable Y simulé, je veux ENSUITE y appliquer une méthode DISQUAL (ACM + Analyse Discriminante). Une régression sur une régrssion donc. J'imagine que du biais et de l'imprécision seront intégrés à mon modèle, c'est pour cela que je cherche à simuler Y en fonction de mes X et non simplement compter sur l'aléatoire et l'apprentissage de mon modèle.

Je ne sais pas si cela est très clair, n'hésitez pas si besoin !

en espérant que quelqu'un y voit plus clair que moi, MERCI !

Clément.

Clement_mtl

Nombre de messages : 2
Date d'inscription : 07/06/2018

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Simulation d'une variable DÉPENDANTE Y par variables ind. Xn

Message par Eric Wajnberg le Sam 9 Juin 2018 - 6:53

SI, c'est clair. La clé de votre question est de passer par une régression logistique, dans laquelle on donne (ou on estime) l'influence des variables X sur le logit de la variable p qui est la proba d'avoir Y=0 ou  Y=1. Le logit de p vaut (log(p/(1-p)). Avec ceci, pour n'importe quelle valeur des variables X on connait p, et on tire Y=0 ou Y=1 au hasard en fonction de cette proba p.

A mon tour de dire que j'espère que cette réponse soit claire. Sinon, n'hésitez pas à demander des explications supplémentaires.

HTH, Eric.
avatar
Eric Wajnberg

Nombre de messages : 917
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Simulation d'une variable DÉPENDANTE Y par variables ind. Xn

Message par Clement_mtl le Lun 11 Juin 2018 - 15:28

Bonjour Eric,

merci pour votre réponse !
Je comprends effectivement la méthode proposée, cependant je ne vois pas comment mettre en application l'estimation de l'influence des variables X sur le logit de ma variable p sur SAS/STATA. Comment modéliser cette influence ?

Clement_mtl

Nombre de messages : 2
Date d'inscription : 07/06/2018

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Simulation d'une variable DÉPENDANTE Y par variables ind. Xn

Message par Eric Wajnberg le Mar 12 Juin 2018 - 5:23

Il faut ajuster ce qu'on appelle une régression logistique à vos données, comme je l'ai dit dans ma réponse. Tout les logiciels de statistiques font cela.

Eric.
avatar
Eric Wajnberg

Nombre de messages : 917
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Simulation d'une variable DÉPENDANTE Y par variables ind. Xn

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum