Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Simulation d'une variable DÉPENDANTE Y par variables ind. Xn
2 participants
Page 1 sur 1
Simulation d'une variable DÉPENDANTE Y par variables ind. Xn
Bonjour bonjour !
je viens aujourd'hui vers vous car je suis actuellement devant une impasse. J'ai un bagage en Mathématique Appliquées (Msc MIASHS) et souhaiterai réaliser une méthode DISQUAL sur mes données afin de créer un score de propension pour Y=1 ou Y=0.
Le problème est le suivant :
je souhaite réaliser une régression (quelconque) sur mes individus, j'ai plusieurs variables qualitatives. Je ne possède pas ma variable Y. Je peux déduire si des individus prennent Y=1 ou Y=0, mais je ne pourrai jamais en être sûr. Cependant, je connais les caractéristiques communes et conditions minimum pour Y=1 (la tranche d'âge nécéssaire, le pays de naissance que je souhaite étudier, le niveau de scolarité minimum...), au travers de mes variables indépendantes X.
Comment simuler une variable dépendante Y à partir de variables indépendantes X ?
On m'a recommandé de simplement simuler Y par génération aléatoire d'individus. Cependant, j'aimerai pouvoir inclure dans la simulation de Y les informations contenues dans mes X et ne pas simplement compter sur l'aléatoire... Puisqu'une fois que j'aurai cette variable Y simulé, je veux ENSUITE y appliquer une méthode DISQUAL (ACM + Analyse Discriminante). Une régression sur une régrssion donc. J'imagine que du biais et de l'imprécision seront intégrés à mon modèle, c'est pour cela que je cherche à simuler Y en fonction de mes X et non simplement compter sur l'aléatoire et l'apprentissage de mon modèle.
Je ne sais pas si cela est très clair, n'hésitez pas si besoin !
en espérant que quelqu'un y voit plus clair que moi, MERCI !
Clément.
je viens aujourd'hui vers vous car je suis actuellement devant une impasse. J'ai un bagage en Mathématique Appliquées (Msc MIASHS) et souhaiterai réaliser une méthode DISQUAL sur mes données afin de créer un score de propension pour Y=1 ou Y=0.
Le problème est le suivant :
je souhaite réaliser une régression (quelconque) sur mes individus, j'ai plusieurs variables qualitatives. Je ne possède pas ma variable Y. Je peux déduire si des individus prennent Y=1 ou Y=0, mais je ne pourrai jamais en être sûr. Cependant, je connais les caractéristiques communes et conditions minimum pour Y=1 (la tranche d'âge nécéssaire, le pays de naissance que je souhaite étudier, le niveau de scolarité minimum...), au travers de mes variables indépendantes X.
Comment simuler une variable dépendante Y à partir de variables indépendantes X ?
On m'a recommandé de simplement simuler Y par génération aléatoire d'individus. Cependant, j'aimerai pouvoir inclure dans la simulation de Y les informations contenues dans mes X et ne pas simplement compter sur l'aléatoire... Puisqu'une fois que j'aurai cette variable Y simulé, je veux ENSUITE y appliquer une méthode DISQUAL (ACM + Analyse Discriminante). Une régression sur une régrssion donc. J'imagine que du biais et de l'imprécision seront intégrés à mon modèle, c'est pour cela que je cherche à simuler Y en fonction de mes X et non simplement compter sur l'aléatoire et l'apprentissage de mon modèle.
Je ne sais pas si cela est très clair, n'hésitez pas si besoin !
en espérant que quelqu'un y voit plus clair que moi, MERCI !
Clément.
Clement_mtl- Nombre de messages : 2
Date d'inscription : 07/06/2018
Re: Simulation d'une variable DÉPENDANTE Y par variables ind. Xn
SI, c'est clair. La clé de votre question est de passer par une régression logistique, dans laquelle on donne (ou on estime) l'influence des variables X sur le logit de la variable p qui est la proba d'avoir Y=0 ou Y=1. Le logit de p vaut (log(p/(1-p)). Avec ceci, pour n'importe quelle valeur des variables X on connait p, et on tire Y=0 ou Y=1 au hasard en fonction de cette proba p.
A mon tour de dire que j'espère que cette réponse soit claire. Sinon, n'hésitez pas à demander des explications supplémentaires.
HTH, Eric.
A mon tour de dire que j'espère que cette réponse soit claire. Sinon, n'hésitez pas à demander des explications supplémentaires.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Simulation d'une variable DÉPENDANTE Y par variables ind. Xn
Bonjour Eric,
merci pour votre réponse !
Je comprends effectivement la méthode proposée, cependant je ne vois pas comment mettre en application l'estimation de l'influence des variables X sur le logit de ma variable p sur SAS/STATA. Comment modéliser cette influence ?
merci pour votre réponse !
Je comprends effectivement la méthode proposée, cependant je ne vois pas comment mettre en application l'estimation de l'influence des variables X sur le logit de ma variable p sur SAS/STATA. Comment modéliser cette influence ?
Clement_mtl- Nombre de messages : 2
Date d'inscription : 07/06/2018
Re: Simulation d'une variable DÉPENDANTE Y par variables ind. Xn
Il faut ajuster ce qu'on appelle une régression logistique à vos données, comme je l'ai dit dans ma réponse. Tout les logiciels de statistiques font cela.
Eric.
Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Sujets similaires
» Choix de la meilleure variable dépendante
» ACP avant régression linéaire-variable dépendante
» Linear probability model (OLS avec variable dependante 1 é 0
» Variance partagée entre variable indépendante et dépendante
» régression linéaire avec variable dépendante retardée
» ACP avant régression linéaire-variable dépendante
» Linear probability model (OLS avec variable dependante 1 é 0
» Variance partagée entre variable indépendante et dépendante
» régression linéaire avec variable dépendante retardée
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum