Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Corrélation ? Régression ?
2 participants
Page 1 sur 1
Corrélation ? Régression ?
Bonjour à tous et d'avance merci pour votre aide,
Je souhaiterais savoir s'il existe des liens entre mes variables "explicatives" (17 variables binaires et 1 numérique parmi un ensemble fini) et ma dernière variable (numérique réelle entre 0 et 1).
Je pensais déjà réaliser des tests de corrélation entre chacune des variables explicatives et la variables à expliquer. Cela semble-t-il pertinent ?
Par ailleurs, j'aimerais estimer également quelle combinaison de valeur pour mes variables me donnerait la plus haute valeur pour ma variable explicative. Ça se fait avec de la régression multiple ?
Excusez mon manque de rigueur, n'hésitez pas à me corriger, et merci encore pour votre aide.
EDIT: je me rends compte par après d'une bêtise: la corrélation et la régression sur des variables binaires ça a pas l'air cohérent. Donc si vous avez une idée de ce que je pourrais faire à la place je vous en serais reconnaissant.
Je souhaiterais savoir s'il existe des liens entre mes variables "explicatives" (17 variables binaires et 1 numérique parmi un ensemble fini) et ma dernière variable (numérique réelle entre 0 et 1).
Je pensais déjà réaliser des tests de corrélation entre chacune des variables explicatives et la variables à expliquer. Cela semble-t-il pertinent ?
Par ailleurs, j'aimerais estimer également quelle combinaison de valeur pour mes variables me donnerait la plus haute valeur pour ma variable explicative. Ça se fait avec de la régression multiple ?
Excusez mon manque de rigueur, n'hésitez pas à me corriger, et merci encore pour votre aide.
EDIT: je me rends compte par après d'une bêtise: la corrélation et la régression sur des variables binaires ça a pas l'air cohérent. Donc si vous avez une idée de ce que je pourrais faire à la place je vous en serais reconnaissant.
KadriK- Nombre de messages : 6
Date d'inscription : 09/07/2013
Re: Corrélation ? Régression ?
non, ça donne une idée fausse du modèle plus complet. Par contre il faut regarder que tes variables explicatives ne soient pas trop corrélées entre elles.Je pensais déjà réaliser des tests de corrélation entre chacune des variables explicatives et la variables à expliquer. Cela semble-t-il pertinent ?
oui régression multiple mais je suis pas sûr de bien comprendre ce que tu entends par combinaison de valeurs qui donne le max...Par ailleurs, j'aimerais estimer également quelle combinaison de valeur pour mes variables me donnerait la plus haute valeur pour ma variable explicative. Ça se fait avec de la régression multiple ?
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Corrélation ? Régression ?
Merci de ta réponse.
Mes variables explicatives ont toutes été tirées aléatoirement donc (?) elles ne devraient pas être corrélées entre elle, si ?
J'aimerais pouvoir estimer la valeur de ma variable expliquée quantitative à partir de la valeur de mes variables explicatives qualitatives. En gros pouvoir dire "si mon vecteur de variables explicatives X prend comme valeurs x1,x2...,xn, alors la valeur de y devrait se trouver (avec une certaine probabilité) dans l'intervalle [p,q]". Ça semble cohérent ?
Mes variables explicatives ont toutes été tirées aléatoirement donc (?) elles ne devraient pas être corrélées entre elle, si ?
J'aimerais pouvoir estimer la valeur de ma variable expliquée quantitative à partir de la valeur de mes variables explicatives qualitatives. En gros pouvoir dire "si mon vecteur de variables explicatives X prend comme valeurs x1,x2...,xn, alors la valeur de y devrait se trouver (avec une certaine probabilité) dans l'intervalle [p,q]". Ça semble cohérent ?
KadriK- Nombre de messages : 6
Date d'inscription : 09/07/2013
Re: Corrélation ? Régression ?
euh..alors il y a peu de chance qu'elles aient un lien avec la variable à expliquer également...Mes variables explicatives ont toutes été tirées aléatoirement donc (?) elles ne devraient pas être corrélées entre elle, si ?
Pour ton 2e point, c'est sans doute une étude de la dérivée de la fonction obtenue qu'il te faudra faire.
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Corrélation ? Régression ?
En fait elles sont tirées aléatoirement et sur la base de ce tirage est calculée la variable à expliquer. Mais ce calcul prend tellement de temps que je ne peux pas le faire pour toute la population.
Ok pour la dérivée, mais d'abord il faut que j'arrive à estimer cette fonction. Comment je devrais faire ?
Ok pour la dérivée, mais d'abord il faut que j'arrive à estimer cette fonction. Comment je devrais faire ?
KadriK- Nombre de messages : 6
Date d'inscription : 09/07/2013
Re: Corrélation ? Régression ?
je ne vois pas trop ce que ça veut dire et dans ce cas tu as déjà ta régression de faites si tu sais comment sont calculées les valeurs à expliquer...En fait elles sont tirées aléatoirement et sur la base de ce tirage est calculée la variable à expliquer
Quoiqu'il en soit, tu peux faire une régression multiple.
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Corrélation ? Régression ?
Pour être plus clair, mes 20 variables sont des paramètres d'un classifieur. Le classifieur est entrainé sur un corpus puis testé sur d'autres corpus. Ma variable à expliquer, c'est le résultat de ces tests. En théorie il y a peut-être moyen de trouver la fonction sous-jacente, mais en pratique c'est extrêmement compliqué.
Ok donc c'est possible de faire une régression multiple sur des variables qualitatives (ici binaires) ?
Ok donc c'est possible de faire une régression multiple sur des variables qualitatives (ici binaires) ?
KadriK- Nombre de messages : 6
Date d'inscription : 09/07/2013
Re: Corrélation ? Régression ?
Oui il n'y a pas de limite à a ça. une régression avec une variable explicative qualitative ça s'appelle une ANOVA.Ok donc c'est possible de faire une régression multiple sur des variables qualitatives (ici binaires) ?
Par contre, les variables qualitatives sont beaucoup plus gourmandes en données pour l'estimation des paramètres car il y en a plus à estimer.
Si tu veux en apprendre beaucoup sur la manipulation des variables qualitatives en régression , tu peux (dois !?) lire le livre d'Alan Agresti "Categorical data Analysis".
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Corrélation ? Régression ?
Ok pour l'ANOVA, mais l'ennui est que la distribution de ma variable à expliquer n'est pas normale. Il faudrait que je trouve un test non-paramétrique qui fait la même chose...
En effet un peu de lecture théorique ne me fera sans doute pas de mal. Merci du tuyau !
En effet un peu de lecture théorique ne me fera sans doute pas de mal. Merci du tuyau !
KadriK- Nombre de messages : 6
Date d'inscription : 09/07/2013
Re: Corrélation ? Régression ?
Ok pour l'ANOVA, mais l'ennui est que la distribution de ma variable à expliquer n'est pas normale. Il faudrait que je trouve un test non-paramétrique qui fait la même chose...
Je ne sais encore combien de temps on va devoir répéter inlassablement que dans un modèle linéaire quel qu'il soit, LA NORMALITE DE LA VARIABLE A EXPLIQUER N'A AUCUNE IMPORTANCE, ce qui compte c'est la normalité des résidus. Les hypothèses du modèles linéaires sont faites sur les erreurs
Ce n'est pas du théorique justement mais bien de la stat appliquée (avec bien sûr l'explication stat associée.En effet un peu de lecture théorique ne me fera sans doute pas de mal. Merci du tuyau !
nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Corrélation ? Régression ?
Merci pour la précision, j'aurai appris beaucoup de choses aujourd'hui. Malheureusement je me rends compte que mes résidus ne suivent pas non plus une distribution normale. Il y a moyen de s'en sortir autrement ?
KadriK- Nombre de messages : 6
Date d'inscription : 09/07/2013
Re: Corrélation ? Régression ?
si tu fais ça via un test d'hypothèse tu auras très souvent des problèmes de normalité car les queues de distributions des erreurs s'écartent souvent de la distribution attendue par une loi normale.
Le plus pertinent reste une analyse graphique des résidus car certains graphiques peuvent te montrer des problèmes bcp plus grave que la non-normalité comme l'hétéroscédasticité ou encore l'autocorrélation.
Au pire pour corriger une données non normale, tu peux envisager des transformations de données (log, sqrt...)
Le plus pertinent reste une analyse graphique des résidus car certains graphiques peuvent te montrer des problèmes bcp plus grave que la non-normalité comme l'hétéroscédasticité ou encore l'autocorrélation.
Au pire pour corriger une données non normale, tu peux envisager des transformations de données (log, sqrt...)
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Sujets similaires
» Corrélation ou régression?
» régression linéaire multiple et corrélation
» saisonnalité, corrélation, régression logistique
» Régression linéaire simple et corrélation
» Coefficient de corrélation PEARSON ou régression...???
» régression linéaire multiple et corrélation
» saisonnalité, corrélation, régression logistique
» Régression linéaire simple et corrélation
» Coefficient de corrélation PEARSON ou régression...???
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|