Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

-23%
Le deal à ne pas rater :
EVGA SuperNOVA 650 G6 – Alimentation PC 100% modulaire 650W, 80+ ...
77.91 € 100.91 €
Voir le deal

Corrélation ? Régression ?

2 participants

Aller en bas

 - Corrélation ? Régression ? Empty Corrélation ? Régression ?

Message par KadriK Mar 9 Juil 2013 - 17:21

Bonjour à tous et d'avance merci pour votre aide,

Je souhaiterais savoir s'il existe des liens entre mes variables "explicatives" (17 variables binaires et 1 numérique parmi un ensemble fini) et ma dernière variable (numérique réelle entre 0 et 1).

Je pensais déjà réaliser des tests de corrélation entre chacune des variables explicatives et la variables à expliquer.  Cela semble-t-il pertinent ?

Par ailleurs, j'aimerais estimer également quelle combinaison de valeur pour mes variables me donnerait la plus haute valeur pour ma variable explicative.  Ça se fait avec de la régression multiple ?

Excusez mon manque de rigueur, n'hésitez pas à me corriger, et merci encore pour votre aide.

EDIT: je me rends compte par après d'une bêtise: la corrélation et la régression sur des variables binaires ça a pas l'air cohérent. Donc si vous avez une idée de ce que je pourrais faire à la place je vous en serais reconnaissant.

KadriK

Nombre de messages : 6
Date d'inscription : 09/07/2013

Revenir en haut Aller en bas

 - Corrélation ? Régression ? Empty Re: Corrélation ? Régression ?

Message par Nik Ven 12 Juil 2013 - 6:02

Je pensais déjà réaliser des tests de corrélation entre chacune des variables explicatives et la variables à expliquer. Cela semble-t-il pertinent ?
non, ça donne une idée fausse du modèle plus complet. Par contre il faut regarder que tes variables explicatives ne soient pas trop corrélées entre elles.

Par ailleurs, j'aimerais estimer également quelle combinaison de valeur pour mes variables me donnerait la plus haute valeur pour ma variable explicative. Ça se fait avec de la régression multiple ?
oui régression multiple mais je suis pas sûr de bien comprendre ce que tu entends par combinaison de valeurs qui donne le max...

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

 - Corrélation ? Régression ? Empty Re: Corrélation ? Régression ?

Message par KadriK Ven 12 Juil 2013 - 6:10

Merci de ta réponse.

Mes variables explicatives ont toutes été tirées aléatoirement donc (?) elles ne devraient pas être corrélées entre elle, si ?

J'aimerais pouvoir estimer la valeur de ma variable expliquée quantitative à partir de la valeur de mes variables explicatives qualitatives. En gros pouvoir dire "si mon vecteur de variables explicatives X prend comme valeurs x1,x2...,xn, alors la valeur de y devrait se trouver (avec une certaine probabilité) dans l'intervalle [p,q]". Ça semble cohérent ?

KadriK

Nombre de messages : 6
Date d'inscription : 09/07/2013

Revenir en haut Aller en bas

 - Corrélation ? Régression ? Empty Re: Corrélation ? Régression ?

Message par Nik Ven 12 Juil 2013 - 6:23

Mes variables explicatives ont toutes été tirées aléatoirement donc (?) elles ne devraient pas être corrélées entre elle, si ?
euh..alors il y a peu de chance qu'elles aient un lien avec la variable à expliquer également...

Pour ton 2e point, c'est sans doute une étude de la dérivée de la fonction obtenue qu'il te faudra faire.

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

 - Corrélation ? Régression ? Empty Re: Corrélation ? Régression ?

Message par KadriK Ven 12 Juil 2013 - 6:27

En fait elles sont tirées aléatoirement et sur la base de ce tirage est calculée la variable à expliquer. Mais ce calcul prend tellement de temps que je ne peux pas le faire pour toute la population.

Ok pour la dérivée, mais d'abord il faut que j'arrive à estimer cette fonction. Comment je devrais faire ?

KadriK

Nombre de messages : 6
Date d'inscription : 09/07/2013

Revenir en haut Aller en bas

 - Corrélation ? Régression ? Empty Re: Corrélation ? Régression ?

Message par Nik Ven 12 Juil 2013 - 6:30

En fait elles sont tirées aléatoirement et sur la base de ce tirage est calculée la variable à expliquer
je ne vois pas trop ce que ça veut dire et dans ce cas tu as déjà ta régression de faites si tu sais comment sont calculées les valeurs à expliquer...

Quoiqu'il en soit, tu peux faire une régression multiple.

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

 - Corrélation ? Régression ? Empty Re: Corrélation ? Régression ?

Message par KadriK Ven 12 Juil 2013 - 6:51

Pour être plus clair, mes 20 variables sont des paramètres d'un classifieur. Le classifieur est entrainé sur un corpus puis testé sur d'autres corpus. Ma variable à expliquer, c'est le résultat de ces tests. En théorie il y a peut-être moyen de trouver la fonction sous-jacente, mais en pratique c'est extrêmement compliqué.

Ok donc c'est possible de faire une régression multiple sur des variables qualitatives (ici binaires) ?

KadriK

Nombre de messages : 6
Date d'inscription : 09/07/2013

Revenir en haut Aller en bas

 - Corrélation ? Régression ? Empty Re: Corrélation ? Régression ?

Message par Nik Ven 12 Juil 2013 - 6:58

Ok donc c'est possible de faire une régression multiple sur des variables qualitatives (ici binaires) ?
Oui il n'y a pas de limite à a ça. une régression avec une variable explicative qualitative ça s'appelle une ANOVA.
Par contre, les variables qualitatives sont beaucoup plus gourmandes en données pour l'estimation des paramètres car il y en a plus à estimer.

Si tu veux en apprendre beaucoup sur la manipulation des variables qualitatives en régression , tu peux (dois !?) lire le livre d'Alan Agresti "Categorical data Analysis".

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

 - Corrélation ? Régression ? Empty Re: Corrélation ? Régression ?

Message par KadriK Ven 12 Juil 2013 - 7:12

Ok pour l'ANOVA, mais l'ennui est que la distribution de ma variable à expliquer n'est pas normale. Il faudrait que je trouve un test non-paramétrique qui fait la même chose...

En effet un peu de lecture théorique ne me fera sans doute pas de mal. Merci du tuyau !

KadriK

Nombre de messages : 6
Date d'inscription : 09/07/2013

Revenir en haut Aller en bas

 - Corrélation ? Régression ? Empty Re: Corrélation ? Régression ?

Message par Nik Ven 12 Juil 2013 - 7:27

Ok pour l'ANOVA, mais l'ennui est que la distribution de ma variable à expliquer n'est pas normale. Il faudrait que je trouve un test non-paramétrique qui fait la même chose... 
Evil or Very Mad
Je ne sais encore combien de temps on va devoir répéter inlassablement que dans un modèle linéaire quel qu'il soit, LA NORMALITE DE LA VARIABLE A EXPLIQUER N'A AUCUNE IMPORTANCE, ce qui compte c'est la normalité des résidus. Les hypothèses du modèles linéaires sont faites sur les erreurs

En effet un peu de lecture théorique ne me fera sans doute pas de mal. Merci du tuyau !
Ce n'est pas du théorique justement mais bien de la stat appliquée (avec bien sûr l'explication stat associée.

nik

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

 - Corrélation ? Régression ? Empty Re: Corrélation ? Régression ?

Message par KadriK Ven 12 Juil 2013 - 7:59

Merci pour la précision, j'aurai appris beaucoup de choses aujourd'hui. Malheureusement je me rends compte que mes résidus ne suivent pas non plus une distribution normale. Il y a moyen de s'en sortir autrement ?


KadriK

Nombre de messages : 6
Date d'inscription : 09/07/2013

Revenir en haut Aller en bas

 - Corrélation ? Régression ? Empty Re: Corrélation ? Régression ?

Message par Nik Ven 12 Juil 2013 - 8:39

si tu fais ça via un test d'hypothèse tu auras très souvent des problèmes de normalité car les queues de distributions des erreurs s'écartent souvent de la distribution attendue par une loi normale.
Le plus pertinent reste une analyse graphique des résidus car certains graphiques peuvent te montrer des problèmes bcp plus grave que la non-normalité comme l'hétéroscédasticité ou encore l'autocorrélation.

Au pire pour corriger une données non normale, tu peux envisager des transformations de données (log, sqrt...)

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

 - Corrélation ? Régression ? Empty Re: Corrélation ? Régression ?

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum