Les posteurs les plus actifs de la semaine
c@ssoulet
 
maplej0e
 
Eric Wajnberg
 
Florent Aubry
 
Mlbc
 


régression probit et matrice de confusion

Aller en bas

régression probit et matrice de confusion

Message par lilly74 le Jeu 31 Déc 2009 - 10:15

Bonjour,
je dois faire une régression probit et calculer les coefficients "à la main" (les hypothèses ne permettant pas de faire une régression classique et d'utiliser les logiciels).
Je voudrais utiliser des ensembles tests et des ensembles de validation...
Ainsi, si j'obtiens des estimations pour bêta0, bêta1 et bêta2, j'obtiens une parabole (c'est une régression de degré 2) :
y=0.5*(1+erf(Bo+B1*x+B2*x^2)/sqrt(2))
mais comment calculer la matrice de confusion?
En effet, mes données prennent 0 ou 1 comme valeurs.
Comment décider alors "qui est bien classé"?
Si quelqu'un pouvait m'aider, svp?
Merci d'avance et ... bon réveillon

lilly74

Nombre de messages : 22
Date d'inscription : 14/12/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: régression probit et matrice de confusion

Message par droopy le Sam 2 Jan 2010 - 7:49

Il est étonnant que tu ne puisses pas calculer cette regression avec un logiciel. Pour ce qui est de la matrice de confusion, tu calcules ta proba théorique à partir de ton modèle et tu te fixes un seuil par exemple 0.5. Toutes les proba théoriques supérieures à ce seuil tu les considère à 1 et toutes les probas inférieures tu les considères 0. A partir de la tu peux calculer une matrice de confusion. Tu peux faire la même chose en faisant varier ton seuil entre 0 et 1 et répéter l'opération. C'est le principe de la courbe ROC (voir des posts précédents soit sur la courbe ROC soit sur la régression logistique).
avatar
droopy

Nombre de messages : 1097
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: régression probit et matrice de confusion

Message par Shattered27 le Mar 26 Jan 2010 - 12:19

Bonjour,
Voila j'ai un petit problème, j'espère que vous pourriez m'aider!!!

Je veux faire une régression exponentielle!!

Y= b. a^x . c^z
Y: Trafic passager
X: Population
Z: Pib/ Habitant

J'ai tapé la formule {=LOGREG(X12:X20;Y12:Z20;VRAI;VRAI)}
Sachant que:
la colonne X représente "Y" (trafic passager)
La colonne Y représente "X" (Population)
La colonne Z représente "Z" (Pib/habitant)

j'ai eu comme résultat:
b=68234
a=1,000335
b=1,000002

Quand je suis passé pour calculer les prévisions, j'ai eu des nombres énormes avec les 10^48 etc....

D'après vous, où réside le probléme ? SVP et merci d'avance !!!

Shattered27

Nombre de messages : 6
Date d'inscription : 23/11/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: régression probit et matrice de confusion

Message par lilly74 le Ven 12 Fév 2010 - 13:26

droopy a écrit:Il est étonnant que tu ne puisses pas calculer cette regression avec un logiciel. Pour ce qui est de la matrice de confusion, tu calcules ta proba théorique à partir de ton modèle et tu te fixes un seuil par exemple 0.5. Toutes les proba théoriques supérieures à ce seuil tu les considère à 1 et toutes les probas inférieures tu les considères 0. A partir de la tu peux calculer une matrice de confusion. Tu peux faire la même chose en faisant varier ton seuil entre 0 et 1 et répéter l'opération. C'est le principe de la courbe ROC (voir des posts précédents soit sur la courbe ROC soit sur la régression logistique).
Bonjour,
je n'ai eu la réponse qu'il y a peu, je la poste car cela peut toujours être utile
Tout d'abord, une précision: je travaillais sur un projet qui traitait des observations liées entre elles ce qui rendait une
Code:
proc logistic
standard impossible.
J'ai cherché comment y remédier sur SAS sans y parvenir
Quant à l'erreur produite sur l'échantillon test, on m'a donné une solution basée sur la façon de trouver mes estimateurs des coefficients de régression ( il s'agit d'une méthode MCMC "adaptée").
L'idée est de prendre les estimateurs des corfficients obtenus sur l'échantillon d'apprentissage et de calculer la variable explicative dans l'échantillon test.
Le score est alors le taux d'individus dont la variable explicative est bien prédite.
Je ne sais pas si c'est très clair sans développer la méthode de calcul des estimateurs
Encore merci pour votre aide!

lilly74

Nombre de messages : 22
Date d'inscription : 14/12/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: régression probit et matrice de confusion

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum