Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
régression probit et matrice de confusion
3 participants
Page 1 sur 1
régression probit et matrice de confusion
Bonjour,
je dois faire une régression probit et calculer les coefficients "à la main" (les hypothèses ne permettant pas de faire une régression classique et d'utiliser les logiciels).
Je voudrais utiliser des ensembles tests et des ensembles de validation...
Ainsi, si j'obtiens des estimations pour bêta0, bêta1 et bêta2, j'obtiens une parabole (c'est une régression de degré 2) :
y=0.5*(1+erf(Bo+B1*x+B2*x^2)/sqrt(2))
mais comment calculer la matrice de confusion?
En effet, mes données prennent 0 ou 1 comme valeurs.
Comment décider alors "qui est bien classé"?
Si quelqu'un pouvait m'aider, svp?
Merci d'avance et ... bon réveillon
je dois faire une régression probit et calculer les coefficients "à la main" (les hypothèses ne permettant pas de faire une régression classique et d'utiliser les logiciels).
Je voudrais utiliser des ensembles tests et des ensembles de validation...
Ainsi, si j'obtiens des estimations pour bêta0, bêta1 et bêta2, j'obtiens une parabole (c'est une régression de degré 2) :
y=0.5*(1+erf(Bo+B1*x+B2*x^2)/sqrt(2))
mais comment calculer la matrice de confusion?
En effet, mes données prennent 0 ou 1 comme valeurs.
Comment décider alors "qui est bien classé"?
Si quelqu'un pouvait m'aider, svp?
Merci d'avance et ... bon réveillon
lilly74- Nombre de messages : 22
Date d'inscription : 14/12/2008
Re: régression probit et matrice de confusion
Il est étonnant que tu ne puisses pas calculer cette regression avec un logiciel. Pour ce qui est de la matrice de confusion, tu calcules ta proba théorique à partir de ton modèle et tu te fixes un seuil par exemple 0.5. Toutes les proba théoriques supérieures à ce seuil tu les considère à 1 et toutes les probas inférieures tu les considères 0. A partir de la tu peux calculer une matrice de confusion. Tu peux faire la même chose en faisant varier ton seuil entre 0 et 1 et répéter l'opération. C'est le principe de la courbe ROC (voir des posts précédents soit sur la courbe ROC soit sur la régression logistique).
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: régression probit et matrice de confusion
Bonjour,
Voila j'ai un petit problème, j'espère que vous pourriez m'aider!!!
Je veux faire une régression exponentielle!!
Y= b. a^x . c^z
Y: Trafic passager
X: Population
Z: Pib/ Habitant
J'ai tapé la formule {=LOGREG(X12:X20;Y12:Z20;VRAI;VRAI)}
Sachant que:
la colonne X représente "Y" (trafic passager)
La colonne Y représente "X" (Population)
La colonne Z représente "Z" (Pib/habitant)
j'ai eu comme résultat:
b=68234
a=1,000335
b=1,000002
Quand je suis passé pour calculer les prévisions, j'ai eu des nombres énormes avec les 10^48 etc....
D'après vous, où réside le probléme ? SVP et merci d'avance !!!
Voila j'ai un petit problème, j'espère que vous pourriez m'aider!!!
Je veux faire une régression exponentielle!!
Y= b. a^x . c^z
Y: Trafic passager
X: Population
Z: Pib/ Habitant
J'ai tapé la formule {=LOGREG(X12:X20;Y12:Z20;VRAI;VRAI)}
Sachant que:
la colonne X représente "Y" (trafic passager)
La colonne Y représente "X" (Population)
La colonne Z représente "Z" (Pib/habitant)
j'ai eu comme résultat:
b=68234
a=1,000335
b=1,000002
Quand je suis passé pour calculer les prévisions, j'ai eu des nombres énormes avec les 10^48 etc....
D'après vous, où réside le probléme ? SVP et merci d'avance !!!
Shattered27- Nombre de messages : 6
Date d'inscription : 23/11/2009
Re: régression probit et matrice de confusion
Bonjour,droopy a écrit:Il est étonnant que tu ne puisses pas calculer cette regression avec un logiciel. Pour ce qui est de la matrice de confusion, tu calcules ta proba théorique à partir de ton modèle et tu te fixes un seuil par exemple 0.5. Toutes les proba théoriques supérieures à ce seuil tu les considère à 1 et toutes les probas inférieures tu les considères 0. A partir de la tu peux calculer une matrice de confusion. Tu peux faire la même chose en faisant varier ton seuil entre 0 et 1 et répéter l'opération. C'est le principe de la courbe ROC (voir des posts précédents soit sur la courbe ROC soit sur la régression logistique).
je n'ai eu la réponse qu'il y a peu, je la poste car cela peut toujours être utile
Tout d'abord, une précision: je travaillais sur un projet qui traitait des observations liées entre elles ce qui rendait une
- Code:
proc logistic
J'ai cherché comment y remédier sur SAS sans y parvenir
Quant à l'erreur produite sur l'échantillon test, on m'a donné une solution basée sur la façon de trouver mes estimateurs des coefficients de régression ( il s'agit d'une méthode MCMC "adaptée").
L'idée est de prendre les estimateurs des corfficients obtenus sur l'échantillon d'apprentissage et de calculer la variable explicative dans l'échantillon test.
Le score est alors le taux d'individus dont la variable explicative est bien prédite.
Je ne sais pas si c'est très clair sans développer la méthode de calcul des estimateurs
Encore merci pour votre aide!
lilly74- Nombre de messages : 22
Date d'inscription : 14/12/2008
Sujets similaires
» Matrice de confusion et pourcentage
» interprétation matrice de confusion
» Comparaison de matrice de confusion appariée
» Matrice d'information de Fisher et matrice de covariance
» Probit et résidus
» interprétation matrice de confusion
» Comparaison de matrice de confusion appariée
» Matrice d'information de Fisher et matrice de covariance
» Probit et résidus
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|