Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
reg log proc logistic vs genmod
3 participants
Page 1 sur 1
reg log proc logistic vs genmod
Bonjour,
qu'est ce qui différencie ces deux syntaxes :
proc logistic data=table descending;
model var_a_expl=liste_var_explicat
/ maxiter=20 PPROB=0.5 ctable link=logit;
run; et
Proc genmod data=table descending;
model var_a_expl=liste_var_explicat
/dist=bin link=logit;
run;
Car je n'obtiens pas les mêmes résultats en sortie... Les méthodes d'estimations des paramètres sont-elles différentes entre les deux procédures? Manque-t-il des options dans une des procédures? etc?
En gros, qu'est ce qui peut expliquer les résultats différents entre ces deux procédures??
merci!
qu'est ce qui différencie ces deux syntaxes :
proc logistic data=table descending;
model var_a_expl=liste_var_explicat
/ maxiter=20 PPROB=0.5 ctable link=logit;
run; et
Proc genmod data=table descending;
model var_a_expl=liste_var_explicat
/dist=bin link=logit;
run;
Car je n'obtiens pas les mêmes résultats en sortie... Les méthodes d'estimations des paramètres sont-elles différentes entre les deux procédures? Manque-t-il des options dans une des procédures? etc?
En gros, qu'est ce qui peut expliquer les résultats différents entre ces deux procédures??
merci!
Dernière édition par niaboc le Jeu 24 Mai 2012 - 12:15, édité 1 fois
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: reg log proc logistic vs genmod
Bonjour,
Serait-il possible de voir les sorties?
Serait-il possible de voir les sorties?
Ayana- Nombre de messages : 550
Localisation : Londres
Date d'inscription : 18/08/2009
Re: reg log proc logistic vs genmod
Tu ne m'a pas répondu, tu exécutes une régression binaire ou polytomique?
Je me permet de remonter l'un de tes topics à ce sujet, après l'avoir parcouru il ne réponds pas à ta question mais les références sont peut-être toujours d'actualité: https://statistiques.forumpro.fr/t1084-khi-de-pearson-proc-genmod-proc-logistic
Sinon j'ai trouvé ça que tu peux tester:
Un autre topic qui suspect la méthode d'estimation des coefficients: http://www.developpez.net/forums/d1188336/logiciels/solutions-dentreprise/business-intelligence/sas/sas-stat/fonction-glm-sous-r-vs-proc-genmod-sous-sas/
Concernant les performances de classification, as-tu la même chose néanmoins?
Pour la proc logistic normalement faut préciser la classe de référence dans la ligne model, mais de là à dire que ça vient de là ça ne dépend que de tes sorties en effet.
Je me permet de remonter l'un de tes topics à ce sujet, après l'avoir parcouru il ne réponds pas à ta question mais les références sont peut-être toujours d'actualité: https://statistiques.forumpro.fr/t1084-khi-de-pearson-proc-genmod-proc-logistic
Sinon j'ai trouvé ça que tu peux tester:
- Code:
/* Fit a logistic regression model using PROC GENMOD */
proc genmod;
class dose year;
freq count;
model reject = dose year / error=bin link=logit type3;
make 'parmest' out=parmest;
run;
Un autre topic qui suspect la méthode d'estimation des coefficients: http://www.developpez.net/forums/d1188336/logiciels/solutions-dentreprise/business-intelligence/sas/sas-stat/fonction-glm-sous-r-vs-proc-genmod-sous-sas/
Concernant les performances de classification, as-tu la même chose néanmoins?
Pour la proc logistic normalement faut préciser la classe de référence dans la ligne model, mais de là à dire que ça vient de là ça ne dépend que de tes sorties en effet.
Re: reg log proc logistic vs genmod
Merci pour ces réponses.
C'est une régression logistique binaire et les performances de classifications ne sont pas les mêmes du tout.
[quote="joyeux_lapin13"]
Pour la proc logistic normalement faut préciser la classe de référence dans la ligne model, mais de là à dire que ça vient de là ça ne dépend que de tes sorties en effet.
[/code]
La classe de référence est la même dans les deux cas. (option descending)
Voici les sorties :
proc logistic :
WARNING: Ridging has failed to improve the loglikelihood. You may want to use a different ridging technique (RIDGING= option), or switch to using linesearch to reduce the step size (RIDGING=NONE), or specify a new set of initial estimates (INEST= option).
The LOGISTIC Procedure
WARNING: The LOGISTIC procedure continues in spite of the above warning. Results shown are based on the last maximum likelihood iteration. Validity of the model fit is questionable.
Model Fit Statistics
Criterion
Intercept Only
Intercept and Covariates
AIC 96490.575 89369.483
SC 96502.198 89776.278
-2 Log L 96488.575 89299.483
Testing Global Null Hypothesis: BETA=0
Test Chi-Square DF Pr > ChiSq
Likelihood Ratio 7189.0926 34 <.0001
Score 102550.619 34 <.0001
Wald 247650767 34 <.0001
Analysis of Maximum Likelihood Estimates
Standard Wald
Parameter DF Estimate Error Chi-Square Pr > ChiSq
Constante 1 -4.6406 0.000172 730099826 <.0001
var1 1 0.9483 0.000100 89064398.2 <.0001
var2 1 -0.1991 0.00117 28706.6723 <.0001
var3 1 -0.2525 0.00534 2233.3093 <.0001
var4 1 -0.2027 0.00571 1261.5775 <.0001
GENMOD:
Criteria For Assessing Goodness Of Fit
Criterion DF Value Value/DF
Log Likelihood -22752.5310
Full Log Likelihood -22752.5310
AIC (smaller is better) 45575.0621
AICC (smaller is better) 45575.0651
BIC (smaller is better) 45981.8579
Algorithm converged.
Analysis Of Maximum Likelihood Parameter Estimates
Standard Wald 95% Confidence Wald
Parameter DF Estimate Error Limits Chi-Square Pr > ChiSq
constante 1 -8.9121 0.0894 -9.0873 -8.7368 9936.17 <.0001
var1 1 1.4664 0.0114 1.4440 1.4888 16482.3 <.0001
var2 1 0.1631 0.1109 -0.0541 0.3804 2.17 0.1411
var3 1 -19.1575 9847.195 -19319.3 19280.99 0.00 0.9984
var4 1 -18.2843 9217.560 -18084.4 18047.80 0.00 0.9984
Est ce que ce ne serait pas la méthode d'estimation qui change entre les deux procédures... et dans un cas le modèle arrive à converger (genmod) et pas dans l'autre (logistic)?
C'est une régression logistique binaire et les performances de classifications ne sont pas les mêmes du tout.
[quote="joyeux_lapin13"]
Pour la proc logistic normalement faut préciser la classe de référence dans la ligne model, mais de là à dire que ça vient de là ça ne dépend que de tes sorties en effet.
[/code]
La classe de référence est la même dans les deux cas. (option descending)
Voici les sorties :
proc logistic :
WARNING: Ridging has failed to improve the loglikelihood. You may want to use a different ridging technique (RIDGING= option), or switch to using linesearch to reduce the step size (RIDGING=NONE), or specify a new set of initial estimates (INEST= option).
The LOGISTIC Procedure
WARNING: The LOGISTIC procedure continues in spite of the above warning. Results shown are based on the last maximum likelihood iteration. Validity of the model fit is questionable.
Model Fit Statistics
Criterion
Intercept Only
Intercept and Covariates
AIC 96490.575 89369.483
SC 96502.198 89776.278
-2 Log L 96488.575 89299.483
Testing Global Null Hypothesis: BETA=0
Test Chi-Square DF Pr > ChiSq
Likelihood Ratio 7189.0926 34 <.0001
Score 102550.619 34 <.0001
Wald 247650767 34 <.0001
Analysis of Maximum Likelihood Estimates
Standard Wald
Parameter DF Estimate Error Chi-Square Pr > ChiSq
Constante 1 -4.6406 0.000172 730099826 <.0001
var1 1 0.9483 0.000100 89064398.2 <.0001
var2 1 -0.1991 0.00117 28706.6723 <.0001
var3 1 -0.2525 0.00534 2233.3093 <.0001
var4 1 -0.2027 0.00571 1261.5775 <.0001
GENMOD:
Criteria For Assessing Goodness Of Fit
Criterion DF Value Value/DF
Log Likelihood -22752.5310
Full Log Likelihood -22752.5310
AIC (smaller is better) 45575.0621
AICC (smaller is better) 45575.0651
BIC (smaller is better) 45981.8579
Algorithm converged.
Analysis Of Maximum Likelihood Parameter Estimates
Standard Wald 95% Confidence Wald
Parameter DF Estimate Error Limits Chi-Square Pr > ChiSq
constante 1 -8.9121 0.0894 -9.0873 -8.7368 9936.17 <.0001
var1 1 1.4664 0.0114 1.4440 1.4888 16482.3 <.0001
var2 1 0.1631 0.1109 -0.0541 0.3804 2.17 0.1411
var3 1 -19.1575 9847.195 -19319.3 19280.99 0.00 0.9984
var4 1 -18.2843 9217.560 -18084.4 18047.80 0.00 0.9984
Est ce que ce ne serait pas la méthode d'estimation qui change entre les deux procédures... et dans un cas le modèle arrive à converger (genmod) et pas dans l'autre (logistic)?
Dernière édition par niaboc le Jeu 24 Mai 2012 - 12:54, édité 1 fois (Raison : oubli d'une variable dans la proc genmod)
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: reg log proc logistic vs genmod
La différence vient du fait que tu as une variable de moins dans la proc genmod et qu'il s'agit probablement d'un facteur de confusion...
Ayana- Nombre de messages : 550
Localisation : Londres
Date d'inscription : 18/08/2009
Re: reg log proc logistic vs genmod
^^ hihi désolé mais c'est une simple erreur de recopiage. (que je vais corriger de suite)
C'est juste que par souci de confidentialité j'ai changé le nom des varaibles et je n'ai pas tout bien recopié.
Mais je te rassure, j'ai exactement le même nombre de variables (34) entre les deux méthodes!!
C'est juste que par souci de confidentialité j'ai changé le nom des varaibles et je n'ai pas tout bien recopié.
Mais je te rassure, j'ai exactement le même nombre de variables (34) entre les deux méthodes!!
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: reg log proc logistic vs genmod
Après quelques tests, je pense que c'est un problème de convergence du modèle. Quelle procédure est donc la meilleure dans un cas comme celui-là? (supposant qu'il y en ai une)
Savez-vous quelles sont les différentes méthodes d'estimations utilisées dans chacune des procédures? avec leurs inconvénients, avantages?
merci
Savez-vous quelles sont les différentes méthodes d'estimations utilisées dans chacune des procédures? avec leurs inconvénients, avantages?
merci
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: reg log proc logistic vs genmod
Logiquement en proc logistic il va pénaliser la matrice des dérivées secondes en modifiant légèrement les termes de la diagonale afin de pouvoir l'inverser. Sur GENMOD je ne sais pas.
Sujets similaires
» khi² de pearson-proc genmod/proc logistic
» Proc Logistic et sous population
» erreur lors de la proc logistic, help! (SAS)
» proc logistic sous SAS, hypothèse le confirmant
» SAS : Calcul des odds ratio avec la proc logistic
» Proc Logistic et sous population
» erreur lors de la proc logistic, help! (SAS)
» proc logistic sous SAS, hypothèse le confirmant
» SAS : Calcul des odds ratio avec la proc logistic
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum