Les posteurs les plus actifs de la semaine
Eric Wajnberg
 
zezima
 
Nik
 
margotte185
 
c@ssoulet
 
Coco
 
Ayana
 


Différences entre deux populations SAS / Modèle Logit

Voir le sujet précédent Voir le sujet suivant Aller en bas

Différences entre deux populations SAS / Modèle Logit

Message par Ann le Dim 13 Juin 2010 - 14:00

Bonjour à tous,
Je suis nouvelle sur ce forum et j'ai besoin d'aide !
Voilà, j'ai deux populations, une contrôlée et une non contrôlée et je voudrais savoir si ces deux populations sont significativement différentes et ce en utilisant SAS.
Il parait qu'il faut réaliser des tests de différences de moyenne mais je ne sais pas clairement ce que je dois utiliser...
En plus, comment savoir si mes deux populations sont significativement différentes par exemple sur la situation professionnelle qui n'est pas une variable quantitative ?
J'espère avoir des réponses parce que je suis vraiment perdue sur ce point...
Enfin j'aurais besoin d'informations pour connaitre la qualité d'un modèle logit, sur quoi doit-on se baser ? la CTABLE ? les paires concordantes ? le R2 et le Max R Resqualed ?! autre chose ?

Merci d'avance à ceux qui prendront le temps de me répondre.

Ann

Nombre de messages : 3
Date d'inscription : 13/06/2010

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Différences entre deux populations SAS / Modèle Logit

Message par joyeux_lapin13 le Lun 14 Juin 2010 - 8:45

Bonjour,

je préviens, j'ai compris que 'une contrôlée et une non contrôlée' veut dire que tu as deux status...

De ce que je sais... la seule chose que tu peux faire avec une régression logistique c'est, à partir de tes individus de coordonnées (X1,...,Xn) ou plutôt pour l'individu i de cooronées (X1i,...,Xni), établir un modèle de prédiction qui te permettra de dire si tel ou tel individu est de catégorie 0 ou 1. En gros ormi prédire si ton bonhomme sera chez les 'contrôlé' ou les 'non contrôlé', tu pourras rien espérer d'autre...

Donc tout ça pour te dire que je pense pas, que si tu veux voir la différence entre une population A ou B, tu puissent le faire avec une régression logistique.

Ceci dit, éventuellement, tu peux lancer ta régression sur ton jeux de données et à la limite essayer de voir la différence au niveaux des odd ratios, mais bon ça serait vraiment faire compliquer alors que je pense il y a beaucoup plus simple.

Enfin quand aux qualités des modèles logit, alors voici la liste des choses à voir:
- la table de confusion, indice de correct (le plus haut possible), la sensibilité et la spécificité (à la fois haut et équilibré au mieux), les faux et vrai négatif doivent être les plus bas possibles.
- un taux de paires concordante haut et de non concordante bas, des valeurs sommer's D/tau-a,Gamma et c les plus proche de 1 (pour le tau-a il varie entre -1 et 1 donc au dessus de 0.3 c'est bien.
- un R square le plus proche de 1
- les tests des résidus (Deviance et chi-2) doivent être non significatifs

Il me semble n'avoir rien oublié...

Aprés il y a des choses à voir sur la significativité de tes coeffs/OR en fonction de ce qui t'interesse, de même pour les résidus. Mais là ça dépend jusqu'où tu veux aller dans ton étude...
avatar
joyeux_lapin13

Nombre de messages : 1881
Age : 34
Localisation : Mayotte
Date d'inscription : 21/04/2010

Voir le profil de l'utilisateur https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

Re: Différences entre deux populations SAS / Modèle Logit

Message par Ann le Mar 15 Juin 2010 - 9:53

Bonjour à toi Joyeux_lapin;

Je te remercie pour tes précisions concernant la qualité des modèles logit, j'y vois plus clair maintenant et je sais mieux ou regarder.

Mais il me reste encore deux questions :
- en fait j'ai du mal m'exprimer concernant ma question sur les différences entre mes deux populations : je ne comptais pas faire de modèle logit pour savoir si mes deux populations sont significativement différentes ou pas. Mais ce n'est pas pour autant que je vois quoi faire... je n'ai pas d'idées du tout surtout que j'ai des variables qualitatives... et je ne vois pas comment faire de tests de moyennes dessus !
Donc ma question serait plutôt : comment faire des tests de différences de moyenne sur SAS sur variable qualitative et quantitative ?

- par ailleurs, j'ai réalisé mon modèle logit et j'ai ma table de classifcation cependant, au lieu d'avoir dans la colonne des chiffres croissants puis décroissants, il sont toujours croissants jusqu'au seuil de 0.39 et ensuite ils deviennent constants, je ne comprends pas d'où ça vient ni même si c'est normal...

Merci d'avance pour ta réponse,

Cdt,

Ann

Ann

Nombre de messages : 3
Date d'inscription : 13/06/2010

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Différences entre deux populations SAS / Modèle Logit

Message par joyeux_lapin13 le Mar 15 Juin 2010 - 10:18

Si je comprends bien tu as deux colonnes (population A et B) et à chaque ligne i une catégorie?

Personnellement je ferais un graphe de la répartition par population A et B et j'étudierais la distribution sous cette forme. Sous SAS je ne connais pas la procédure mais en tapant vite fait "test de moyennes" et "SAS" j'ai eu ça: http://books.google.fr/books?id=sQ6s01yNDgsC&pg=PA70&lpg=PA70&dq=%22test+de+moyennes%22+%22SAS%22&source=bl&ots=gaQLBZeT7i&sig=KIZj0zFmWWethj8pVQAHqV33dKM&hl=fr&ei=ElAXTMvtHYeX4gadjZWpDA&sa=X&oi=book_result&ct=result&resnum=1&ved=0CBUQ6AEwAA#v=onepage&q=%22test%20de%20moyennes%22%20%22SAS%22&f=false

Je ne dis pas que ça répondra à ta question mais tant ça te permettra de savoir ou chercher...

Aprés j'ai pas bien compris pour ta table de classification, logiquement sous SAS (option CTABLE) tu as la table qui, en fonction de la 'probabilité de décision' (Prob Level), te donne tes différents seuils (correct, sens, spé, F >0 et F<0). En gros cette proba elle intervient quand tu as ton équation logit avec tes coefficients estimés et que tu remplaces pour chaque individu ses coordonnées, tu obtiens alors des valeurs, qui si elles sont plus grande que ta Prob Level, permettent de prédire l'individu en 0 ou 1 (tout dépend de ta catégorie de référence).

Bref tout ça pour dire que tes 4 taux dépendent de cette classification et donc si passé un certain seuil tu as toujours les même taux c'est que quelque soit la valeur de ce seuil les prédictions restent les même, c'est assez étrange en effet mais je pense que ça doit venir de la forme de tes données. A voir en developpant le machin en fait...

EDIT: j'essaierais dans l'aprem de regarder pour le test des moyennes, promis.

Enfin logiquement si tu veux savoir si ya une option à mettre la réponse est 'non', ça ne vient pas, normalement, de SAS.
avatar
joyeux_lapin13

Nombre de messages : 1881
Age : 34
Localisation : Mayotte
Date d'inscription : 21/04/2010

Voir le profil de l'utilisateur https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

Re: Différences entre deux populations SAS / Modèle Logit

Message par Ann le Mar 15 Juin 2010 - 11:25

Alors en fait de façon plus parlante j'ai un certain nombre de lignes qui représentent mes individus. Pour l'ensemble de mes individus j'ai différentes variables permettant de les caractériser (Age, Situations familiales, etc) dont une variable binaire qui indique si mon individu appartient à la population contrôlée ou non. C'est donc sur ce type de base que je souhaiterais faire mes tests de moyenne par exemple pour pouvoir savoir si la population contrôlée est d'âge significativement différent de la population non contrôlée, etc.

Merci pour ma question sur le modèle logit, c'est ce que je pensais que c'était étrange... mais je ne vois pas vraiment d'où ça peut venir ! A voir donc !

Merci pour tes réponses rapides !

Cdt,

Ann

Ann

Nombre de messages : 3
Date d'inscription : 13/06/2010

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Différences entre deux populations SAS / Modèle Logit

Message par joyeux_lapin13 le Mer 16 Juin 2010 - 8:19

Salut,

alors, toujours à la va vite, j'ai éventuellement trouvé ça pour toi:

DATA test;
input age ;
cards;
10
20
30
40
40
50
60
10
40
60
80

;run;

proc means DATA= test noprint ;
var age ;
output out=results mean=moy
;run ;

DATA _null_ ;
SET results ;
call symput('moyenne',moy);
;run;


DATA FINAL ;
SET test ;
WHERE age=&moyenne ;
run;


Logiquement cette macro permettrait de tester si la moyenne d'une variable est égale à une certaine valeur.

Enfin pour tester si une moyenne est egale à une autre valeur, il semblerait que ça soit la procedure ttest.

J'espère que ça pourra t'aider, aprés j'ai pas eu le temps de regarder la chose plus en détail...

Pour cette histoire de CTABLE, la cause est tout simplement que tes probas de prédiction sont toutes inférieures au seuil que tu as écrit, et comme dit ce sont des calculs qui ne mentent pas et qui sont vraiment trés "droit". Donc c'est pas anormal, juste 'original'... aprés ça pour dire d'où ça vient il te faudrait en fait reprendre l'équation logit avec tes coefficients et calculer toutes les prédictions obtenues en fonction de tes individus. Sous SAS ça se fait facilement avec la syntaxe (dans la proc logistique, aprés l'instruction MODEL): SCORE OUT = pred il me semble, si ça marche pas tiens moi au courant je refouillerais dans mes sauvegardes pour te retrouver la syntaxe exact.
avatar
joyeux_lapin13

Nombre de messages : 1881
Age : 34
Localisation : Mayotte
Date d'inscription : 21/04/2010

Voir le profil de l'utilisateur https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

Re: Différences entre deux populations SAS / Modèle Logit

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum