Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Le deal à ne pas rater :
Pokémon Évolutions Prismatiques : coffrets et dates de sortie de ...
Voir le deal

[R] Régression logistique PLS [RESOLU]

3 participants

Aller en bas

[R] Régression logistique PLS [RESOLU] Empty [R] Régression logistique PLS [RESOLU]

Message par joyeux_lapin13 Lun 14 Juin 2010 - 11:45

Bonjour,

est-ce que quelqu'un comment on fait ce type de régression via SAS, enfin je connais la proc PLS mais j'ai pas trouvé l'option pour passer en modèle logit...

De même j'aurais aimé savoir si quelqu'un sait comment on fait des régressions logistiques sur composante PLS...

Merci d'avance.


Dernière édition par joyeux_lapin13 le Lun 4 Oct 2010 - 18:00, édité 1 fois
joyeux_lapin13
joyeux_lapin13

Nombre de messages : 1927
Age : 41
Localisation : Mayotte
Date d'inscription : 21/04/2010

https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

[R] Régression logistique PLS [RESOLU] Empty Re: [R] Régression logistique PLS [RESOLU]

Message par joyeux_lapin13 Ven 2 Juil 2010 - 9:56

Je me permet de réup ce topic plutot que d'en créer un autre, j'ai d'ailleurs modifier le titre en ce sens.

Voilà aprés moulte recherche SAS ne fait que du PLS 'de base', c'est possible de combiner PLS et régression logistique mais déjà qu'automatiser c'est tout un truc alors à la main voilà quoi...

Donc là j'ai basculé sur R et j'utilise notamment le package disponible sur cette page: http://127.0.0.1:26914/library/plsRglm/html/plsRglm.html

J'aurais donc aimé savoir si certain ici utilise les fonctions plsRglm de ce package afin d'obtenir quelque infos sur les sorties qui sont proposées, comme par exemple: si on récupère les composantes par la syntaxe $pp, sous quel forme doive être les données pour pouvoir les projeter (uniquement centrées-réduites?).

Merci d'avance.


EDIT:
analyse <- plsRglm(DataY,DataX,model="pls-glm-logistic"), de base on a pas mal d'infos sur les performances du modèle comme le nombre de mal classé ou encore les valeurs de AIC et BIC.
analyse$Coeffs renvoi les coefficients du modèle finale, on peut faire de la sélection en utilisant les méthodes de bootstrap afin de déterminer leur significativité, pour celà on se sert des fonctions bootplsglm, boxplot.pls et plot.confint.bootplsglm.
plot(analyse$ModelFinal) permet d'afficher les graphes des résidus pour les individus atypiques.
analyse$YChapeau renvoi les probas calculés pour chaque individus avec l'équation logit final, ça permet de calculer à la main la table de confusion.
Aprés j'ai stoppé là étant donné que j'avais pas besoin d'autre infos.

Enfin pour ce qui est de la projection des variables dans le plan, alors on calcul déjà le nombre de composantes optimales via analyse$computed_nt. Et puis si on se réfère (interprétation personnel car rien trouvé d'écrit noir sur blanc perso) à la formule pour calculer les composantes (cov(X_j/Y) sous forme de rapport) on en déduit que plus une variable contribue à un axe plus elle "covarie" avec la variable réponse. De plus, plus deux variables sont proches dans le plan (les composantes sont les résidus de celle de l'étape précédente, donc ça veut dire que leur variations sur les résidus de l'étape t et de l'étape t+1 sont les même par rapport à Y), on conclut que ces deux variables ont un comportement similaire.

Je suis dispo pour si certains se retrouvent dans la même galère que moi un jour.
joyeux_lapin13
joyeux_lapin13

Nombre de messages : 1927
Age : 41
Localisation : Mayotte
Date d'inscription : 21/04/2010

https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

[R] Régression logistique PLS [RESOLU] Empty Re: [R] Régression logistique PLS [RESOLU]

Message par owkiii Sam 14 Mai 2011 - 0:49

Bonsoir,
Je suis en train d'essayer le package plsRglm et ton post m'est bien utile.
J'ai une question: bootplsglm sort des résultats sur Std.Coeffs et pas sur Coeffs mais je n'ai pas réussi à trouver comment on passe des uns aux autres. Est-ce que je me trompe si je pense que Std.Coeffs sont à appliquer aux données normalisées?
Merci d'avance.

owkiii

Nombre de messages : 1
Date d'inscription : 14/05/2011

Revenir en haut Aller en bas

[R] Régression logistique PLS [RESOLU] Empty Re: [R] Régression logistique PLS [RESOLU]

Message par joyeux_lapin13 Sam 14 Mai 2011 - 7:55

Salut Owkiii et content de voir que ce topic peut servir à quelqu'un!

Concernant la fonction plsRglm je te conseil de regarder son utilisation sur la page d'aide qui lui est dédié sur le site de R (mais je pense que tu l'as déjà fait, je propose au cas où). Aprés la fonction bootplsglm permet de construire les intervalles de confiances par bootstrap pour sélectionner les variables dont les coefficients ont une IC qui rejète 0, je suis donc surpris que tu es l'info explicitement sur quel type de coefficients il travaille, maintenant je n'ai pas regardé plus que ça la nouvelle version de ce package dont tu dois te servir j'imagine.

Eventuellement, en précisant l'option scaleX = TRUE ou FALSE (standardisation des données ou non lors de l'utilisation de la fonction), tu devrais pouvoir avoir ta raison, si l'option scaleX = FALSE et que la liste std.Coeff est vide alors tu as raison, sinon je ne sais pas. En fait je me suis jamais posé la question vue que la boîte dans laquelle je travaille ne fait que de la recherche de biomarqueurs, du coup le coté modélisation ne m'intéresse pas mais juste la classification. Tout ce que je sais, par conséquent car j'avais vérifié pour sortir la règle décisionnelle à l'équipe clinique, c'est que les coefficients présents dans la sortie principale ont servis à calculer le vecteur de probabilité YChapeau qui permettent d'établir les performances du modèle estimé.

Je suis dispo pour tout autre question, en cas n'hésite pas à être plus précis, je lancerais le package et jeterais un oeil, as-tu regardé les références présentes sur la page d'aide? concernant les coefficients standardisés j'ai souvenir d'avoir lu sur une page sur le net leur origine, et vue que des pages qui parlent de la régression logistique pls et son application avec ce package il y en a pas des masses, tu devrais facilement retomber sur l'infos.
joyeux_lapin13
joyeux_lapin13

Nombre de messages : 1927
Age : 41
Localisation : Mayotte
Date d'inscription : 21/04/2010

https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

[R] Régression logistique PLS [RESOLU] Empty Re: [R] Régression logistique PLS [RESOLU]

Message par Haxo Jeu 18 Juil 2013 - 13:40

Salut Joyeux lapin,

Je compte utiliser le package plsRglm, mais avant j'aimerais être sûr de ne pas me tromper de direction. J'espère que tu pourras m'aiguiller.

Je voudrais construire un modèle de prédiction d'achat pour une variable binaire (Y=1 achat, Y=0 non-achat).

La régression logistique semble parfaitement appropriée dans mon cas. Cependant certaines variables que je compte incorporer sont colinéaires. Pour éviter de perdre l'information apportée par leurs intéractions, il semble que la régression PLS soit adéquate.

L'association de ces deux techniques me parait adaptée.

Intérrogation: disposant de variables quantitatives continues et de variables qualitatives (pour lesquelles je compte appliquer un codage disjonctif complet), je voulais savoir si cette méthode pouvait fonctionner, information que je n'arrive pas à trouver.

Sachant que la constitution des variables latentes gràce à la PLS s'effectue telle une ACP avec ses composantes pricnipales, ce mélange de données peut-il poser problème?

Haxo

Nombre de messages : 23
Date d'inscription : 30/05/2013

Revenir en haut Aller en bas

[R] Régression logistique PLS [RESOLU] Empty Re: [R] Régression logistique PLS [RESOLU]

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum