Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
[R] Régression logistique PLS [RESOLU]
3 participants
Page 1 sur 1
[R] Régression logistique PLS [RESOLU]
Bonjour,
est-ce que quelqu'un comment on fait ce type de régression via SAS, enfin je connais la proc PLS mais j'ai pas trouvé l'option pour passer en modèle logit...
De même j'aurais aimé savoir si quelqu'un sait comment on fait des régressions logistiques sur composante PLS...
Merci d'avance.
est-ce que quelqu'un comment on fait ce type de régression via SAS, enfin je connais la proc PLS mais j'ai pas trouvé l'option pour passer en modèle logit...
De même j'aurais aimé savoir si quelqu'un sait comment on fait des régressions logistiques sur composante PLS...
Merci d'avance.
Dernière édition par joyeux_lapin13 le Lun 4 Oct 2010 - 18:00, édité 1 fois
Re: [R] Régression logistique PLS [RESOLU]
Je me permet de réup ce topic plutot que d'en créer un autre, j'ai d'ailleurs modifier le titre en ce sens.
Voilà aprés moulte recherche SAS ne fait que du PLS 'de base', c'est possible de combiner PLS et régression logistique mais déjà qu'automatiser c'est tout un truc alors à la main voilà quoi...
Donc là j'ai basculé sur R et j'utilise notamment le package disponible sur cette page: http://127.0.0.1:26914/library/plsRglm/html/plsRglm.html
J'aurais donc aimé savoir si certain ici utilise les fonctions plsRglm de ce package afin d'obtenir quelque infos sur les sorties qui sont proposées, comme par exemple: si on récupère les composantes par la syntaxe $pp, sous quel forme doive être les données pour pouvoir les projeter (uniquement centrées-réduites?).
Merci d'avance.
EDIT:
analyse <- plsRglm(DataY,DataX,model="pls-glm-logistic"), de base on a pas mal d'infos sur les performances du modèle comme le nombre de mal classé ou encore les valeurs de AIC et BIC.
analyse$Coeffs renvoi les coefficients du modèle finale, on peut faire de la sélection en utilisant les méthodes de bootstrap afin de déterminer leur significativité, pour celà on se sert des fonctions bootplsglm, boxplot.pls et plot.confint.bootplsglm.
plot(analyse$ModelFinal) permet d'afficher les graphes des résidus pour les individus atypiques.
analyse$YChapeau renvoi les probas calculés pour chaque individus avec l'équation logit final, ça permet de calculer à la main la table de confusion.
Aprés j'ai stoppé là étant donné que j'avais pas besoin d'autre infos.
Enfin pour ce qui est de la projection des variables dans le plan, alors on calcul déjà le nombre de composantes optimales via analyse$computed_nt. Et puis si on se réfère (interprétation personnel car rien trouvé d'écrit noir sur blanc perso) à la formule pour calculer les composantes (cov(X_j/Y) sous forme de rapport) on en déduit que plus une variable contribue à un axe plus elle "covarie" avec la variable réponse. De plus, plus deux variables sont proches dans le plan (les composantes sont les résidus de celle de l'étape précédente, donc ça veut dire que leur variations sur les résidus de l'étape t et de l'étape t+1 sont les même par rapport à Y), on conclut que ces deux variables ont un comportement similaire.
Je suis dispo pour si certains se retrouvent dans la même galère que moi un jour.
Voilà aprés moulte recherche SAS ne fait que du PLS 'de base', c'est possible de combiner PLS et régression logistique mais déjà qu'automatiser c'est tout un truc alors à la main voilà quoi...
Donc là j'ai basculé sur R et j'utilise notamment le package disponible sur cette page: http://127.0.0.1:26914/library/plsRglm/html/plsRglm.html
J'aurais donc aimé savoir si certain ici utilise les fonctions plsRglm de ce package afin d'obtenir quelque infos sur les sorties qui sont proposées, comme par exemple: si on récupère les composantes par la syntaxe $pp, sous quel forme doive être les données pour pouvoir les projeter (uniquement centrées-réduites?).
Merci d'avance.
EDIT:
analyse <- plsRglm(DataY,DataX,model="pls-glm-logistic"), de base on a pas mal d'infos sur les performances du modèle comme le nombre de mal classé ou encore les valeurs de AIC et BIC.
analyse$Coeffs renvoi les coefficients du modèle finale, on peut faire de la sélection en utilisant les méthodes de bootstrap afin de déterminer leur significativité, pour celà on se sert des fonctions bootplsglm, boxplot.pls et plot.confint.bootplsglm.
plot(analyse$ModelFinal) permet d'afficher les graphes des résidus pour les individus atypiques.
analyse$YChapeau renvoi les probas calculés pour chaque individus avec l'équation logit final, ça permet de calculer à la main la table de confusion.
Aprés j'ai stoppé là étant donné que j'avais pas besoin d'autre infos.
Enfin pour ce qui est de la projection des variables dans le plan, alors on calcul déjà le nombre de composantes optimales via analyse$computed_nt. Et puis si on se réfère (interprétation personnel car rien trouvé d'écrit noir sur blanc perso) à la formule pour calculer les composantes (cov(X_j/Y) sous forme de rapport) on en déduit que plus une variable contribue à un axe plus elle "covarie" avec la variable réponse. De plus, plus deux variables sont proches dans le plan (les composantes sont les résidus de celle de l'étape précédente, donc ça veut dire que leur variations sur les résidus de l'étape t et de l'étape t+1 sont les même par rapport à Y), on conclut que ces deux variables ont un comportement similaire.
Je suis dispo pour si certains se retrouvent dans la même galère que moi un jour.
Re: [R] Régression logistique PLS [RESOLU]
Bonsoir,
Je suis en train d'essayer le package plsRglm et ton post m'est bien utile.
J'ai une question: bootplsglm sort des résultats sur Std.Coeffs et pas sur Coeffs mais je n'ai pas réussi à trouver comment on passe des uns aux autres. Est-ce que je me trompe si je pense que Std.Coeffs sont à appliquer aux données normalisées?
Merci d'avance.
Je suis en train d'essayer le package plsRglm et ton post m'est bien utile.
J'ai une question: bootplsglm sort des résultats sur Std.Coeffs et pas sur Coeffs mais je n'ai pas réussi à trouver comment on passe des uns aux autres. Est-ce que je me trompe si je pense que Std.Coeffs sont à appliquer aux données normalisées?
Merci d'avance.
owkiii- Nombre de messages : 1
Date d'inscription : 14/05/2011
Re: [R] Régression logistique PLS [RESOLU]
Salut Owkiii et content de voir que ce topic peut servir à quelqu'un!
Concernant la fonction plsRglm je te conseil de regarder son utilisation sur la page d'aide qui lui est dédié sur le site de R (mais je pense que tu l'as déjà fait, je propose au cas où). Aprés la fonction bootplsglm permet de construire les intervalles de confiances par bootstrap pour sélectionner les variables dont les coefficients ont une IC qui rejète 0, je suis donc surpris que tu es l'info explicitement sur quel type de coefficients il travaille, maintenant je n'ai pas regardé plus que ça la nouvelle version de ce package dont tu dois te servir j'imagine.
Eventuellement, en précisant l'option scaleX = TRUE ou FALSE (standardisation des données ou non lors de l'utilisation de la fonction), tu devrais pouvoir avoir ta raison, si l'option scaleX = FALSE et que la liste std.Coeff est vide alors tu as raison, sinon je ne sais pas. En fait je me suis jamais posé la question vue que la boîte dans laquelle je travaille ne fait que de la recherche de biomarqueurs, du coup le coté modélisation ne m'intéresse pas mais juste la classification. Tout ce que je sais, par conséquent car j'avais vérifié pour sortir la règle décisionnelle à l'équipe clinique, c'est que les coefficients présents dans la sortie principale ont servis à calculer le vecteur de probabilité YChapeau qui permettent d'établir les performances du modèle estimé.
Je suis dispo pour tout autre question, en cas n'hésite pas à être plus précis, je lancerais le package et jeterais un oeil, as-tu regardé les références présentes sur la page d'aide? concernant les coefficients standardisés j'ai souvenir d'avoir lu sur une page sur le net leur origine, et vue que des pages qui parlent de la régression logistique pls et son application avec ce package il y en a pas des masses, tu devrais facilement retomber sur l'infos.
Concernant la fonction plsRglm je te conseil de regarder son utilisation sur la page d'aide qui lui est dédié sur le site de R (mais je pense que tu l'as déjà fait, je propose au cas où). Aprés la fonction bootplsglm permet de construire les intervalles de confiances par bootstrap pour sélectionner les variables dont les coefficients ont une IC qui rejète 0, je suis donc surpris que tu es l'info explicitement sur quel type de coefficients il travaille, maintenant je n'ai pas regardé plus que ça la nouvelle version de ce package dont tu dois te servir j'imagine.
Eventuellement, en précisant l'option scaleX = TRUE ou FALSE (standardisation des données ou non lors de l'utilisation de la fonction), tu devrais pouvoir avoir ta raison, si l'option scaleX = FALSE et que la liste std.Coeff est vide alors tu as raison, sinon je ne sais pas. En fait je me suis jamais posé la question vue que la boîte dans laquelle je travaille ne fait que de la recherche de biomarqueurs, du coup le coté modélisation ne m'intéresse pas mais juste la classification. Tout ce que je sais, par conséquent car j'avais vérifié pour sortir la règle décisionnelle à l'équipe clinique, c'est que les coefficients présents dans la sortie principale ont servis à calculer le vecteur de probabilité YChapeau qui permettent d'établir les performances du modèle estimé.
Je suis dispo pour tout autre question, en cas n'hésite pas à être plus précis, je lancerais le package et jeterais un oeil, as-tu regardé les références présentes sur la page d'aide? concernant les coefficients standardisés j'ai souvenir d'avoir lu sur une page sur le net leur origine, et vue que des pages qui parlent de la régression logistique pls et son application avec ce package il y en a pas des masses, tu devrais facilement retomber sur l'infos.
Re: [R] Régression logistique PLS [RESOLU]
Salut Joyeux lapin,
Je compte utiliser le package plsRglm, mais avant j'aimerais être sûr de ne pas me tromper de direction. J'espère que tu pourras m'aiguiller.
Je voudrais construire un modèle de prédiction d'achat pour une variable binaire (Y=1 achat, Y=0 non-achat).
La régression logistique semble parfaitement appropriée dans mon cas. Cependant certaines variables que je compte incorporer sont colinéaires. Pour éviter de perdre l'information apportée par leurs intéractions, il semble que la régression PLS soit adéquate.
L'association de ces deux techniques me parait adaptée.
Intérrogation: disposant de variables quantitatives continues et de variables qualitatives (pour lesquelles je compte appliquer un codage disjonctif complet), je voulais savoir si cette méthode pouvait fonctionner, information que je n'arrive pas à trouver.
Sachant que la constitution des variables latentes gràce à la PLS s'effectue telle une ACP avec ses composantes pricnipales, ce mélange de données peut-il poser problème?
Je compte utiliser le package plsRglm, mais avant j'aimerais être sûr de ne pas me tromper de direction. J'espère que tu pourras m'aiguiller.
Je voudrais construire un modèle de prédiction d'achat pour une variable binaire (Y=1 achat, Y=0 non-achat).
La régression logistique semble parfaitement appropriée dans mon cas. Cependant certaines variables que je compte incorporer sont colinéaires. Pour éviter de perdre l'information apportée par leurs intéractions, il semble que la régression PLS soit adéquate.
L'association de ces deux techniques me parait adaptée.
Intérrogation: disposant de variables quantitatives continues et de variables qualitatives (pour lesquelles je compte appliquer un codage disjonctif complet), je voulais savoir si cette méthode pouvait fonctionner, information que je n'arrive pas à trouver.
Sachant que la constitution des variables latentes gràce à la PLS s'effectue telle une ACP avec ses composantes pricnipales, ce mélange de données peut-il poser problème?
Haxo- Nombre de messages : 23
Date d'inscription : 30/05/2013
Sujets similaires
» Régression logistique [RESOLU]
» tracer régression logistique [RESOLU]
» résidus d'une régression logistique [RESOLU]
» intéraction lors d'une régression logistique [RESOLU]
» Regression logistique
» tracer régression logistique [RESOLU]
» résidus d'une régression logistique [RESOLU]
» intéraction lors d'une régression logistique [RESOLU]
» Regression logistique
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum