Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
construction d'un score diagnostique
3 participants
Page 1 sur 1
construction d'un score diagnostique
Bonsoir à tous,
Je suis interne en médecine et je viens demander votre aide car ma biostatisticienne n'est pas très réactive...
Pour faire court, il s'agit d'un étude sur l'IRM dans l'évaluation après traitement d'un cancer cérébral
Mathématiquement cela correspond à un modèle de régression logistique avec 5 covariables binaires et une issue Y binaire
Je vais relire ces IRM et déterminer la fréquence de chacune des covariables puis appliquer une régression logistique.
J'aimerai savoir comment construire un score diagnostique à partir des OR de la régression logistique, si c'est statistiquement faisable.
J'ai lu que ce serait peut être possible avec un algorithme POLYCLASS (package plosone R)... mais je vous avoue que cela va au delà de mes connaissances en statistiques.... Et je n'ai rien trouvé d'autre malgré de nombreuses recherches.
Concernant la validation, j'imaginais faire relire les IRM par un ami qui appliquerait le score construit. Est ce envisageable ou beaucoup trop biaisé étant donné qu'il s'agirait de l'échantillon ayant servi à la construction du score? Faut il mieux faire du splittinf data?
Je précise que je n'ai qu'un très faible échantillon disponible (60patients)...
Merci de votre aide et de vos remarques.
Je suis interne en médecine et je viens demander votre aide car ma biostatisticienne n'est pas très réactive...
Pour faire court, il s'agit d'un étude sur l'IRM dans l'évaluation après traitement d'un cancer cérébral
Mathématiquement cela correspond à un modèle de régression logistique avec 5 covariables binaires et une issue Y binaire
Je vais relire ces IRM et déterminer la fréquence de chacune des covariables puis appliquer une régression logistique.
J'aimerai savoir comment construire un score diagnostique à partir des OR de la régression logistique, si c'est statistiquement faisable.
J'ai lu que ce serait peut être possible avec un algorithme POLYCLASS (package plosone R)... mais je vous avoue que cela va au delà de mes connaissances en statistiques.... Et je n'ai rien trouvé d'autre malgré de nombreuses recherches.
Concernant la validation, j'imaginais faire relire les IRM par un ami qui appliquerait le score construit. Est ce envisageable ou beaucoup trop biaisé étant donné qu'il s'agirait de l'échantillon ayant servi à la construction du score? Faut il mieux faire du splittinf data?
Je précise que je n'ai qu'un très faible échantillon disponible (60patients)...
Merci de votre aide et de vos remarques.
apbs- Nombre de messages : 5
Date d'inscription : 11/01/2016
Re: construction d'un score diagnostique
l'issue est déterminée par tes 5 covariables, ou par un moyen diagnostique indépendant ?
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Re: construction d'un score diagnostique
L'issue est connue d'après le dossier clinique.
L'idée est de faire un modèle pour prédire l'issue à partir des 5 covariables.
Merci de ton aide
L'idée est de faire un modèle pour prédire l'issue à partir des 5 covariables.
Merci de ton aide
apbs- Nombre de messages : 5
Date d'inscription : 11/01/2016
Re: construction d'un score diagnostique
Je ne suis pas très compétent la dedans mais j'ai lu récemment un truc intéressant dans le lien ci-dessous qui devrait t'aider à avancer.
Cherche le chapitre sur "courbes ROC et calcul de scores", a mon souvenir ca donne une bonne idée du principe general consistant à assigner un nombre de points à chaque critère en fonction des résultats d'une régression logistique.
https://books.google.fr/books?id=sQ6s01yNDgsC&pg=PA336&lpg=PA336&dq=courbe+roc+variables&source=bl&ots=gcOHCQcYci&sig=hEiN4emQlaNcl4pOCvHmSgCYu80&hl=fr&sa=X&ved=0ahUKEwidlJfFrqTKAhWBuBQKHRurCW0Q6AEINTAD#v=onepage&q=courbe%20roc%20variables&f=false
Cherche le chapitre sur "courbes ROC et calcul de scores", a mon souvenir ca donne une bonne idée du principe general consistant à assigner un nombre de points à chaque critère en fonction des résultats d'une régression logistique.
https://books.google.fr/books?id=sQ6s01yNDgsC&pg=PA336&lpg=PA336&dq=courbe+roc+variables&source=bl&ots=gcOHCQcYci&sig=hEiN4emQlaNcl4pOCvHmSgCYu80&hl=fr&sa=X&ved=0ahUKEwidlJfFrqTKAhWBuBQKHRurCW0Q6AEINTAD#v=onepage&q=courbe%20roc%20variables&f=false
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Re: construction d'un score diagnostique
Merci beaucoup pour ton aide.
JE vais lire la référence que tu m'envoies.
Si d'autres ont des idées, je suis preneur!
JE vais lire la référence que tu m'envoies.
Si d'autres ont des idées, je suis preneur!
apbs- Nombre de messages : 5
Date d'inscription : 11/01/2016
Re: construction d'un score diagnostique
"Je vais relire ces IRM et déterminer la fréquence de chacune des covariables puis appliquer une régression logistique." Ce n'est pas comme cela fonctionne la régression logistique. Le calcul se fait à partir du tableau initial des individus :
individu1 var1(1) var2(1) var3(1) var4(1) var5(1) issue(1)
...
Il en résultera six coefficients (l'ordonnée à l'origine incluse) estimant l'importance de chacune des variables dans l'issue. Le signe permet de savoir si la variable considéré agit comme un facteur de risque ou de protection.
A partir de ces estimations, n'importe quel logiciel permet de calcul la valeur de la fonction de lien pour chaque individu. Cette valeur est le score recherché en utilisant une stratégie basée sur la régression logistique.
Une courbe ROC (avec intervalle de confiance de l'AUC) permet de se donner une idée de la qualité optimiste du classifieur. Pour aller plus loin, il faut utiliser une méthode de validation croisée. Il en existe plusieurs (voir la page de Wikipedia cross-validation).
"Concernant la validation, j'imaginais faire relire les IRM par un ami qui appliquerait le score construit. " Je ne comprends rien à la stratégie sous-jacente à cette proposition car un second lecteur n'a aucune influence sur la procédure (Cf. supra en ce qui concerne la validation). Le second lecteur ne peut qu'intervenir dans la pose du diagnostic pour le confirmer ou l'infirmer.
"Je précise que je n'ai qu'un très faible échantillon disponible (60patients)" Au vu du nombre de variables et de combinaisons, en effet. D'où obligation de la validation croisée et, pour rendre le résultat plus robuste, d'utiliser une méthode de type bootstrap ou sélection de variables (par exemple, voir la méthode d'Hosmer et Lemeshow, mais il existe une abondante littérature sur le sujet).
NB: pendant que j'écrivais le message c@ssoulet à envoyé un lien qui complète ce que je viens d'écrire.
individu1 var1(1) var2(1) var3(1) var4(1) var5(1) issue(1)
...
Il en résultera six coefficients (l'ordonnée à l'origine incluse) estimant l'importance de chacune des variables dans l'issue. Le signe permet de savoir si la variable considéré agit comme un facteur de risque ou de protection.
A partir de ces estimations, n'importe quel logiciel permet de calcul la valeur de la fonction de lien pour chaque individu. Cette valeur est le score recherché en utilisant une stratégie basée sur la régression logistique.
Une courbe ROC (avec intervalle de confiance de l'AUC) permet de se donner une idée de la qualité optimiste du classifieur. Pour aller plus loin, il faut utiliser une méthode de validation croisée. Il en existe plusieurs (voir la page de Wikipedia cross-validation).
"Concernant la validation, j'imaginais faire relire les IRM par un ami qui appliquerait le score construit. " Je ne comprends rien à la stratégie sous-jacente à cette proposition car un second lecteur n'a aucune influence sur la procédure (Cf. supra en ce qui concerne la validation). Le second lecteur ne peut qu'intervenir dans la pose du diagnostic pour le confirmer ou l'infirmer.
"Je précise que je n'ai qu'un très faible échantillon disponible (60patients)" Au vu du nombre de variables et de combinaisons, en effet. D'où obligation de la validation croisée et, pour rendre le résultat plus robuste, d'utiliser une méthode de type bootstrap ou sélection de variables (par exemple, voir la méthode d'Hosmer et Lemeshow, mais il existe une abondante littérature sur le sujet).
NB: pendant que j'écrivais le message c@ssoulet à envoyé un lien qui complète ce que je viens d'écrire.
Florent Aubry- Nombre de messages : 251
Date d'inscription : 02/11/2015
Sujets similaires
» Construction d'un échantillon "représentatif"...
» construction d'un indicateur synthetique a partir de l'ACP
» Z-score extrème et GEE
» Construction d'un indicateur synthétique à partir d'une ACP
» Score
» construction d'un indicateur synthetique a partir de l'ACP
» Z-score extrème et GEE
» Construction d'un indicateur synthétique à partir d'une ACP
» Score
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum