Les posteurs les plus actifs de la semaine
joyeux_lapin13
 
zeu
 
gg
 
schlebe
 
zezima
 
Antoin123
 
Eric Wajnberg
 
Yacouba_KONE
 
rayanes159
 
noviceST
 


Utiliser techniques de classification ou de prédiction?

Voir le sujet précédent Voir le sujet suivant Aller en bas

Utiliser techniques de classification ou de prédiction?

Message par HDKalit le Jeu 24 Jan 2013 - 9:58

Bonjour tout le monde,

Je remercie encore pour les réponses apportées sur un précédent sujet que j'ai ouvert. Depuis j'ai mieux compris Wink
Ici je suis face à une problématique de départ ... à savoir sur quelle méthodologie je pars!

Donc en gros pour le moment j'ai une population avec n individus - patients - (n assez grand ce qui me permet de faire tirer de grands échantillons d'apprentissage, de test et de validation) et p variables (quantitatives et qualitatives).
L'idée étant de créer plusieurs groupes du style : Malade, Potentiellement Malade et Sain. (pour commencer du moins ça sera 3 groupes, après suivant la taille des groupes il se peut que j'augmente la granularité)

A terme je vais avoir d'autres individus qui vont s'ajouter de façon continue à ma population et de nouvelles variables (avec valeurs sur toute ma population) donc j'aimerai pouvoir ré-utiliser ma première segmentation pour faire du classement sur les nouveaux individus.

Bien sur suivant dans quelle catégorie se trouve le patient on appliquera pas le même protocole.

Alors voilà j'hésite entre plusieurs méthodes, à savoir quelque chose de purement descriptif (ACM + k-means) ou quelque chose qui me semble plus approprié qui serait d'utiliser une méthode de classement (et éventuellement de prédiction après pour les nouveaux patients?) du type régression logistique (pour données polytomiques), ou analyse discriminante DISQUAL, ou encore arbre de décision (?) - après avoir transformé mes données quanti. en quali. -

Je me dis que le plus logique étant la deuxième solution et de s'inspirer de ce qui se fait pour les scores "d'appétence", score "d'octroi" (acceptation) mais:
1/ les groupes sont censés être pré-définis et dans mon cas on sait comment on veut classer mais on ne sait pas (encore? Peut-être qu'une pré analyse multivariée descriptive + discriminante pourrait m'aider?)
2/ Souvent il n'y a que 2 classes dans tout ce qui est scoring ou même modèle de prédiction. Ici j'en aurai (au moins) 3 et le nombre pourrait augmenter suivant ce qu'on décide d'avoir en terme de finesse pour le risque de maladie (sur plusieurs maladies bien entendu ^^).


Voilà si quelqu'un pouvait m'éclairer dans mon raisonnement ça serait super. Là je regarde un peu les méthodes de classement/prédiction et ce qu'il y a derrière pour voir si jamais quelque chose d'autre existe.

Bien Cordialement,

KaliHD

HDKalit

Nombre de messages : 85
Date d'inscription : 10/01/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Utiliser techniques de classification ou de prédiction?

Message par c@ssoulet le Jeu 24 Jan 2013 - 10:33

Fais attention sur tes critères de classement. Il est très facile d'orienter les résultats en jouant sur les critères ou valeurs frontières, même involontairement.

Classiquement
- les critères de classement sont des critères cliniques
- Ils doivent être définis à priori
- sur des critères cliniques validés (voir recos HAS-sociétés savantes - etc)

c@ssoulet

Nombre de messages : 646
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Utiliser techniques de classification ou de prédiction?

Message par HDKalit le Jeu 24 Jan 2013 - 10:55

c@ssoulet a écrit:Fais attention sur tes critères de classement. Il est très facile d'orienter les résultats en jouant sur les critères ou valeurs frontières, même involontairement.

Classiquement
- les critères de classement sont des critères cliniques
- Ils doivent être définis à priori
- sur des critères cliniques validés (voir recos HAS-sociétés savantes - etc)

Merci pour l'info.
En fait ici ce n'est pas un cas "réel", juste une étude "théorique" donc je n'ai pas (peut être une fois que j'aurai défini moi même des critères je demanderai l'expertise "clinique" mais encore une fois c'est un sujet d'étude et pas un cas "réel" sur lequel bien entendu les critères auraient été validés à l'avance cliniquement). Encore merci pour la précision Wink

Je me dis que concrètement j'ai intérêt à partir sur une méthode de classement ... mais sur quelle variable à expliquer? Je dois la créer car ce n'est pas écrit sur le patient si il est malade, potentiellement malade ou sain!
Normalement c'est ici où les critères doivent servir (critères cliniques validés) mais j'essaye de m'en "passer" (cf. au dessus) ... et du coup est-ce qu'une ACM pourrait m'aider ici justement à voir quelle(s) variable(s) va servir à définir les critères pour pouvoir après appliquer une méthode de classement sur un échantillon où j'aurai autant de patient dans chacun des groupes prédéfinis?

Ou alors est-ce que je me prends la tête pour rien et qu'au final une analyse descriptive peut me suffire à définir "3" groupes (en forçant le k-means à 3 groupes)? A priori ça me semble pas top ça et vraiment en l'écrivant je me rends compte que ça n'a pas d'intérêt même. L'idée étant vraiment un score (une probabilité d'être malade ou sain?) en lien avec les groupes et donc le classement.

J'ai l'impression de prendre le problème par le mauvais bout ... ou de me perdre tout simplement ici.

Cordialement,

KaliHD

HDKalit

Nombre de messages : 85
Date d'inscription : 10/01/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Utiliser techniques de classification ou de prédiction?

Message par c@ssoulet le Jeu 24 Jan 2013 - 13:19

Désolé d'insister, mais si tu veux avancer il faut aller au delà de ta réflexion et directement t'imaginer debout devant un écran en train de présenter tes résultats devant un public de médecins spécialistes. Tu vas voir que ca va considérablement éclaircir la situation, et t'orienter vers des choix simples et surtout justifiés.

- bon, alors voilà, j'étudie telle maladie, j'ai collecté des données comme ci et comme ca, voilà la description de ma population, et j'ai fait 3 groupes: les malades, les non malades et les diagnostifs douteux.
- excusez moi, pouvez vous nous préciser comment vous avez construits vos groupes.

Si tu pars dans une explication mathématique alambiquée que tes auditeurs ne comprennent pas, c'est plié. Plus personne ne t'écoute et personne ne croit en tes résultats. L'ampoule rouge "tripotage de données" s'allume dans la tête de tout le monde.

Si tu dis: eh bien j'ai fait de la biblio, j'ai recherché les critères diagnostiques validés, je les ai appliqués de telle façon sur ma population afin de créer des groupes selon les recommandations publiées en telle année par le groupe de travail bidule, on t'écoute.

c@ssoulet

Nombre de messages : 646
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Utiliser techniques de classification ou de prédiction?

Message par HDKalit le Jeu 24 Jan 2013 - 13:59

c@ssoulet a écrit:Désolé d'insister, mais si tu veux avancer il faut aller au delà de ta réflexion et directement t'imaginer debout devant un écran en train de présenter tes résultats devant un public de médecins spécialistes. Tu vas voir que ca va considérablement éclaircir la situation, et t'orienter vers des choix simples et surtout justifiés.

- bon, alors voilà, j'étudie telle maladie, j'ai collecté des données comme ci et comme ca, voilà la description de ma population, et j'ai fait 3 groupes: les malades, les non malades et les diagnostifs douteux.
- excusez moi, pouvez vous nous préciser comment vous avez construits vos groupes.

Si tu pars dans une explication mathématique alambiquée que tes auditeurs ne comprennent pas, c'est plié. Plus personne ne t'écoute et personne ne croit en tes résultats. L'ampoule rouge "tripotage de données" s'allume dans la tête de tout le monde.

Si tu dis: eh bien j'ai fait de la biblio, j'ai recherché les critères diagnostiques validés, je les ai appliqués de telle façon sur ma population afin de créer des groupes selon les recommandations publiées en telle année par le groupe de travail bidule, on t'écoute.

Il est vrai. Mais encore une fois ici c'est quelque chose de purement théorique pour comprendre la méthodo' que l'on pourrait utiliser. Ici j'avais des données cliniques mais j'ai également des jeux de données d'assurances, de biologie végétale, market, etc. N'ayant aucune connaissance dans ces domaines j'espérais pouvoir tirer quelque chose des données pour tirer des grandes tendances, etc.

Du coup sans critère on a aucune possibilité d'avoir une "idée" de variables intéressantes pour pouvoir après faire du classement? Je parle ici indépendamment de mon jeu de données.

Et dans ce cas on ne peut faire que du descriptif? Et éventuellement faire quelque chose sur les axes principaux ... ?
En gros créer des clusters et après bah ... analyser pour voir si ces clusters (classif' sans à priori sur les groupes) sont pertinents ou pas?

HDKalit

Nombre de messages : 85
Date d'inscription : 10/01/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Utiliser techniques de classification ou de prédiction?

Message par Contenu sponsorisé Aujourd'hui à 20:16


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum