Soutenance de thèse Julie JACQUES - 2 décembre

par joyeux_lapin13 Ven 8 Nov 2013 - 12:30

Bonjour,

J'ai le plaisir de vous inviter à la soutenance de ma thèse de doctorat
intitulée "Classification sur données médicales à l'aide de méthodes
d'optimisation et de datamining, appliquée au pré-screening dans les
essais cliniques " qui aura lieu le 2 décembre 2013 à 14h dans
l'amphithéâtre de l'IRCICA (Université Lille 1), ainsi qu'au pot qui suivra.

Le jury de thèse est composé de :

*/_Directeurs de Thèse_/**/ :/*/Clarisse DHAENENS, Professeur des
Universités, Université Lille I/

/ Laetitia JOURDAN, Professeur des Universités, Université Lille I/*//*

*/_Rapporteurs_/**/ :/*/Jean-Charles BILLAUT, Professeur des
Universités, Université de Tours/

/Nadia BRAUNER, Professeur des Universités,Université Grenoble I/*//*

*/_Membres_/**/ :/*/Stéphane BONNEVAY, Maître de conférences, HDR,
Université Lyon I/

/Denis BOUYSSOU, Directeur de recherche, Université Paris Dauphine/

/ Sophie TISON, Professeur des Universités, Université Lille I/

/ David DELERUE (Invité), Gérant, Société Alicante/*//*

*/_Résumé:_/*

Les données médicales souffrent de problèmes d'uniformisation ou
d'incertitude, ce qui les rend difficilement utilisables directement par
des logiciels médicaux, en particulier dans le cas du recrutement pour
les essais cliniques. Dans cette thèse, nous proposons une approche
permettant de palier la mauvaise qualité de ces données à l'aide de
méthodes de classification supervisée. Nous nous intéresserons en
particulier à 3 caractéristiques de ces données : asymétrie, incertitude
et volumétrie. Nous proposons l'algorithme MOCA-I qui aborde ce problème
combinatoire de classification partielle sur données asymétriques sous
la forme d'un problème de recherche locale multi-objectif. Après avoir
confirmé les apports de la modélisation multi-objectif dans ce contexte,
nous calibrons MOCA-I et le comparons aux meilleurs algorithmes de
classification de la littérature, sur des jeux de données réels et
asymétriques de la littérature. Les ensembles de règles obtenus par
MOCA-I sont statistiquement plus performants que ceux de la littérature,
et 2 à 6 fois plus compacts. Pour les données ne présentant pas
d'asymétrie, nous proposons l'algorithme MOCA, statistiquement
équivalent à ceux de la littérature. Nous analysons ensuite l'impact de
l'asymétrie sur le comportement de MOCA et MOCA-I, de manière théorique
et expérimentale. Puis, nous proposons et évaluons différentes méthodes
pour traiter les nombreuses solutions Pareto générées par MOCA-I, afin
d'assister l'utilisateur dans le choix de la solution finale et réduire
le phénomène de sur-apprentissage. Enfin, nous montrons comment le
travail réalisé peut s'intégrer dans une solution logicielle.

/*_Abstract_*/:
Medical data suffer from uncertainty and a lack of uniformisation,
making them hard to use in medical software, especially for patient
screening in clinical trials. In this PhD work, we propose to deal with
these problems using supervised classification methods. We will focus on
3 properties of these data : imbalance, uncertainty and volumetry. We
propose the MOCA-I algorithm to cope with this partial classification
combinatorial problem, that uses a multi-objective local search
algorithm. After having confirmed the benefits of multiobjectivization
in this context, we calibrate MOCA-I and compare it to the best
algorithms of the literature, on both real data sets and imbalanced data
sets from literature. MOCA-I generates rule sets that are statistically
better than models obtained by the best algorithmes of the literature.
Moreover, the models generated by MOCA-I are between 2 to 6 times
shorter. Regarding balanced data, we propose the MOCA algorithm,
statistically equivalent to best algorithms of literature. Then, we
analyze both theoretically and experimentally the behaviors of MOCA and
MOCA-I depending on imbalance. In order to help the decision maker to
choose a solution and reduce over-fitting, we propose and evaluate
different methods to handle all the Pareto solutions generated by
MOCA-I. Finally, we show how this work can be integrated into a software
application.

Meilleures salutations,

Julie JACQUES

--
ALICANTE
50 rue Philippe de Girard
59113 SECLIN
Tél. [+33](0)3 28 55 92 50
Fax [+33](0)3 28 55 92 51
http://www.alicante.fr/

info@alicante.fr