Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
A l'aide...regression log-lineaire
2 participants
Page 1 sur 1
A l'aide...regression log-lineaire
Bonjour a tous
Voila, dans le cadre de ma licence pro stid, un projet industriel nous à été confié.
L'analyse à faire porte sur un jeu de 10881 observations en milieu hospitalier, la variable à expliquer est le nombre de diagnostic associé au diagnostic principal, les éventuelles variables explicatives sont l'age, le service ou unité médical (UM) et la durée du séjour (DS).
Voici un lien vers une version non définitive d'un rapport :
rapport au format doc
format pdf
et les données :
données
Les modèles envisagés ne sont pas approprié, bien que se ne soit pas au programme de la licence, en poussant un peu les recherches sur le net,
j'ai tenté un modèle log-linéaire (régression de poisson) qui selon les nombreux documents que j'ai pu lire colle avec le secteur de la santé, épidémiologie, comptage,...
Le problème est que je ne trouve pas de cours détaillé et compréhensible à mon niveau sur ce modèle et bien que j'obtiens des résultats sur R, j'ai du mal à statuer sur la validité de ce modèle...
De plus que le max de mes Y prédit est de 14 alors que le max des Y observé est de 20...?
Aidez moi svp...
Voila, dans le cadre de ma licence pro stid, un projet industriel nous à été confié.
L'analyse à faire porte sur un jeu de 10881 observations en milieu hospitalier, la variable à expliquer est le nombre de diagnostic associé au diagnostic principal, les éventuelles variables explicatives sont l'age, le service ou unité médical (UM) et la durée du séjour (DS).
Voici un lien vers une version non définitive d'un rapport :
rapport au format doc
format pdf
et les données :
données
Les modèles envisagés ne sont pas approprié, bien que se ne soit pas au programme de la licence, en poussant un peu les recherches sur le net,
j'ai tenté un modèle log-linéaire (régression de poisson) qui selon les nombreux documents que j'ai pu lire colle avec le secteur de la santé, épidémiologie, comptage,...
Le problème est que je ne trouve pas de cours détaillé et compréhensible à mon niveau sur ce modèle et bien que j'obtiens des résultats sur R, j'ai du mal à statuer sur la validité de ce modèle...
De plus que le max de mes Y prédit est de 14 alors que le max des Y observé est de 20...?
Aidez moi svp...
vorace54- Nombre de messages : 6
Date d'inscription : 26/11/2010
Re: A l'aide...regression log-lineaire
Salut,
Désolé mais pour ma part je n'ai pas le temps matériel de lire un rapport de 30 pages donc il va falloir, pour ce qui me concerne, que tu détailles un peu plus tes questions et que tu proposes des exemples pratiques à discuter.
Mais à priori ton choix me parait correct.
nik
Désolé mais pour ma part je n'ai pas le temps matériel de lire un rapport de 30 pages donc il va falloir, pour ce qui me concerne, que tu détailles un peu plus tes questions et que tu proposes des exemples pratiques à discuter.
Mais à priori ton choix me parait correct.
nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: A l'aide...regression log-lineaire
Le but du projet est de proposer un modèle explicatif pour la variable nombre de diagnostic associé au diagnostic principal...
Les 10000 patients qui se sont présenté à l'hôpital durant une année (je ne peut pas dire quelle année précisément) ont été hospitalisés pour des durées de séjours variable et dans différents service médicaux.
Chacun présentant un certain nombre de diagnostic associé qui selon leur classification (sorte de norme établie dans le pmsi, mais la n'est pas la question) induira une revalorisation du séjour ou non.
Nous sommes en trio sur le projet et un de mes collègues propose dans le rapport une régression linéaire simple du nombre de diagnostic associé en fonction de l'age des patients. Le nuage de points des résidus en fonction des valeurs prédites est en forme d'entonnoir et nous permet de dire des le début que le modèle linéaire simple ou multiple n'est pas bon. Mais pour prouver que l'on a travaillé, il poursuit sur cette voie.
Mon problème est que contrairement à la régression linéaire, je ne sais pas comment estimer la qualité d'un modèle log-linéaire (poisson): R² ? distribution normale des résidus?
J'ai vu par endroit que l'on parlait de sur-dispersion, de variable off-set...quesaco ?
En somme, la première partie du travail consiste à comprendre le lien entre ces variables, pour dans un second temps évaluer la qualité du codage, à savoir si les médecins remplissent bien les fiches patients.(éventuellement sur ou sous estimations du nombre de diagnostic associé...)
Voila, désolé pour le nombre de questions...
J'ajouterai juste que la soutenance est pour vendredi 28 janvier et je veux juste être en mesure de justifier mon choix sans trop rentrer dans les détails puisque comme je l'ai dit plus haut, la régression de poisson n'est pas au programme de la licence.
Les 10000 patients qui se sont présenté à l'hôpital durant une année (je ne peut pas dire quelle année précisément) ont été hospitalisés pour des durées de séjours variable et dans différents service médicaux.
Chacun présentant un certain nombre de diagnostic associé qui selon leur classification (sorte de norme établie dans le pmsi, mais la n'est pas la question) induira une revalorisation du séjour ou non.
Nous sommes en trio sur le projet et un de mes collègues propose dans le rapport une régression linéaire simple du nombre de diagnostic associé en fonction de l'age des patients. Le nuage de points des résidus en fonction des valeurs prédites est en forme d'entonnoir et nous permet de dire des le début que le modèle linéaire simple ou multiple n'est pas bon. Mais pour prouver que l'on a travaillé, il poursuit sur cette voie.
Mon problème est que contrairement à la régression linéaire, je ne sais pas comment estimer la qualité d'un modèle log-linéaire (poisson): R² ? distribution normale des résidus?
J'ai vu par endroit que l'on parlait de sur-dispersion, de variable off-set...quesaco ?
En somme, la première partie du travail consiste à comprendre le lien entre ces variables, pour dans un second temps évaluer la qualité du codage, à savoir si les médecins remplissent bien les fiches patients.(éventuellement sur ou sous estimations du nombre de diagnostic associé...)
Voila, désolé pour le nombre de questions...
J'ajouterai juste que la soutenance est pour vendredi 28 janvier et je veux juste être en mesure de justifier mon choix sans trop rentrer dans les détails puisque comme je l'ai dit plus haut, la régression de poisson n'est pas au programme de la licence.
vorace54- Nombre de messages : 6
Date d'inscription : 26/11/2010
Sujets similaires
» Comparer résultats régression linéaire et non linéaire
» Régression Logistique vs Régression Linéaire
» test statistique sur des courbes
» regression lineaire
» regression lineaire
» Régression Logistique vs Régression Linéaire
» test statistique sur des courbes
» regression lineaire
» regression lineaire
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum