Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

Le Deal du moment :
Google Pixel 7 5G – Smartphone 6,3″ OLED ...
Voir le deal
316 €

Anova sous R

3 participants

Aller en bas

Anova sous R Empty Anova sous R

Message par lyonnaisdu26 Jeu 14 Avr 2011 - 7:16

Bonjour à tous,

Alors je vous explique la situtation.

J'ai 2 variables explicatives, Chirurgiens (environ 150 modalités) et interventions (environ 250 modalités).
Pour chaque chirurgiens et intervention j'ai une duree moyenne (que je souhaiterai expliqué). Cette durée change selon le chirurgiens et selon l'intervention.

J'ai voulu réaliser une ANOVA afin de déterminer si ces moyennes sont justes.

J'ai donc taper le code suivant :

Code:

donnees<-read.delim2("C:\\Documents and Settings\\cvialle\\Bureau\\Stats_Cyril/ANOVA1.txt",dec=",",sep="\t",header=TRUE)
facchir<-as.factor(donnees$chir)
facint<-as.factor(donnees$int)
r<-aov(donnees$duree_moyenne~facchir*facint)
anova(r)


Bon, R a vraiment galérer parce que ca fait plus de 37500 combinaisons possibles. Est-ce que cela peut fausser mon ANOVA ? (j'ai 600 enregistrements environ.)

Ensuite, au bout d'un long moment, R a réussi à me sortir un résultat :

Analysis of Variance Table

Response: donnes$duree_moyenne
Df Sum Sq Mean Sq F value Pr(>F)
facchir 56 0.16948 0.00302639 19.115 <2e-16 ***
facint 265 0.59843 0.00225821 14.264 <2e-16 ***
facchir:facint 141 0.02270 0.00016101 1.017 0.4685
Residuals 98 0.01552 0.00015832
---
Signif codes: 0 '***' 0.001'**' 0.01'*' 0.05'.' 0.1 ' ' 1

Quelqu'un sait-il comment interpréter ca ? Si mon ANOVA est correct, que puis-je conclure sur mes moyennes ? (Je suis débutant dans ce domaine, donc si quelqu'un peut m'expliquer un peu tout ca ?)

Merci d'avance :-)

Cordialement

C.B

lyonnaisdu26

Nombre de messages : 10
Date d'inscription : 14/04/2011

Revenir en haut Aller en bas

Anova sous R Empty Re: Anova sous R

Message par Invité Jeu 14 Avr 2011 - 7:41

J'ai l'impression d'avoir déjà vu ça sur un autre forum ^^

A priori mon interprétation serait que:
La durée moyenne varie en fonction du chirurgien
La durée moyenne varie en fonction du type d'intervention
Les chirurgiens, pris uns à uns, ne sont pas plus rapide pour une intervention que pour une autre (intercation non significative).

En gros, y'a des lents, y'a des rapides, y'a des interventions longues, d'autres moins.

Avec le tableau que tu me donnes, je peux pas trop en dire plus je crois. Mais tu peux voir les caractéristiques de chaque chirurgien et de chaque intervention, et voir si la durée d'intervention par modalité est significativement supérieure ou inférieure à la moyenne,
via la fonction aov.sum() du package agrocampus.

EDIT: aov.sum te permet aussi de voir l'estimation de la moyenne, ce qui t'intéresse ici je crois

Invité
Invité


Revenir en haut Aller en bas

Anova sous R Empty Re: Anova sous R

Message par lyonnaisdu26 Jeu 14 Avr 2011 - 8:02

Oui j'ai déjà posté ça sur un autre forum mais pas eu de réponse ^^

D'ailleurs merci de ta réponse rapide :-)

Pour utiliser aov.sum(), il faut que je télécharge le package agrocampus c'est ça ? Cette fonction va me permettre de déterminer les chirurgiens lents, les rapides, les intervention longue et rapide c'est bien ça?

lyonnaisdu26

Nombre de messages : 10
Date d'inscription : 14/04/2011

Revenir en haut Aller en bas

Anova sous R Empty Re: Anova sous R

Message par Invité Jeu 14 Avr 2011 - 8:07

Exactement, ainsi que la valeur moyenne de la durée d'intervention,
avec à chaque fois la valeur de la probabilité critique associée.
Pour télécharger le package c'est ici:
http://www.agrocampus-ouest.fr/math/package.html

La fonction est très simple à utiliser, dans ton cas
Code:
aov.sum(r)

Invité
Invité


Revenir en haut Aller en bas

Anova sous R Empty Re: Anova sous R

Message par lyonnaisdu26 Jeu 14 Avr 2011 - 8:16

Ok merci, je recharge mon script(très très long -_-') et je te dis ce que j'obtiens.

Merci beaucoup

Cordialement

CV

lyonnaisdu26

Nombre de messages : 10
Date d'inscription : 14/04/2011

Revenir en haut Aller en bas

Anova sous R Empty Re: Anova sous R

Message par Nik Jeu 14 Avr 2011 - 8:45

Salut,

juste en passant comme on est quand même sur un forum de stat :
tu as 2 variables explicatives à respectivement 150 et 250 modalités et en plus tu veux évaluer leur interaction...

une estimation très grossière, sans compter l'interaction pourrais te dire que tu as besoin de 40*(150+250) = 16 000 observations. Tu en as 600...
Ensuite d'un point de vue R, tu utilises la fonction aov dont les résultats dépendent fortement du plan d'expérience de ton modèle. Celui-ci doit être équilibré pour espérer obtenir une évaluation correcte des paramètres. Or avec les données dont tu disposes tu ne peux espérer avoir un plan équilibré.

Donc en premmier diagnostic il faut :

-utiliser la fonction anova() couplée avec la fonction lm()
-se garder de toute interprétation de tes résultats : avec ton nombre de catégorie tu auras forcément une différence significative et avec le peu d'observation que tu as pour évaluer la taille d'effet tu ne pourras pas te rendre compte si la différence de durée observée est réellement importante ou pas (e.g. : si c'est de l'ordre de la seconde on s'en moque complètement que la différence soit significative ou pas)
-il faut absolument réduire de manière drastique le nombre de modalité. ça on ne pourra pas le faire pour toi : il faut trouver des catégories plus large pour arriver à un nombre de modalité plus correcte (une dizaine par variable est à mon avis un objectif à atteindre).
Si tu ne peux arriver à ça alors tes données sous leur forme actuelle ne te servent à pas grand chose même pour une analyse exploratoire...mettre en évidence que les chirurgiens vont à des vitesses différentes pour réaliser des opérations ou suivant les opérations n'est à mon avis pas très informatif et ne nous apprend rien.

Désolé d'être un peu abrupt mais la pratique des stats en médecine classique (hors recherche) me fait souvent hurler !

Nik

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

Anova sous R Empty Re: Anova sous R

Message par lyonnaisdu26 Jeu 14 Avr 2011 - 9:02

Salut,

Alors je pourrai avoir 16000 observations, puisque j'ai selectionné mes enregistrements seulement sur 2011. Déjà que R galère pour me sortir quelque choses, alors j'imagine mm pas si je prend sur 10 ans .

C'est vrai que je me suis posé cette question de modalités, ca en fait beaucoup. Après ce que je peux faire, c'est regroupé les chirurgiens par spécialités (ORL, Ophtalmologie...), ce qui me ferait 17 modalités.
Les interventions, pareil, les regrouper par spécialités. Mais je pense que je perdrais énormément d'informations ? De plus, comment faire par exemple dans une spécialités, 2 interventions différentes, avec en duree moyenne 2 heures de differences ? Je fais la moyenne ?

Après à la base, ce que je souhaite faire ces regarder si mes moyennes sont justes, donc si tu as un autre moyen ?

Aucun problème pour ta "réponse un peu abrut", on est sur un forum et toute critique est bonne à prendre, c'est comme ça qu'on progresse

lyonnaisdu26

Nombre de messages : 10
Date d'inscription : 14/04/2011

Revenir en haut Aller en bas

Anova sous R Empty Re: Anova sous R

Message par Nik Jeu 14 Avr 2011 - 9:19

Tu veux garder un max d'info mais tu ne sélectionne qu'une année ? Smile

Pour la gestion de 16000 lignes, R en est tout à fait capable, tout dépend de ton OS et des scripts que tu emploies.
Même avec les données totales, prend tout de même anova(lm()) comme option par défaut si tu ne travailles pas sur des manip expérimentales.
les chirurgiens par spécialités (ORL, Ophtalmologie...), ce qui me ferait 17 modalités.
ce serait quand même tout de suite plus raisonnable.

Les interventions, pareil, les regrouper par spécialités. Mais je pense que je perdrais énormément d'informations ? De plus, comment faire par exemple dans une spécialités, 2 interventions différentes, avec en duree moyenne 2 heures de differences ? Je fais la moyenne ?
Vouloir garder toute l'information et croire que les stats vont pouvoir en tenir compte sans problème est illusoire. Pour la gestion de variance différentes tu as des options possibles avec les modèles mixtes ou encore les GEE. Il faudrait pour cela que tu aies quelques hypothèses à poser sur ce que tu veux faire.
Je ne peux pas te dire ce qui est le mieux pour tes regroupements car je ne connais pas tes données. Mais tu n'es sans doute pas obligé de faire des moyennes. Il faut déjà créer un facteur de regroumement qui alloue chaque observation à une catégorie (une des 17, si tu peux déjà arriver à ça)

Aucun problème pour ta "réponse un peu abrut", on est sur un forum et toute critique est bonne à prendre, c'est comme ça qu'on progresse
justement on est sur un forum et il n'y a pas le sourire en face pour dédramatiser le discours Wink

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

Anova sous R Empty Re: Anova sous R

Message par lyonnaisdu26 Jeu 14 Avr 2011 - 11:47

Alors voilà ce que je vais faire :

Je vais réaliser plusieurs ANOVA, 17 au total. 1 ANOVA par spécialité.
J'ai donc, dans le plus grand des cas, 60aine de modalités d'interventions et une 30aine de chirurgiens.

Cela vous semble t-il correct ?

Et je ferai donc le code :

donnees<-read.delim2("C:\\.../LANOVORL.txt",dec=",",sep="\t",header=TRUE)
facchir<-as.factor(donnees$chir)
facint<-as.factor(donnees$int)
r<-anova(lm(donnees$duree_moyenne~facchir*facint))

lyonnaisdu26

Nombre de messages : 10
Date d'inscription : 14/04/2011

Revenir en haut Aller en bas

Anova sous R Empty Re: Anova sous R

Message par Nik Jeu 14 Avr 2011 - 12:20

lyonnaisdu26 a écrit:
Je vais réaliser plusieurs ANOVA, 17 au total. 1 ANOVA par spécialité.
J'ai donc, dans le plus grand des cas, 60aine de modalités d'interventions et une 30aine de chirurgiens.

Cela vous semble t-il correct ?
Je ne pense pas que multiplier les ANOVA puisse résoudre ton problème. Si la comparaison entre discipline ne t'intéresse pas, effectivement il ne faut pas associer toutes les données. Mais 90 paramètre à estimer me semble vraiment énorme. Avoir une comparaison des chirurgiens est il vraiment nécessaire ?
D'un point de vur pratique la multiplication de tes modalités va avoir des conséquences assez lourdes à gérer quant à l'applicabilité du modèle d'ANOVA à tes données. Si on passe outre la normalité des données il faut encore vérifer que tu n'aies pas de problème d'hétéroscédasticité ou sinon que tes effectifs pour chacun des couples chirurgien/intervention soit à peu près équivalent.
A mon avis tu devrais déjà commencer par poser clairement tes hypothèses de travail en fonction de l'objectif à atteindre. Les cas de surcatégorisation correspondent souvent à des hypothèses de travail mal formulées.

Nik

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

Anova sous R Empty Re: Anova sous R

Message par gg Jeu 14 Avr 2011 - 12:41

Bonjour.

Pour avoir déjà regardé des données de temps d'opération, je sais que les durées moyennes sont très variables, et que les dispersions sont encore plus variables, suivant le type d'opération chirurgicale. Il me semble que catégoriser sérieusement les types d'opérations pour ne pas mettre ensemble des cas où il faut généralement 30 mn à deux minutes près avec des situations où la moyenne est 2h avec un écart type de 2h (variable plutôt lognormale que gaussienne) parce qu'un certain nombre de cas nécessitent un large supplément de temps.
Ce que j'avais surtout vu, c'est que tout mettre ensemble était le meilleur moyen de ne rien trouver.
Autre chose : les statistiques enregistrées étaient peu fiables (temps opératoires mesurés différemment suivant les cas, erreurs de saisie, impossibilité de coder correctement les opérations doubles, ...) ce qui limite fortement les analyses ultérieures.

Bon travail, lyonnais du 26 !

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Anova sous R Empty Re: Anova sous R

Message par lyonnaisdu26 Jeu 14 Avr 2011 - 13:04

Des hypothèses de travail j'en ai pas vraiment enfaite ...

L'objectif de l'étude est justement d'essayer de voir si ces durees moyennes de temps d'opération (qui varie beaucoup d'un chirurgiens à l autre pour une même intervention) sont correct. Il faut donc que je fasse une analyse pour le déterminer.
Les données dont je dispose sont présentes dans une table et en aucun cas elles n'ont été faite pour réaliser ce type d'analyse et c'est bien là où ça coince.

gg, tu as raison il y a certaines interventions qui varie énormément d'un cas à l'autre. Je prend un exemple que j'ai sous les yeux, pour le même chirurgiens et la même intervention, j'ai une durée moyenne de 1h01 et 2h15 pour la deuxième. Et pour cette même opération mais avec un autre chirurgiens, j'en trouve 1 à 52 min... Je pense qu'il y a en a même qui sont pire que cet exemple (j'ai pas cherché, il était sous mes yeux ^^).

Donc voilà, on m'a posé une bonne colle et je vois pas le bout du tunnel ^^

lyonnaisdu26

Nombre de messages : 10
Date d'inscription : 14/04/2011

Revenir en haut Aller en bas

Anova sous R Empty Re: Anova sous R

Message par Nik Jeu 14 Avr 2011 - 13:13

'objectif de l'étude est justement d'essayer de voir si ces durees moyennes de temps d'opération (qui varie beaucoup d'un chirurgiens à l autre pour une même intervention) sont correct

Correcte pas rapport à quoi ???
Tu as des moyennes théoriques et tu cherches à voir si tes données les confirme ?

C'est pas clair encore

Des hypothèses de travail j'en ai pas vraiment enfaite ...
tu en as mais tu ne le sais pas encore Very Happy

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

Anova sous R Empty Re: Anova sous R

Message par lyonnaisdu26 Jeu 14 Avr 2011 - 13:39

Bon je viens de reparler un petit peu avec mon maitre de stage, ce qu'il veut c'est un résultat c'est tout rien de vraiment précis lol.

Je dispose des duree moyenne et egalement des durees réels de l'opétion. Puis-je vérifier que mes durees moyennes sont en adéquation avec mes durees d'opération ?

lyonnaisdu26

Nombre de messages : 10
Date d'inscription : 14/04/2011

Revenir en haut Aller en bas

Anova sous R Empty Re: Anova sous R

Message par gg Jeu 14 Avr 2011 - 13:50

Je ne comprends pas bien ce que tu appelles "durée moyenne" :
"pour le même chirurgiens et la même intervention, j'ai une durée moyenne de 1h01 et 2h15 pour la deuxième" ??? la deuxième quoi ?. Et la durée moyenne n'est pas calculée avec la durée réelle ?

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Anova sous R Empty Re: Anova sous R

Message par Nik Jeu 14 Avr 2011 - 13:55

lyonnaisdu26 a écrit:Bon je viens de reparler un petit peu avec mon maitre de stage, ce qu'il veut c'est un résultat c'est tout rien de vraiment précis lol.
mouais...on sent le maitre se stage impliqué...

Je dispose des duree moyenne et egalement des durees réels de l'opétion. Puis-je vérifier que mes durees moyennes sont en adéquation avec mes durees d'opération ?
C'est pas du tout la même question que celle traitée par ANOVA. Dis moi si je traduis bien : en gros tu as déjà les prédictions d'un modèle et tu cherches à savoir si ton modèle correspond bien aux observations. Mais bon la démarche est plutôt tordue...

nik


Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

Anova sous R Empty Re: Anova sous R

Message par lyonnaisdu26 Jeu 14 Avr 2011 - 14:00

Les durée moyennes sont recalculés chaque jour à partir des durees d'opération.

lyonnaisdu26

Nombre de messages : 10
Date d'inscription : 14/04/2011

Revenir en haut Aller en bas

Anova sous R Empty Re: Anova sous R

Message par lyonnaisdu26 Jeu 14 Avr 2011 - 14:07

nik, je pense que c'est ça en gros qu'il voudrait avoir. Savoir si leur façon de calculer les durées moyennes est correct

lyonnaisdu26

Nombre de messages : 10
Date d'inscription : 14/04/2011

Revenir en haut Aller en bas

Anova sous R Empty Re: Anova sous R

Message par gg Jeu 14 Avr 2011 - 14:37

Houla !

ça devient de moins en moins clair !

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Anova sous R Empty Re: Anova sous R

Message par Nik Jeu 14 Avr 2011 - 20:22

gg a écrit:Houla !

ça devient de moins en moins clair !
oui c'est pas faux...

Il va falloir que ton maitre de stage soit plus clair dans ses attentes car là c'est un grand flou. D'où proviennent les moyennes "théoriques" à comparer avec les moyennes empiriques ?
Comment sont elles calculées ?

...et question subsidiaire, à quoi cela amène ???

nik

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

Anova sous R Empty Re: Anova sous R

Message par lyonnaisdu26 Ven 15 Avr 2011 - 7:15

Bon faut vraiment que je rediscute avec lui, parce que j'avoue que plus j'avance et moins c'est clair pour moi aussi...

Je vous remet un message dès que c'est clair...

lyonnaisdu26

Nombre de messages : 10
Date d'inscription : 14/04/2011

Revenir en haut Aller en bas

Anova sous R Empty Re: Anova sous R

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum