Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

-45%
Le deal à ne pas rater :
WHIRLPOOL OWFC3C26X – Lave-vaisselle pose libre 14 couverts – ...
339 € 622 €
Voir le deal

Signification d'une ANOVA

2 participants

Aller en bas

Signification d'une ANOVA Empty Signification d'une ANOVA

Message par buliwyf Lun 9 Aoû 2010 - 16:53

Bonjour à tous !
J'exploite une base de donnée dans le cadre de ma thèse de médecine. J'utilise R. J'ai acheté un bouquin pas mal mais je manque de bases et surtout de temps (je bosse à plein temps, la thèse se fait le soir et le WE). En bref je suis largué et j'apprécierai beaucoup un peu d'aide...

J'ai une centaines de variables concernant des patients ayant tous fait un infactus du myocarde (la plupart sont logiques : vrai / faux, quelques unes qualitatives et d'autres quantitatives).
Je m'intéresse à la catégorie socio professionnelle (codée de 1 à 6).

La catégorie 2 (ouvriers) a une mortalité à J30 significativement plus élevée que les autres.
Les ouvriers présentent pourtant moins de facteurs de risque (fréquence plus faible de diabétiques et d'hypertendus par exemple) mais ils sont en moyenne plus jeunes que mes autres catégories / autrement dit ils font- leur infarctus plus jeune.

Prenons un exemple.
Pour dire si la différence de fréquence de l'hypertension (VRAI ou FAUX) des ouvriers versus les autres est significative indépendament de l'âge, j'ai calculé une ANOVA avec R. J'obtiens :

Code:
[b]anova(lm(etude$HTA ~ etude$profession * etude$age))[/b]


Analysis of Variance Table

Response: etude$HTA
                            Df Sum Sq Mean Sq F value    Pr(>F)   
etude$profession              5  6.46  1.2915  5.8638 2.216e-05 ***
etude$age                    1  12.55 12.5544 57.0004 6.988e-14 ***
etude$profession:etude$age    5  0.46  0.0922  0.4188    0.836   
Residuals                  1742 383.68  0.2203                     
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Puis-je en déduire que :
- l'hypertension est corrélée à l'âge indépendamment de la profession
- elle est aussi corrélée à la profession indépendamment de l'âge ; donc que dans mon exemple les ouvriers qui ont fait leur infarctus sont moins hypertendus, même si je sais que ces ouvriers sont moins âgés en moyenne et que l'âge est un facteur de risque de l'hypertension ?

Enfin l'ANOVA est-elle un bon moyen d'obtenir ce que je veux ?

Merci d'avance,

Cordialement

OG

buliwyf

Nombre de messages : 18
Date d'inscription : 09/08/2010

Revenir en haut Aller en bas

Signification d'une ANOVA Empty Re: Signification d'une ANOVA

Message par droopy Mar 10 Aoû 2010 - 6:39

bonjour,

première remarque tu peux simplifier la synthaxe de ton code : anova(lm(HTA ~ profession * age, data =etude))
la non significativité de l'interaction te dit que la pente de la relation entre HTA et age est identique entre les professions.
Attention au terme que tu emploies. Ici tu fais une ANCOVA, alors tu ne cherches pas à connaître les corrélations entre tes variables mais si l'age et la profession ont un effet sur HTA. Le niveau d'hypertension dépend bien de l'âge et de la profession. Le fait que la profession est un effet additif sur HTA signifie que pour un age donné certaine profession auront un niveau de HTA plus fort et d'autre moins fort. La différence de HTA ente les professions sera constant quelque soit l'age. Ici tu auras des droites parallèles entre HTA et l'age.

Donc tu peux bien dire que les effets de l'age et de la profession sont indépendant.

Par contre ta régression ici n'explique qu'une toute petite partie de la variance de HTA (<5%). Donc il faut quand même faire attention aux conclusions.

De plus je ne vois pas trop comment se présente ta variable HTA ? Tu dis que c'est une fréquence de l'hypertension et après tu mets que c'est une variable booléenne alors je ne vois pas trop comment elle est exprimée. Si c'est une variable en 0 ou 1, VRAI FAUX alors la régression logistique serait plus adaptée à priori.
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Signification d'une ANOVA Empty Re: Signification d'une ANOVA

Message par buliwyf Mar 10 Aoû 2010 - 7:29

Merci pour cette réponse rapide et intéressante.

Effectivement la variable HTA est booléenne : je compare des fréquences de positivité entre les différentes catégories socio-professionnelles.

En fait je voudrais faire deux choses avec ma centaine de variables :
1/ Trouver celles qui peuvent expliquer la différence de mortalité à J30 (=variable booléenne) entre les 6 catégories socio-prof

2/ Et surtout : établir un profil particulier de valeurs de certaines variables (sets de paramètres préférentiels pour chaque CSP).

Désolé je ne connais pas le vocabulaire adapté mais en gros tous mes patients ont fait un infarctus puisqu'ils apparaissent dans ce registre, mais peut-être pas pour les mêmes raisons.
Je voudrais savoir quelles places ont, par exemple, le surpoids, le tabagisme, l'hérédite, la consommation médicale (etc.) dans chaque catégorie socio prof.
Je voudrais presque pouvoir prédire la CSP d'un patient donné rien qu'avec son profil de variables.

C'est possible ça ?
(j'ai environ 70 variables booléennes, une dizaine de numériques comme l'âge, et 3-4 variables qualitatives à plusieurs niveaux (facteurs))

Pour le premier point je pensais pouvoir faire une "grosse AN(C?)OVA" à plusieurs paramètres.

Je vais étudier cette question de régression logistique.

Merci !

buliwyf

Nombre de messages : 18
Date d'inscription : 09/08/2010

Revenir en haut Aller en bas

Signification d'une ANOVA Empty Re: Signification d'une ANOVA

Message par droopy Mar 10 Aoû 2010 - 8:29

concrètement tu la calcules comment ta variable hta ? une regression linéaire n'est à priori pas faite pour des variables expliquées booléennes.

question 2 : tu veux prédire la catégorie sociopro en fonction de tes variables ? dans ce cas la regarde du côté de l'analyse discriminante. Si tu veux voir le lien entre les variables sur-poids tabagisme and co et ou se situe tes CSP il faut peut-être jeter un œil du côté des analyses exploratoires comme les analyses multivariées.
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Signification d'une ANOVA Empty Re: Signification d'une ANOVA

Message par buliwyf Mar 10 Aoû 2010 - 8:45

Je ne suis pas sûr de comprendre la question. Je ne calcule pas cette variable HTA, ça fait partie de mes données.
Je pars d'un grand tableau :

Id Sexe Âge HTA ...
1 Masculin 51 TRUE ...

Le principe de la régression logistique a l'air de convenir. Je suis en train de me documenter.

J'avoue que je cherche la facilité : une fonction R utilisable sans se plonger dans des conditions d'applicabilité trop compliquées. Après je ferai vérifier ce que je fais par quelqu'un à la fac.

buliwyf

Nombre de messages : 18
Date d'inscription : 09/08/2010

Revenir en haut Aller en bas

Signification d'une ANOVA Empty Re: Signification d'une ANOVA

Message par droopy Mar 10 Aoû 2010 - 9:08

si HTA est booléenne alors la régression classique n'a pas de sens.

'avoue que je cherche la facilité : une fonction R utilisable sans se
plonger dans des conditions d'applicabilité trop compliquées
Oublie tu ne trouveras pas. Les statistiques ce n'est pas comme démarrer une voiture, tu ne tournes pas la clé et la voiture démarre sans pour autant savoir pourquoi et comment elle démarre. Si tu veux comprendre ce que tu fais et si tu ne veux pas mal interpréter les sorties de tes analyses alors il faut mettre les mains dans le camboui si je puis dire.
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Signification d'une ANOVA Empty Re: Signification d'une ANOVA

Message par buliwyf Mar 10 Aoû 2010 - 9:21

C'est dommage. Les statistiques sont comme la voiture un outil formidable. Je comprends bien sûr que la mauvaise utilisation de tel ou tel test conduise à des résultats erronés.
Mais, en médecine en tout cas, je pense qu'une utilisation "de base" pourrait être automatisable. A près tout je ne suis pas le premier à vouloir expliquer une variable booléenne Y par des variables X1-n, qui sont pour la plupart inter-dépendantes entre elles.
Il est clair que je n'ai pas le bagage mathématique pour comprendre quoi que ce soit du fonctionnement de ces tests.

Bon enfin merci pour ton aide, je vais continuer à creuser la question !

buliwyf

Nombre de messages : 18
Date d'inscription : 09/08/2010

Revenir en haut Aller en bas

Signification d'une ANOVA Empty Re: Signification d'une ANOVA

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum