Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

Le deal à ne pas rater :
(CDAV) Foire aux vins : -20% dès 99€ d’achat
Voir le deal

anova VS régression avec variables dichotomiques

2 participants

Aller en bas

anova VS régression avec variables dichotomiques Empty anova VS régression avec variables dichotomiques

Message par flipo Jeu 17 Juil 2008 - 14:28

Bonjour tout le monde;
Je dois réaliser une modélisation d'une variables quantitative grâce à des variables quali et quanti.
Pour l'instant j'ai choisi de le faire avec une méthode ANOVA, j'ai donc découpé toutes mes variables quanti en classes pour n'obtenir que des variables quali.

Cependant maintenant je me demande s'il n'aurait pas mieux fallu, au contraire, garder mes variables quanti telles qu'elles, et dichotomiser mes variables quali pour n'obtenir que des variables quanti et donc faire une régression au final. (sachant que le fait de garder mes variables quanti telles qu'elles m'expose au fait de n'avoir que des effets linéaires, mais ce n'est pas un pb ici).

qu'en pensez vous?

flipo

Nombre de messages : 36
Date d'inscription : 13/06/2008

Revenir en haut Aller en bas

anova VS régression avec variables dichotomiques Empty Re: anova VS régression avec variables dichotomiques

Message par FS Jeu 17 Juil 2008 - 15:00

Pour ma part je pense que tout dépend de ton objectif.

Est-ce que comparer des moyennes te suffit pour ton étude ?

Tu veux aller plus loin, par exemple faire un modèle prédictif, vérifier si tes variables quanti ont une relation plutôt linéaire ou exponentielle -> régression

FS

Nombre de messages : 163
Date d'inscription : 25/04/2008

Revenir en haut Aller en bas

anova VS régression avec variables dichotomiques Empty Re: anova VS régression avec variables dichotomiques

Message par flipo Jeu 17 Juil 2008 - 15:19

mon étude est dans une optique 100% prédictive...en quoi cela pose problème pour l'anova?

flipo

Nombre de messages : 36
Date d'inscription : 13/06/2008

Revenir en haut Aller en bas

anova VS régression avec variables dichotomiques Empty Re: anova VS régression avec variables dichotomiques

Message par FS Jeu 17 Juil 2008 - 15:48

l'anova est très bien pour comparer des moyennes et chercher des interactions.
Mais pour faire de la prédiction tu sera limité, car l'anova ne prend pas en compte la valeur de tes groupes.
A moins de découper tes variables quanti en un max de groupe, ce qui à mon avis est ingérable.

La régression est bien plus adapté pour faire de la prédiction, ce sera bien plus précis et plus pratique pour étudier la forme de la relation.

combien tu as de var quanti/quali ?

FS

Nombre de messages : 163
Date d'inscription : 25/04/2008

Revenir en haut Aller en bas

anova VS régression avec variables dichotomiques Empty Re: anova VS régression avec variables dichotomiques

Message par flipo Jeu 17 Juil 2008 - 15:54

quand tu dis "l'anova ne prend pas en compte la valeur de tes groupes", tu veux dire que ça ne peut pas me permettre de prévoir les valeurs ensuite?
quand j'obtiens la valeur de mes "régresseurs" sur sas, il me met un message:

Terms are not uniquely estimable.

le pb vient de ce dont tu parles?

à priori j'ai une douzaine de variables quanti et quelques pauvres quali...sachant que les quanti ont plus d'impact à priori...

flipo

Nombre de messages : 36
Date d'inscription : 13/06/2008

Revenir en haut Aller en bas

anova VS régression avec variables dichotomiques Empty Re: anova VS régression avec variables dichotomiques

Message par Invité Ven 18 Juil 2008 - 8:50

Quand tu découpes une variable qualitative en une variable quantitatuve tu perd de l'information. Dans un but prédictif il est a mon avis beaucoup plus intéressant de garder tes variables qualitatives telles quelles.
Un exemple tu cherches a prédire Y par X. Si tu découpes X en 4 classes les prédictions que tu obtiendras seront les moyennes par classes. A un individu de la première classe tu prédiras la moyenne de la première classe. Alors que si ta relation est linéaire, ta prédiction sera bien meilleur car pour chaque individu tu vas calculé une valeur qui dépend de son X.

Après je ne vois pas ce qui te gène à mélanger les deux types de variables ? Si tu as des quanti et des quali pour expliquer ta variable Y et bah gardes les tel quelles !!!! C'est encore la meilleur chose à faire.

micros.

Invité
Invité


Revenir en haut Aller en bas

anova VS régression avec variables dichotomiques Empty Re: anova VS régression avec variables dichotomiques

Message par flipo Ven 18 Juil 2008 - 9:34

euh ya eut un petit cafouillage quali/quanti au début de ta réponse non...?

sinon garder mes variables telles qu'ellles, qu'elles soient quali ou quanti c'est ce que je comptais faire initiallement mais il faut (d'apres ce que j'ai compris) faire appel à la méthode ANCOVA que je ne maitrise pas du tout.

flipo

Nombre de messages : 36
Date d'inscription : 13/06/2008

Revenir en haut Aller en bas

anova VS régression avec variables dichotomiques Empty Re: anova VS régression avec variables dichotomiques

Message par Invité Ven 18 Juil 2008 - 9:43

Effectivement excuse pour la confusion.

Quand tu pratiques une ANCOVA tu es dans de l'inférentiel. Vu que ta démarche est prédictive tu te fous de ce genre de trucs. Ce que tu vas chercher à avoir c'est un modèle qui prédise le mieux tes données et non pas savoir qui de la variable quanti ou quali explique le plus de variabilité, est-ce que les pentes sont égales ? est-ce que les ordonnées à l'origine sont égales ?, etc. Tu n'es plus dans la même démarche. Ce que tu cherches à faire est une régression linéaire multiple qui prédise le mieux tes données. Il y a aussi une chose à laquelle tu dois faire attention quand tu as un modèle qui collent très bien à tes données, il se peut qu'il ne soit pas très bon pour prédire des données indépendantes. Tout le truc est de trouver un modèle qui prédise pas trop mal tes données mais qui soit aussi capable de prédire correctement des données indépendantes. A vouloir trop diminuer l'erreur qu'on fait sur le jeu de données qui sert à calibrer le modèle on perd en précision pour prédire des données indépendantes.

en gros bon courage !

micros

Invité
Invité


Revenir en haut Aller en bas

anova VS régression avec variables dichotomiques Empty Re: anova VS régression avec variables dichotomiques

Message par flipo Ven 18 Juil 2008 - 9:56

je ne vois pas trop ce que tu entends par données indépendantes ?

flipo

Nombre de messages : 36
Date d'inscription : 13/06/2008

Revenir en haut Aller en bas

anova VS régression avec variables dichotomiques Empty Re: anova VS régression avec variables dichotomiques

Message par FS Ven 18 Juil 2008 - 10:31

Je pense que ce sont les données que tu aura à prédire par la suite, donc celles qui ne servent pas à construire ton modèle.

Bon courage également.

Et n'oublie qu'il faut tu sois bien clair sur tes objectifs, description ou prédiction.

Pour moi le plus gros problème c'est que j'ai souvent du mal à savoir ce que mon boss veut exactement...

FS

Nombre de messages : 163
Date d'inscription : 25/04/2008

Revenir en haut Aller en bas

anova VS régression avec variables dichotomiques Empty Re: anova VS régression avec variables dichotomiques

Message par Invité Ven 18 Juil 2008 - 10:46

Les données indépendantes sont effectivement les données que tu auras à prédire par la suite.

micros

Invité
Invité


Revenir en haut Aller en bas

anova VS régression avec variables dichotomiques Empty Re: anova VS régression avec variables dichotomiques

Message par flipo Ven 18 Juil 2008 - 12:23

ah okay!
les joies de la stat, à chaque fois il y a plein de termes qui désignent la même chose...
oui bien entendu je ne teste pas mon modèle sur la population de construction.

merci à vous deux pour votre aide! je pense que je risque d'etre souvent sur le forum les semaines à venir car après quelques temps à mettre en place mes données l'heure de la modélisation a sonné...

à plus tard.

flipo

Nombre de messages : 36
Date d'inscription : 13/06/2008

Revenir en haut Aller en bas

anova VS régression avec variables dichotomiques Empty Re: anova VS régression avec variables dichotomiques

Message par flipo Lun 28 Juil 2008 - 13:11

après quelques jours à ramer sur ma modélisation je reviens sur ces propos:

micros corpus a écrit:Après je ne vois pas ce qui te gène à mélanger les deux types de variables ? Si tu as des quanti et des quali pour expliquer ta variable Y et bah gardes les tel quelles !!!! C'est encore la meilleur chose à faire

à quelle méthode tu penses exactement?
je veux dire, pour modéliser une variable quanti par des variables quanti on effectue une régression linéaire, pour modéliser une variable quali par des variables quanti ou quali ou fait une régression logistique, mais pour modéliser une variable quanti par des variables quanti ou quali...j'avais lu initiallement que c'était de l'ancova, mais là je seche...

flipo

Nombre de messages : 36
Date d'inscription : 13/06/2008

Revenir en haut Aller en bas

anova VS régression avec variables dichotomiques Empty Re: anova VS régression avec variables dichotomiques

Message par Invité Lun 28 Juil 2008 - 14:22

flipo a écrit:Bonjour tout le monde;
Je dois réaliser une modélisation d'une variables quantitative grâce à des variables quali et quanti.

Je ne parlais que dans le cas d'une variable quantitative a modéliser avec un mélange de variable quanti et quali uniquement. Après pour modéliser des variables quali, il existe des vagons de modèles différents selon que la variable est ordinale ou pas ... et la c'est un autre domaine.

micros

Invité
Invité


Revenir en haut Aller en bas

anova VS régression avec variables dichotomiques Empty Re: anova VS régression avec variables dichotomiques

Message par flipo Lun 28 Juil 2008 - 15:11

on s'y perd un peu avec ces quali/quanti Smile

je reformule:
je veux modéliser une variable continue par des variables continues et catégorielles, si j'ai bien compris tu dis que cela se fait simplement:

"Si tu as des quanti et des quali pour expliquer ta variable Y et bah gardes les tel quelles"

mais concretement je ne vois pas comment faire autrement que par ancova.

flipo

Nombre de messages : 36
Date d'inscription : 13/06/2008

Revenir en haut Aller en bas

anova VS régression avec variables dichotomiques Empty Re: anova VS régression avec variables dichotomiques

Message par Invité Lun 28 Juil 2008 - 15:41

Je vais tacher d'être plus claire.

Tu cherches a modéliser une variable Y continue avec des variables Xi qui peuvent être soient continues soient catégorielles. Ok ?

Si ton objectif est purement prédictif, tu passes par un modèle linéaire du type : Y ~ alpha + somme(betai*Xi). Alors tu te fous de savoir quel est la nature des Xi !!!!!!!! Tu peux très bien mélanger des Xi continues et des Xi catégorielles.

L'ancova est un cas particulier ou tu as une Xi continue et une Xi catégorielle. Mais l'ancova est une méthode inférentielle ! Ici l'objectif est de savoir si tu as des pentes différentes, ou des ordonnées à l'origine différente ou les deux ou seulement des ordonnées à l'origine différente. L'ancova est aussi un modèle linéaire qui peut s'écrire de la manière suivante : Y ~ alpha + somme(betai*Xi).

Quand tu es dans un objectif prédictif tu t'en moques un peu de tout ça. Tu fais une régression multiple de Y sur les deux types de variables.

micros

Invité
Invité


Revenir en haut Aller en bas

anova VS régression avec variables dichotomiques Empty Re: anova VS régression avec variables dichotomiques

Message par flipo Mar 29 Juil 2008 - 8:04

ok...

du coup concretement, si par exemple une variable catégorielle est le sexe, comment cela se traduit dans la formule
Y~f (Ki) ?

il faut dichotomiser la variable pour avoir
Y ~ β1 * indicatrice[femme] + β2 * indicatrice[homme] + ...
??

flipo

Nombre de messages : 36
Date d'inscription : 13/06/2008

Revenir en haut Aller en bas

anova VS régression avec variables dichotomiques Empty Re: anova VS régression avec variables dichotomiques

Message par Invité Mar 29 Juil 2008 - 9:11

en pratique dans un logiciel de statistique comme R le passage en indicatrice se fait automatiquement. Par défaut le modèle ne sera pas exactement sous la même forme que toi mais pour ce qui est des tests cela reviendra au même.

Modèle avec R :
Y ~ a + b[homme]

Si l'individu i est une femme alors le modèle est Y ~ a
Si l'individu i est un homme alors le modèle est Y ~ a + b

Ici le b représente la différence entre les hommes et les femmes.

Au final les coefficients que tu calculeras pour les hommes et pour les femmes reviendra exactement à la même chose que ce que tu as écrit.

micros

Invité
Invité


Revenir en haut Aller en bas

anova VS régression avec variables dichotomiques Empty Re: anova VS régression avec variables dichotomiques

Message par flipo Mar 29 Juil 2008 - 9:51

exact j'avais zappé la modalité de référence, j'ai réalisé après en tapant mon code.

je viens de me galérer à créer mes variables dichotomiques une par une sous sas, je pouvais surement y échapper en fait...

merci pour ton aide et tes conseils micro, ça fait au chaud au coeur un peu d'humanité dans le monde austère des stats Smile

flipo

Nombre de messages : 36
Date d'inscription : 13/06/2008

Revenir en haut Aller en bas

anova VS régression avec variables dichotomiques Empty Re: anova VS régression avec variables dichotomiques

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum