Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Regression et colinéarité
3 participants
Page 1 sur 1
Regression et colinéarité
Coucou le forum,
Je vous explique ce qui me chagrine : je souhaite savoir s'il existe un effet lot de production sur un paramètre (variable continue) du produit final. Pour cela, mon modèle est du type :
Y = N°_Lot + Site_de_production + quelques autres variables (continues).
Mais je soupçonne de la colinéarité entre le lot de production et le site de production, notamment car certains lots ne sont utilisés que sur un site en particulier. Je souhaite donc distinguer ! J'imagine qu'il faut regarder du côté des modèles (je ne connais pas le nom exact) où serait introduite la variable "Lot*Site" ? Si oui, faut-il "binariser" mes variables en 0/1 ?
Pour l'instant, et mis à part mes résultats de statistiques descriptives, mes premiers résultats donnent :
- les médianes de ma variable à expliquer sont statistiquement différentes entre mes lots (test de Kruskal-Wallis car données non normales à l'intérieur de chaque lot + variances hétérogènes par test de Levene).
- ANOVA difficilement justifiées car variances hétérogènes et effectifs déséquilibrés, mais sinon les résultats ne montrent pas d'effet lot (donc différent de ce que me dit Kruskal-Wallis...)
- une simple régression linéaire montre un effet site.
Je travaille avec R.
Est-ce que vous pensez que je suis dans le vrai pour l'instant ? Pouvez-vous me "guider" pour la suite? J'espère avoir été assez clair
Merci !
Alexis
Je vous explique ce qui me chagrine : je souhaite savoir s'il existe un effet lot de production sur un paramètre (variable continue) du produit final. Pour cela, mon modèle est du type :
Y = N°_Lot + Site_de_production + quelques autres variables (continues).
Mais je soupçonne de la colinéarité entre le lot de production et le site de production, notamment car certains lots ne sont utilisés que sur un site en particulier. Je souhaite donc distinguer ! J'imagine qu'il faut regarder du côté des modèles (je ne connais pas le nom exact) où serait introduite la variable "Lot*Site" ? Si oui, faut-il "binariser" mes variables en 0/1 ?
Pour l'instant, et mis à part mes résultats de statistiques descriptives, mes premiers résultats donnent :
- les médianes de ma variable à expliquer sont statistiquement différentes entre mes lots (test de Kruskal-Wallis car données non normales à l'intérieur de chaque lot + variances hétérogènes par test de Levene).
- ANOVA difficilement justifiées car variances hétérogènes et effectifs déséquilibrés, mais sinon les résultats ne montrent pas d'effet lot (donc différent de ce que me dit Kruskal-Wallis...)
- une simple régression linéaire montre un effet site.
Je travaille avec R.
Est-ce que vous pensez que je suis dans le vrai pour l'instant ? Pouvez-vous me "guider" pour la suite? J'espère avoir été assez clair
Merci !
Alexis
Alex83- Nombre de messages : 15
Date d'inscription : 09/01/2017
Re: Regression et colinéarité
Salut,
Je ne peux pas répondre à tes questions mais je constate que la question sur la transformation des variables est une question récurrente et qu'il serait peut être intéressant de faire un topic dessus.
Cordialement
Je ne peux pas répondre à tes questions mais je constate que la question sur la transformation des variables est une question récurrente et qu'il serait peut être intéressant de faire un topic dessus.
Cordialement
Coco- Nombre de messages : 57
Date d'inscription : 23/03/2017
Re: Regression et colinéarité
Bonjour,
Ce n'est pas tant un problème de colinéarité mais plutôt de plan incomplet (voire d'effet niché). il y a donc certaines interactions qui ne pourront être évaluées car tu n'as pas un design complètement croisé.
Nik
Ce n'est pas tant un problème de colinéarité mais plutôt de plan incomplet (voire d'effet niché). il y a donc certaines interactions qui ne pourront être évaluées car tu n'as pas un design complètement croisé.
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Regression et colinéarité
Bonjour,
Merci pour vos réponses, je vais regarder de ce côté-là. Effectivement, lorsque je lance la régression sur R, certains croisements ne peuvent être estimés. Je vais creuser un peu plus...
Si d'autres membres ont des précisions supplémentaires, je suis tout de même preneur
Merci encore,
Alexis
Merci pour vos réponses, je vais regarder de ce côté-là. Effectivement, lorsque je lance la régression sur R, certains croisements ne peuvent être estimés. Je vais creuser un peu plus...
Si d'autres membres ont des précisions supplémentaires, je suis tout de même preneur
Merci encore,
Alexis
Alex83- Nombre de messages : 15
Date d'inscription : 09/01/2017
Sujets similaires
» régression et colinéarité
» régression multiple et régression logistique
» Colinéarité de facteur en régression multiple
» Colinéarité variables qualitatives (pour régression logit)
» Regression
» régression multiple et régression logistique
» Colinéarité de facteur en régression multiple
» Colinéarité variables qualitatives (pour régression logit)
» Regression
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum