Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Regression multiple => équivalent non paramétrique?
2 participants
Page 1 sur 1
Regression multiple => équivalent non paramétrique?
Bonjour,
dans le cadre de mon mémoire, je dois réaliser une régression multiple (explication d'une variable dépendante métrique par 5 variables prédictives métriques).
J'aimerais simplement savoir si je peux utiliser les tests du modèle linéaire général bien que mes données ne sont pas normales (je suppose que oui, mais j'aimerais en être sûr)? Ou s'il existe des tests équivalents non paramètriques? Dans ce cas, quels sont-ils?
Merci beaucoup.
dans le cadre de mon mémoire, je dois réaliser une régression multiple (explication d'une variable dépendante métrique par 5 variables prédictives métriques).
J'aimerais simplement savoir si je peux utiliser les tests du modèle linéaire général bien que mes données ne sont pas normales (je suppose que oui, mais j'aimerais en être sûr)? Ou s'il existe des tests équivalents non paramètriques? Dans ce cas, quels sont-ils?
Merci beaucoup.
A Berlemont- Nombre de messages : 4
Date d'inscription : 14/07/2008
Re: Regression multiple => équivalent non paramétrique?
Est-ce que ta distribution s'éloigne beaucoup de la normalité (forte asymétrie dans ta distribution) ? Et surtout est-ce que les résidus de ta régression multiple sont normaux ? Sinon du moment que tu estimes une régression multiple tu ne peux pas faire des tests non paramétriques sur un modèle linéaire que ce soit pour les paramètres, etc.
micros
micros
Invité- Invité
Re: Regression multiple => équivalent non paramétrique?
merci beaucoup pour ta réponse!
Ben je crois que c'est bon...
Mais les résultats que j'obtiens me semblent très peu puissant. Sur la majorité des régressions que j'ai effectuées, la valeur de mon R² est < 0.10 mais le p<0.05.
Existe t'il une norme qui permette de dire que le modèle est relativement puissant? (par exemple: si R² < 0.7 => le modèle n'est pas bon...)
Lorsque par exemple, j'obtiens une valeur de R²= 0.05 et p<0.05. la conclusion que je formule est donc la suivante: "Avec une certitude de plus de 95%, nos prédicteurs expliquent 5% de la variance de la variable dépendante"?
Enfin, une dernière question: si j' ai 2 prédicteurs, par exemple: A et B. Comment savoir lequel des deux a l'effet le plus puissant?
C'est bien la valeur des Sommes de carrés, du F et du p associés qu'il faut prendre en compte?
Merci beaucoup pour vos réponses et commentaires qui me seront d'une grande aide.
Ben je crois que c'est bon...
Mais les résultats que j'obtiens me semblent très peu puissant. Sur la majorité des régressions que j'ai effectuées, la valeur de mon R² est < 0.10 mais le p<0.05.
Existe t'il une norme qui permette de dire que le modèle est relativement puissant? (par exemple: si R² < 0.7 => le modèle n'est pas bon...)
Lorsque par exemple, j'obtiens une valeur de R²= 0.05 et p<0.05. la conclusion que je formule est donc la suivante: "Avec une certitude de plus de 95%, nos prédicteurs expliquent 5% de la variance de la variable dépendante"?
Enfin, une dernière question: si j' ai 2 prédicteurs, par exemple: A et B. Comment savoir lequel des deux a l'effet le plus puissant?
C'est bien la valeur des Sommes de carrés, du F et du p associés qu'il faut prendre en compte?
Merci beaucoup pour vos réponses et commentaires qui me seront d'une grande aide.
A Berlemont- Nombre de messages : 4
Date d'inscription : 14/07/2008
Re: Regression multiple => équivalent non paramétrique?
A ma connaissance il n'y a pas de normes, suivant les disciplines les avis sur ce qu'est un fort R² doivent pas mal variés. Avec un R² de 5% tu expliques bien que 5% de la variabilité. Et le R² est significatif ce qui veut dire qu'il est différent de 0, pas qu'il explique 5% de la variabilité. Les 5% viennent de sa propre valeur. Un R² peut être de 0.4 donc ton modèle explique 40% de la variabilité de la variable dépendante, mais le R² peut être non significatif.
Si A et B sont indépendants (corrélation de 0 entre les 2) alors celui qui est le plus "puissant" (dans le sens qui explique le plus de variabilité) c'est bien entendu celui avec lequel tu obtiens le plus fort R², avec un bémol quand même si les deux variables n'ont pas les mêmes degrés de libertés associés.
Si A et B ne sont pas indépendant alors il faut regarder du côté du partitionnement de variance. J'ai déjà posté des liens la dessus vers des pdfs qui expliquent comment calculer tout ça.
C'est bien du côté des sommes des carrés qu'il faut regarder.
Si A et B sont indépendants (corrélation de 0 entre les 2) alors celui qui est le plus "puissant" (dans le sens qui explique le plus de variabilité) c'est bien entendu celui avec lequel tu obtiens le plus fort R², avec un bémol quand même si les deux variables n'ont pas les mêmes degrés de libertés associés.
Si A et B ne sont pas indépendant alors il faut regarder du côté du partitionnement de variance. J'ai déjà posté des liens la dessus vers des pdfs qui expliquent comment calculer tout ça.
C'est bien du côté des sommes des carrés qu'il faut regarder.
Invité- Invité
Re: Regression multiple => équivalent non paramétrique?
Combien as tu d'observations?
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Re: Regression multiple => équivalent non paramétrique?
Merci pour vos réponses, en fait j'avais 5007 observations (ce qui expliquait en soit la valeur très basse du R²)... Mais en réarangeant mes données ( 29 observations moyennes), j'obtiens une valeur de R² > 0.70; p<0.05...
Je pense que mes modèles sont relativement valides.. Mais il me reste une question : à quoi correspondent les valeurs de corrélation proposé par statistica (statsoft) - matrice de corrélations des vecteurs- ? Lorsque je me penche sur celle liant ma variable indépendante aux prédicteurs, la valeur est bien souvent différente de celle réellement observée dans mon échantillon.
Serait-ce la corrélation des données théoriques proposées par le modèle?
Je pense que mes modèles sont relativement valides.. Mais il me reste une question : à quoi correspondent les valeurs de corrélation proposé par statistica (statsoft) - matrice de corrélations des vecteurs- ? Lorsque je me penche sur celle liant ma variable indépendante aux prédicteurs, la valeur est bien souvent différente de celle réellement observée dans mon échantillon.
Serait-ce la corrélation des données théoriques proposées par le modèle?
A Berlemont- Nombre de messages : 4
Date d'inscription : 14/07/2008
Re: Regression multiple => équivalent non paramétrique?
Autre petite question: si deux variables sont
significativement liées, mais non corrélées. Comment savoir quel est le lien
qui les unit?
Par exemple, j'aimerais prouver que la taille d'un groupe est liée à la
fréquence d'interactions sociales qu'on y observe. Dans ce cas, lorsque la
taille du groupe est moyenne, les fréquences d'interactions sont les plus
élevées. Ainsi lorsque la taille du groupe s'écarte de cette moyenne ( + ou -
), les fréquences deviennent moins élevées... C'est bien ce que j'observe sur
mon graph en traçant une courbe polynomiale (y = -0,0177x2 + 0,1369x - 0,0645).
Il semble que ces deux variables soient significativement corrélées: (r = -0,28
; p<0,05). Plus le groupe est grand, moins les individus interagissent. Je
ne veux pas me contenter de cette simple corrélation, qui serait restrictive.
Est-il possible de connaitre la valeur de la probabilité de dépassement de la
courbe polynomiale (au même titre que celle de la corrélation)?
significativement liées, mais non corrélées. Comment savoir quel est le lien
qui les unit?
Par exemple, j'aimerais prouver que la taille d'un groupe est liée à la
fréquence d'interactions sociales qu'on y observe. Dans ce cas, lorsque la
taille du groupe est moyenne, les fréquences d'interactions sont les plus
élevées. Ainsi lorsque la taille du groupe s'écarte de cette moyenne ( + ou -
), les fréquences deviennent moins élevées... C'est bien ce que j'observe sur
mon graph en traçant une courbe polynomiale (y = -0,0177x2 + 0,1369x - 0,0645).
Il semble que ces deux variables soient significativement corrélées: (r = -0,28
; p<0,05). Plus le groupe est grand, moins les individus interagissent. Je
ne veux pas me contenter de cette simple corrélation, qui serait restrictive.
Est-il possible de connaitre la valeur de la probabilité de dépassement de la
courbe polynomiale (au même titre que celle de la corrélation)?
A Berlemont- Nombre de messages : 4
Date d'inscription : 14/07/2008
Sujets similaires
» équivalent non paramétrique de la régression linéaire?
» Equivalent de l'ANOVA nested en test non paramétrique ?
» Recherche équivalent Anova 2 facteurs non paramétrique
» régression multiple et régression logistique
» Anova non-paramétrique ou régression ?
» Equivalent de l'ANOVA nested en test non paramétrique ?
» Recherche équivalent Anova 2 facteurs non paramétrique
» régression multiple et régression logistique
» Anova non-paramétrique ou régression ?
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum