Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Coefficient de détermination et régression non linéaire
4 participants
Page 1 sur 1
Coefficient de détermination et régression non linéaire
Bonjour,
Dans un tableur j'ai entré une série d'une vingtaine de nombres produisant approximativement une exponentielle. Lorsque j'affiche le graphique avec courbe de tendance je constate que le coefficient de détermination de la régression exponentielle est supérieur à celui de la régression linéaire. En outre si je calcule une seconde série de valeurs y avec l'équation de la courbe de tendance exponentielle j'obtiens un coefficient de 1. Et et si dans cette série calculée je change la valeur d'un y puis d'un autre, je constate que la valeur du coefficient diminue chaque fois.
Tout cela semble logique, et j'en déduis que R carré peut être utilisé pour évaluer si un nuage de point est mieux approximé par une exponentielle que par une droite.
Pourtant la théorie nous dit que R carré ne concerne que des régressions linéaires ...
Quelqu'un peut-il expliquer en quoi, selon la théorie, l'interprétation que je fais ici de R carré est fausse, abusive ... ou correcte.
Merci.
Dans un tableur j'ai entré une série d'une vingtaine de nombres produisant approximativement une exponentielle. Lorsque j'affiche le graphique avec courbe de tendance je constate que le coefficient de détermination de la régression exponentielle est supérieur à celui de la régression linéaire. En outre si je calcule une seconde série de valeurs y avec l'équation de la courbe de tendance exponentielle j'obtiens un coefficient de 1. Et et si dans cette série calculée je change la valeur d'un y puis d'un autre, je constate que la valeur du coefficient diminue chaque fois.
Tout cela semble logique, et j'en déduis que R carré peut être utilisé pour évaluer si un nuage de point est mieux approximé par une exponentielle que par une droite.
Pourtant la théorie nous dit que R carré ne concerne que des régressions linéaires ...
Quelqu'un peut-il expliquer en quoi, selon la théorie, l'interprétation que je fais ici de R carré est fausse, abusive ... ou correcte.
Merci.
bjonk- Nombre de messages : 3
Date d'inscription : 10/06/2018
Re: Coefficient de détermination et régression non linéaire
Bonjour,
Comme tu le soulignes, le R² est pensé uniquement dans un cadre linéaire.
Sans pouvoir rentrer dans un détail théorique, il faut retenir que la somme des carrés (régression + résiduelle) n'est pas nécessairement égale à la somme des carré totale pour un modèle non-linéaire. cela fait donc complètement tomber le concept de R² car à la limite tu pourrais avoir un R²>1.
Le R² n'est donc pas une bonne statistique pour comparer des modèles non linéaires.
HTH
nik
Comme tu le soulignes, le R² est pensé uniquement dans un cadre linéaire.
Sans pouvoir rentrer dans un détail théorique, il faut retenir que la somme des carrés (régression + résiduelle) n'est pas nécessairement égale à la somme des carré totale pour un modèle non-linéaire. cela fait donc complètement tomber le concept de R² car à la limite tu pourrais avoir un R²>1.
Le R² n'est donc pas une bonne statistique pour comparer des modèles non linéaires.
HTH
nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Coefficient de détermination et régression non linéaire
Le R2 est appelé coefficient de détermination, et représente la proportion de la variance de la variable à expliquer qui est expliquer par le shéma de régression. Même s'il a été conçu dans le cadre linéaire (et l'on peut notamment démontrer que, dans le cas où il n'existe qu'une seule variable explicative, il représente le carrée de la corrélation), il a depuis été généralisé à plein d'autres situations, y compris pour des modèles non linéaire. Dans le cas gaussien, il revient au rapport de la variance expliquée par le modèle par la variance totale (pour la variable à explquer).
Même s'il les gens s'engueulent encore pas mal sur ce point, on peut même calculer un R2 dans des régressions non gaussiennes (e.g., GLM, etc.).
Donc, non, pas exclusivement réserve au cas linéaire, nin même au cas gaussien. Voir par exemple ici.
HTH, Eric.
Même s'il les gens s'engueulent encore pas mal sur ce point, on peut même calculer un R2 dans des régressions non gaussiennes (e.g., GLM, etc.).
Donc, non, pas exclusivement réserve au cas linéaire, nin même au cas gaussien. Voir par exemple ici.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1229
Date d'inscription : 14/09/2012
Re: Coefficient de détermination et régression non linéaire
Merci Nik et Eric pour vos réponses.
Voici le tableur en question :
https://allocation-universelle.net/jortay-allocuniv/include/R-carre.ods
Dans l'échantillon (colonne D) de la feuille1, on peut manifestement utiliser R carré pour mesurer la qualité de la régression. Mais dans l'échantillon de la feuille2 ce n'est plus le cas : en changeant une à une le signe des trois valeurs modifiées (NB : dans l'échantillon de la feuille1 elles sont toutes positives) vous constaterez que l'on fait grimper le coefficient, et à la troisième il a atteint 1 (mais, Nik, je ne vois pas comment on pourrait le faire dépasser 1 ...).
Peut-on en conclure que "le coefficient de détermination peut également être utilisé pour mesurer la qualité d'une régression non linéaire tant que l'échantillon ne comprend que des valeurs positives" ?
Voici le tableur en question :
https://allocation-universelle.net/jortay-allocuniv/include/R-carre.ods
Dans l'échantillon (colonne D) de la feuille1, on peut manifestement utiliser R carré pour mesurer la qualité de la régression. Mais dans l'échantillon de la feuille2 ce n'est plus le cas : en changeant une à une le signe des trois valeurs modifiées (NB : dans l'échantillon de la feuille1 elles sont toutes positives) vous constaterez que l'on fait grimper le coefficient, et à la troisième il a atteint 1 (mais, Nik, je ne vois pas comment on pourrait le faire dépasser 1 ...).
Peut-on en conclure que "le coefficient de détermination peut également être utilisé pour mesurer la qualité d'une régression non linéaire tant que l'échantillon ne comprend que des valeurs positives" ?
bjonk- Nombre de messages : 3
Date d'inscription : 10/06/2018
Re: Coefficient de détermination et régression non linéaire
Bonjour,
je suis plutôt de l'avis de Nik, même si je partage l'idée que selon les auteurs tu ne trouveras pas le même son de cloches. Concernant les pseudo R² notamment pour les GLMs, s'il y avait un consensus clair dans la litterature, il n'y en aurait probablement pas autant de disponibles.
Après le fait que les librairies "stats" de R qui contient la fonction nls pour faire des régressions non linéaires ou encore "nlstools" ne contiennent pas de fonctions pour estimer ces pseudo-R² me laisse sceptique sur le bien fondé de ce dernier. Si c'était si évident, ces éminents stateux l'aurait inclus non ?
Après on ne va pas refaire le débat ici ... a toi de te faire ton opinion en lisant de la doc sur la question.
cdlt
je suis plutôt de l'avis de Nik, même si je partage l'idée que selon les auteurs tu ne trouveras pas le même son de cloches. Concernant les pseudo R² notamment pour les GLMs, s'il y avait un consensus clair dans la litterature, il n'y en aurait probablement pas autant de disponibles.
Après le fait que les librairies "stats" de R qui contient la fonction nls pour faire des régressions non linéaires ou encore "nlstools" ne contiennent pas de fonctions pour estimer ces pseudo-R² me laisse sceptique sur le bien fondé de ce dernier. Si c'était si évident, ces éminents stateux l'aurait inclus non ?
Après on ne va pas refaire le débat ici ... a toi de te faire ton opinion en lisant de la doc sur la question.
cdlt
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Coefficient de détermination et régression non linéaire
Si effectivement un débat existe (et toujours aujourd'hui d'après ce que j'en sais), la question qui se pose ensuite est de savoir s'il existe d'autres approches pour éviter d'avoir à choisir R² ou pas R².
La réponse est oui. tu peux t'orienter par exemple vers de la sélection de modèle (Critères d'information type AIC, BIC...).
L'autre question qui se pose est de savoir si on a vraiment besoin d'une mesure comme le R²...(c'est plus philosophique déjà
)
Dans tous les cas ce n'est pas simple. une approche complémentaire est de regarder la qualité d'adéquation entre valeurs prédites et observées pour les 2 modèles et sur laquelle tu peux élaborer un R² à partir de la régression Obs~Pred (/!\ dans la mesure où tu n'as pas de problème de variance sur les erreurs). Les R² ne seront pas comparables au sens strict du terme mais cela aide au diagnostic.
HTH
La réponse est oui. tu peux t'orienter par exemple vers de la sélection de modèle (Critères d'information type AIC, BIC...).
L'autre question qui se pose est de savoir si on a vraiment besoin d'une mesure comme le R²...(c'est plus philosophique déjà

Dans tous les cas ce n'est pas simple. une approche complémentaire est de regarder la qualité d'adéquation entre valeurs prédites et observées pour les 2 modèles et sur laquelle tu peux élaborer un R² à partir de la régression Obs~Pred (/!\ dans la mesure où tu n'as pas de problème de variance sur les erreurs). Les R² ne seront pas comparables au sens strict du terme mais cela aide au diagnostic.
HTH
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|