Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

-20%
Le deal à ne pas rater :
Pack Gigabyte Ecran PC Gamer 27″ LED M27Q (rev2.0) + Radeon RX 6950 ...
749 € 939 €
Voir le deal

Coefficient de détermination et régression non linéaire

4 participants

Aller en bas

coefficient - Coefficient de détermination et régression non linéaire Empty Coefficient de détermination et régression non linéaire

Message par bjonk Mer 30 Jan 2019 - 15:26

Bonjour,

Dans un tableur j'ai entré une série d'une vingtaine de nombres produisant approximativement une exponentielle. Lorsque j'affiche le graphique avec courbe de tendance je constate que le coefficient de détermination de la régression exponentielle est supérieur à celui de la régression linéaire. En outre si je calcule une seconde série de valeurs y avec l'équation de la courbe de tendance exponentielle j'obtiens un coefficient de 1. Et et si dans cette série calculée je change la valeur d'un y puis d'un autre, je constate que la valeur du coefficient diminue chaque fois.

Tout cela semble logique, et j'en déduis que R carré peut être utilisé pour évaluer si un nuage de point est mieux approximé par une exponentielle que par une droite.

Pourtant la théorie nous dit que R carré ne concerne que des régressions linéaires ...

Quelqu'un peut-il expliquer en quoi, selon la théorie, l'interprétation que je fais ici de R carré est fausse, abusive ... ou correcte.

Merci.

bjonk

Nombre de messages : 3
Date d'inscription : 10/06/2018

Revenir en haut Aller en bas

coefficient - Coefficient de détermination et régression non linéaire Empty Re: Coefficient de détermination et régression non linéaire

Message par Nik Jeu 31 Jan 2019 - 14:37

Bonjour,

Comme tu le soulignes, le R² est pensé uniquement dans un cadre linéaire.
Sans pouvoir rentrer dans un détail théorique, il faut retenir que la somme des carrés (régression + résiduelle) n'est pas nécessairement égale à la somme des carré totale pour un modèle non-linéaire. cela fait donc complètement tomber le concept de R² car à la limite tu pourrais avoir un R²>1.

Le R² n'est donc pas une bonne statistique pour comparer des modèles non linéaires.

HTH

nik

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

coefficient - Coefficient de détermination et régression non linéaire Empty Re: Coefficient de détermination et régression non linéaire

Message par Eric Wajnberg Jeu 31 Jan 2019 - 15:51

Le R2 est appelé coefficient de détermination, et représente la proportion de la variance de la variable à expliquer qui est expliquer par le shéma de régression. Même s'il a été conçu dans le cadre linéaire (et l'on peut notamment démontrer que, dans le cas où il n'existe qu'une seule variable explicative, il représente le carrée de la corrélation), il a depuis été généralisé à plein d'autres situations, y compris pour des modèles non linéaire. Dans le cas gaussien, il revient au rapport de la variance expliquée par le modèle par la variance totale (pour la variable à explquer).

Même s'il les gens s'engueulent encore pas mal sur ce point, on peut même calculer un R2 dans des régressions non gaussiennes (e.g., GLM, etc.).

Donc, non, pas exclusivement réserve au cas linéaire, nin même au cas gaussien. Voir par exemple ici.

HTH, Eric.
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1237
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

coefficient - Coefficient de détermination et régression non linéaire Empty Re: Coefficient de détermination et régression non linéaire

Message par bjonk Jeu 31 Jan 2019 - 18:02

Merci Nik et Eric pour vos réponses.

Voici le tableur en question :
https://allocation-universelle.net/jortay-allocuniv/include/R-carre.ods

Dans l'échantillon (colonne D) de la feuille1, on peut manifestement utiliser R carré pour mesurer la qualité de la régression. Mais dans l'échantillon de la feuille2 ce n'est plus le cas : en changeant une à une le signe des trois valeurs modifiées (NB : dans l'échantillon de la feuille1 elles sont toutes positives) vous constaterez que l'on fait grimper le coefficient, et à la troisième il a atteint 1 (mais, Nik, je ne vois pas comment on pourrait le faire dépasser 1 ...).

Peut-on en conclure que "le coefficient de détermination peut également être utilisé pour mesurer la qualité d'une régression non linéaire tant que l'échantillon ne comprend que des valeurs positives" ?

bjonk

Nombre de messages : 3
Date d'inscription : 10/06/2018

Revenir en haut Aller en bas

coefficient - Coefficient de détermination et régression non linéaire Empty Re: Coefficient de détermination et régression non linéaire

Message par droopy Jeu 31 Jan 2019 - 21:30

Bonjour,

je suis plutôt de l'avis de Nik, même si je partage l'idée que selon les auteurs tu ne trouveras pas le même son de cloches. Concernant les pseudo R² notamment pour les GLMs, s'il y avait un consensus clair dans la litterature, il n'y en aurait probablement pas autant de disponibles.
Après le fait que les librairies "stats" de R qui contient la fonction nls pour faire des régressions non linéaires ou encore "nlstools" ne contiennent pas de fonctions pour estimer ces pseudo-R² me laisse sceptique sur le bien fondé de ce dernier. Si c'était si évident, ces éminents stateux l'aurait inclus non ?
Après on ne va pas refaire le débat ici ... a toi de te faire ton opinion en lisant de la doc sur la question.

cdlt
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

coefficient - Coefficient de détermination et régression non linéaire Empty Re: Coefficient de détermination et régression non linéaire

Message par Nik Ven 1 Fév 2019 - 10:55

Si effectivement un débat existe (et toujours aujourd'hui d'après ce que j'en sais), la question qui se pose ensuite est de savoir s'il existe d'autres approches pour éviter d'avoir à choisir R² ou pas R².
La réponse est oui. tu peux t'orienter par exemple vers de la sélection de modèle (Critères d'information type AIC, BIC...).

L'autre question qui se pose est de savoir si on a vraiment besoin d'une mesure comme le R²...(c'est plus philosophique déjà Smile )

Dans tous les cas ce n'est pas simple. une approche complémentaire est de regarder la qualité d'adéquation entre valeurs prédites et observées pour les 2 modèles et sur laquelle tu peux élaborer un R² à partir de la régression Obs~Pred (/!\ dans la mesure où tu n'as pas de problème de variance sur les erreurs). Les R² ne seront pas comparables au sens strict du terme mais cela aide au diagnostic.


HTH

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

coefficient - Coefficient de détermination et régression non linéaire Empty Re: Coefficient de détermination et régression non linéaire

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum