Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Régression linéaire simple
3 participants
Page 1 sur 2
Page 1 sur 2 • 1, 2
Régression linéaire simple
Bonjour !
Je viens solliciter votre aide dans le cadre de l'interprétation des régressions simples.
Lors de mon expérimentation j'ai recueilli 50 données.
=> J'ai calculé l'équation de la droite de régression.
=> Mon 'r' est significatif mais d'après ma prof de stat c'est pas pour autant que la régression qui en découle sera un bon modèle. Cette prof vient de partir en congé de maternité donc plus possible d'en parler avec elle or j'ai vraiment besoin qu'on m'aide a déterminer si oui ou non cette régression est un bon modèle.
Le logiciel dont je vous parle a calculé à chaque fois la valeur idéale de Y (selon l'équation) et l'écart de cette valeur par rapport à celle que j'avais obtenu lors de mon expérimentation.
Il a également calculé le 'rss' qui apparemment correspond à la somme des résidus des carrés. Ce rss est égal à 123.0732347, comment interpréter cette valeur? (à l'aide de quels outils?faut il se référer à une table?)
Je suis consciente de la stupidité que ma question aura aux yeux de certains mais si vous pouviez avoir la gentillesse d'y répondre.. Je vous remercie d'avance, en espérant vous lire bientot
BàV
Rac
PS si vous avez besoin de davantage de données pour répondre n'hésitez pas à demander
Je viens solliciter votre aide dans le cadre de l'interprétation des régressions simples.
Lors de mon expérimentation j'ai recueilli 50 données.
=> J'ai calculé l'équation de la droite de régression.
=> Mon 'r' est significatif mais d'après ma prof de stat c'est pas pour autant que la régression qui en découle sera un bon modèle. Cette prof vient de partir en congé de maternité donc plus possible d'en parler avec elle or j'ai vraiment besoin qu'on m'aide a déterminer si oui ou non cette régression est un bon modèle.
Le logiciel dont je vous parle a calculé à chaque fois la valeur idéale de Y (selon l'équation) et l'écart de cette valeur par rapport à celle que j'avais obtenu lors de mon expérimentation.
Il a également calculé le 'rss' qui apparemment correspond à la somme des résidus des carrés. Ce rss est égal à 123.0732347, comment interpréter cette valeur? (à l'aide de quels outils?faut il se référer à une table?)
Je suis consciente de la stupidité que ma question aura aux yeux de certains mais si vous pouviez avoir la gentillesse d'y répondre.. Je vous remercie d'avance, en espérant vous lire bientot
BàV
Rac
PS si vous avez besoin de davantage de données pour répondre n'hésitez pas à demander
Racc00n- Nombre de messages : 17
Date d'inscription : 26/03/2011
Re: Régression linéaire simple
Bonjour,
est ce que tu as calculé le coefficient de détermination R² ?
est ce que tu as calculé le coefficient de détermination R² ?
kirata- Nombre de messages : 11
Date d'inscription : 04/04/2011
Re: Régression linéaire simple
Bonjour RacOOn,
je n'ai pas vraiment saisi le sens de ta question.
Si tu cherches à interpréter la valeur du RSS, en soit elle ne correspond pas à grand chose, étant donné que sa valeur dépend à la fois de ton modèle et de la taille de tes données.
Comme kirata je te conseillerai de calculer le R2, mais difficile de te répondre quand on ne sait pas à quelle question tu veux répondre dans ton étude, ni même de quel type de données tu dispose.
Cordialement.
je n'ai pas vraiment saisi le sens de ta question.
Si tu cherches à interpréter la valeur du RSS, en soit elle ne correspond pas à grand chose, étant donné que sa valeur dépend à la fois de ton modèle et de la taille de tes données.
Comme kirata je te conseillerai de calculer le R2, mais difficile de te répondre quand on ne sait pas à quelle question tu veux répondre dans ton étude, ni même de quel type de données tu dispose.
Cordialement.
Invité- Invité
Re: Régression linéaire simple
Hadrien35 a écrit:Bonjour RacOOn,
je n'ai pas vraiment saisi le sens de ta question.
Si tu cherches à interpréter la valeur du RSS, en soit elle ne correspond pas à grand chose, étant donné que sa valeur dépend à la fois de ton modèle et de la taille de tes données.
Comme kirata je te conseillerai de calculer le R2, mais difficile de te répondre quand on ne sait pas à quelle question tu veux répondre dans ton étude, ni même de quel type de données tu dispose.
Cordialement.
C'est une étude en audiologie qui porte sur le lien qu'il pourrait y avoir entre le degré de perte d'audition en dB d'un patient et les difficultés qu'il a pour comprendre dans le bruit.
Pour ça j'ai testé 50 patients et j'ai mis en évidence des corrélations entre ces paramètres sur certaines fréquences. A partir de là je voulais savoir si un modèle prédictif était réalisable et fiable cad : est ce qu'on peut prédire la perte d'intelligibilité dans le bruit d'un patient en fonction du degré d'atteinte de certaines fréquences.
Je sais pas si c'est très clair ce que je raconte, j'espère que ça te parle un peu ..
Donc pour R² il y a deux méthodes si j'ai bien compris :
- il y en a une qui élève simplement le r de pearson au carré
- la seconde est un calcul plus compliqué mais qui inclu la valeur RSS
Laquelle utiliser dans ce cas ci?
Bien à toi
Rac
Racc00n- Nombre de messages : 17
Date d'inscription : 26/03/2011
Re: Régression linéaire simple
A noter que ma question initiale était : est ce la valeur RSS que le programme m'a calculé permettait à elle seule de dire que ma régression était 'valide'
Apparemment non... ?!
Merci à toi
Apparemment non... ?!
Merci à toi
Racc00n- Nombre de messages : 17
Date d'inscription : 26/03/2011
Re: Régression linéaire simple
Si tu te trouve dans le cas d'une modélisation linéaire, il me semble qu'élever le r au carré et calculer à partir du RSS te donnera la même valeur du R2.
A elle seule, la valeur du RSS ne te donne aucune explication.
Il est plus judicieux de voir comparer la valeur du RSS et des SS expliqués par ton modèle (en gros, est ce que ton modèle s'ajuste bien aux données). C'est ce qui est fait via le R2.
A elle seule, la valeur du RSS ne te donne aucune explication.
Il est plus judicieux de voir comparer la valeur du RSS et des SS expliqués par ton modèle (en gros, est ce que ton modèle s'ajuste bien aux données). C'est ce qui est fait via le R2.
Invité- Invité
Re: Régression linéaire simple
Hadrien35 a écrit:Si tu te trouve dans le cas d'une modélisation linéaire, il me semble qu'élever le r au carré et calculer à partir du RSS te donnera la même valeur du R2.
A elle seule, la valeur du RSS ne te donne aucune explication.
Il est plus judicieux de voir comparer la valeur du RSS et des SS expliqués par ton modèle (en gros, est ce que ton modèle s'ajuste bien aux données). C'est ce qui est fait via le R2.
D'accord, merci beaucoup...
Donc pour être sure.. plus le R² est proche de 1, plus le modèle est bon?
Sachant que ma meilleure corrélation vaut 0.7... R² = 0.49 c'est très bon, ce n'est donc pas un bon prédicteur?
BaV
RAC
Racc00n- Nombre de messages : 17
Date d'inscription : 26/03/2011
Re: Régression linéaire simple
sorry c'est PAS très bon *
Racc00n- Nombre de messages : 17
Date d'inscription : 26/03/2011
Re: Régression linéaire simple
Plus c'est proche de 1 et meilleur est ton modèle.
Mais là tu nous parle simplement de corrélation entre les variables si j'ai bien compris.
Je pensais que tu avais modéliser la parte d'intelligibilité en fonction d'autres paramètres, et que tu voulais voir si ton modèle était bon? Du coup tu fais une modélisation en regression multiple et tu regardes le R2...
Mais là tu nous parle simplement de corrélation entre les variables si j'ai bien compris.
Je pensais que tu avais modéliser la parte d'intelligibilité en fonction d'autres paramètres, et que tu voulais voir si ton modèle était bon? Du coup tu fais une modélisation en regression multiple et tu regardes le R2...
Invité- Invité
Re: Régression linéaire simple
Hadrien35 a écrit:Plus c'est proche de 1 et meilleur est ton modèle.
Mais là tu nous parle simplement de corrélation entre les variables si j'ai bien compris.
Je pensais que tu avais modéliser la parte d'intelligibilité en fonction d'autres paramètres, et que tu voulais voir si ton modèle était bon? Du coup tu fais une modélisation en regression multiple et tu regardes le R2...
Oui c'est bien ça, je veux savoir si je peux établir un bon modèle de prédiction, parcontre je pensais utiliser la régression simple et faire chaque fréquence séparément parce que je n'ai pas de bonnes corrélation sur toutes les fréquences. Du coup je pensais que tu disais que dans ce cas là élever le r (de la corrélation) au carré était suffisant...
Je suis dsl je chipote bcp mais je ne suis pas très bonne en stat, en tout cas c'est gentil de m'aider ^^
Racc00n- Nombre de messages : 17
Date d'inscription : 26/03/2011
Re: Régression linéaire simple
Dans la mesure ou tu veux prédire un phénomène en fonction de différentes variables, le fait de le prédire autant de fois que tu as de variables en les prenant une par une n'est pas la bonne approche. En modélisant ton phénomène en fonction de l'ensemble des variables, tu prend en compte le fait que certaines évoluent conjointement (les résultats sont surement proches pour des fréquences proches, non?)
Ton approche des fréquences prises une par une n'est pas stupide, tu peux regarder ça au début, voir quelles fréquences sont les plus corrélées à ton paramètre.
Mais si ton objectif est de prédire au mieux l'intelligibilité, alors modélise là en fonction de l'ensemble de tes fréquences.
Ton approche des fréquences prises une par une n'est pas stupide, tu peux regarder ça au début, voir quelles fréquences sont les plus corrélées à ton paramètre.
Mais si ton objectif est de prédire au mieux l'intelligibilité, alors modélise là en fonction de l'ensemble de tes fréquences.
Invité- Invité
Re: Régression linéaire simple
Hadrien35 a écrit:Dans la mesure ou tu veux prédire un phénomène en fonction de différentes variables, le fait de le prédire autant de fois que tu as de variables en les prenant une par une n'est pas la bonne approche. En modélisant ton phénomène en fonction de l'ensemble des variables, tu prend en compte le fait que certaines évoluent conjointement (les résultats sont surement proches pour des fréquences proches, non?)
Ton approche des fréquences prises une par une n'est pas stupide, tu peux regarder ça au début, voir quelles fréquences sont les plus corrélées à ton paramètre.
Mais si ton objectif est de prédire au mieux l'intelligibilité, alors modélise là en fonction de l'ensemble de tes fréquences.
Ok, je comprend mieux...
Si tu permets une dernière question pour l'interprétation des résultats...
Si j'obtiens quelque chose comme 0.60 avec la formule R² = 1 - SCR/SCT, est ce que je peux me limiter à dire que 60% des pertes dans le bruit sont expliquées par le modèle que je proposais, ou je dois justifier d'avantage (sur certains site on parle du test du F qu'il faudrait alors que j'apprenne à faire)...
Racc00n- Nombre de messages : 17
Date d'inscription : 26/03/2011
Re: Régression linéaire simple
la signification du R² est que ton modèle explique 60% de la variabilité des données (60% de l'intelligibilité est expliquée par ton modèle).
Je ne sais pas comment tu pourrais justifier d'avantage, tout dépend de tes connaissances en stats... Tu peux déjà regarder la valeur des coefficients attribués à chacun de tes paramètes, voir si les valeurs sont crédibles (est ce que pour 2 fréquences proches, on a pas par hasard un coef très fort pour l'un et très faible pour l'auter? ça peut arriver...)
A toi de critiquer ta démarche, savoir comment tu as résolu ton problème...
Je ne sais pas comment tu pourrais justifier d'avantage, tout dépend de tes connaissances en stats... Tu peux déjà regarder la valeur des coefficients attribués à chacun de tes paramètes, voir si les valeurs sont crédibles (est ce que pour 2 fréquences proches, on a pas par hasard un coef très fort pour l'un et très faible pour l'auter? ça peut arriver...)
A toi de critiquer ta démarche, savoir comment tu as résolu ton problème...
Invité- Invité
Re: Régression linéaire simple
Hadrien35 a écrit:la signification du R² est que ton modèle explique 60% de la variabilité des données (60% de l'intelligibilité est expliquée par ton modèle).
Je ne sais pas comment tu pourrais justifier d'avantage, tout dépend de tes connaissances en stats... Tu peux déjà regarder la valeur des coefficients attribués à chacun de tes paramètes, voir si les valeurs sont crédibles (est ce que pour 2 fréquences proches, on a pas par hasard un coef très fort pour l'un et très faible pour l'auter? ça peut arriver...)
A toi de critiquer ta démarche, savoir comment tu as résolu ton problème...
Ok, je te remercie vraiment beaucoup pour le temps que tu viens de m'accorder
Tes info me sont très précieuses
Passe une bonne journée!
Bien à toi
RAC
Racc00n- Nombre de messages : 17
Date d'inscription : 26/03/2011
Re: Régression linéaire simple
Autre chose au passage, tu peux voir pour quelle valeur de l'intelligibilité la prédiction est la meilleure, et sur quelle elle est la plus faible...
Peut être que sur une plage de donnée ton modèle est excellent, et sur un autre moins bon, et que du coup, le R² moyen est de 60%...
Mais ça à part visuellement, je ne sais pas comment faire, à part utiliser des fonctions assez spéciales de ton logiciel (et tout dépend de sur quel logiciel tu travailles...)
Peut être que sur une plage de donnée ton modèle est excellent, et sur un autre moins bon, et que du coup, le R² moyen est de 60%...
Mais ça à part visuellement, je ne sais pas comment faire, à part utiliser des fonctions assez spéciales de ton logiciel (et tout dépend de sur quel logiciel tu travailles...)
Invité- Invité
Re: Régression linéaire simple
Hadrien35 a écrit:Autre chose au passage, tu peux voir pour quelle valeur de l'intelligibilité la prédiction est la meilleure, et sur quelle elle est la plus faible...
Peut être que sur une plage de donnée ton modèle est excellent, et sur un autre moins bon, et que du coup, le R² moyen est de 60%...
Mais ça à part visuellement, je ne sais pas comment faire, à part utiliser des fonctions assez spéciales de ton logiciel (et tout dépend de sur quel logiciel tu travailles...)
Je n'ai pas de logiciel spécial, comme il n'y a que pour mon mémoire que j'ai besoin des stats, je n'ai pas pris la peine d'en acheter un. En soi, le jury ne demande pas qu'on ait des stats hyper-complètes, ils savent que ce n'est pas notre boulot mais un minimum de recherche est quand même apprécié.
Là je travaille donc sur un programme gratuit qui est en ligne et qui fournit pas mal de données (http://www.u707.jussieu.fr/biostatgv/regmultiple_fonction.php)
Pour en revenir à mes données, j'avais déjà mis en évidence des corrélations plus fortes sur certaines fréquences. Je les avais d'abord groupées (hautes fréquences et basses fréquences) puis comme il y avait une corrélation sur les hautes fréquences je les ai repris séparément pour voir où la corrélation était la meilleure (dans ce cas-ci sur le 3000Hz)
Peut etre devrais-je, après avoir fait une régression multiple, refaire une régression simple sur cette fréquence pour voir si elle se démarque une fois de plus... A moins que ce ne soit pas très juste d'un point de vue procédure
Racc00n- Nombre de messages : 17
Date d'inscription : 26/03/2011
Re: Régression linéaire simple
Je pense que tu peux te limiter à une régression linéaire multiple, en prenant à la fois les hautes et les basses fréquences. Les fréquences les plus influentes sont celles avec les coefficients les plus élevés.
Séparer tes analyses n'est pas forcément une chose à faire et n'est pas justifié d'un point de vue stats si tu cherche à prédire une autre variable...
Séparer tes analyses n'est pas forcément une chose à faire et n'est pas justifié d'un point de vue stats si tu cherche à prédire une autre variable...
Invité- Invité
Re: Régression linéaire simple
Hadrien35 a écrit:Je pense que tu peux te limiter à une régression linéaire multiple, en prenant à la fois les hautes et les basses fréquences. Les fréquences les plus influentes sont celles avec les coefficients les plus élevés.
Séparer tes analyses n'est pas forcément une chose à faire et n'est pas justifié d'un point de vue stats si tu cherche à prédire une autre variable...
Le site me donne les coefficient calculés par l'équation de la droite de régression et leur déviation par rapport aux mesures que j'avais obtenue lors de mon expérimentation... pour savoir sur quelle fréquence le prédicteur est le plus fiable il faut que je reprenne celle où les chiffres sont les plus rapprochés possibles non?
Pour te monter je te met l'exemple de deux valeurs obtenues (j'arrive pas à mettre le tableau complet) ..ce sera peut être plus clair avec cet exemple... sachant que mon 3000Hz est le vecteur 4
vect4 Estimate : 0.046635 ; Std. Error : 0.042734 ; t value : 1.091 ; Pr (>|t|) : 0.281
vect6 Estimate : 0.010866 ; Std. Error : 0.027702 ; t value : 0.392 ; Pr (> |t|) : 0.697
J'espère que c'est pas trop farfelu
Racc00n- Nombre de messages : 17
Date d'inscription : 26/03/2011
Re: Régression linéaire simple
Ce sont les résultats de ta régression linéaire multiple? Ou de régressions linéaires simples avec les variables prises une par une?
Invité- Invité
Re: Régression linéaire simple
Hadrien35 a écrit:Ce sont les résultats de ta régression linéaire multiple? Ou de régressions linéaires simples avec les variables prises une par une?
ici c'est régression multiple.. mais je n'ai pas mis toutes les données
Racc00n- Nombre de messages : 17
Date d'inscription : 26/03/2011
Re: Régression linéaire simple
Ici, les paramètres que tu prends en compte ne sont donc pas significatif...
En gros, la fréquence à 3000Hz ne prédit pas l'intelligibilité car la proba critique est supérieure à 5%...
As-tu des coefficients dont l'influence est significative?
En gros, la fréquence à 3000Hz ne prédit pas l'intelligibilité car la proba critique est supérieure à 5%...
As-tu des coefficients dont l'influence est significative?
Invité- Invité
Re: Régression linéaire simple
Hadrien35 a écrit:Ici, les paramètres que tu prends en compte ne sont donc pas significatif...
En gros, la fréquence à 3000Hz ne prédit pas l'intelligibilité car la proba critique est supérieure à 5%...
As-tu des coefficients dont l'influence est significative?
Non, le 3000 (vecteur 4 ) était le plus élevé.
Juste pour être sure.. ce qu'ils appellent "Pr (> |t|)" est donc bien la valeur p?
Autre chose, si au départ pour mes corrélations j'avais pris un alpha de 0.01, c'est mieux de garder ça comme référence pour tous mes calculs statistiques (y compris les régressions?)
Racc00n- Nombre de messages : 17
Date d'inscription : 26/03/2011
Re: Régression linéaire simple
Donc la valeur 3000Hz est la valeur pour laquelle la p critique est la plus faible? Absolument aucun paramètre n'est significatif? Je ne parle pas de la valeur du coefficient...
Tu n'as pas forcément de raison de prendre un seuil de décision de 1% à l'origine, mais il est plus crédible de conserver le même seuil de décision (traditionnellement 5%)
Tu n'as pas forcément de raison de prendre un seuil de décision de 1% à l'origine, mais il est plus crédible de conserver le même seuil de décision (traditionnellement 5%)
Invité- Invité
Re: Régression linéaire simple
NB: étant donné que tes paramèters sont proches, il est possible (probable) qu'ils ne soient pas indépendants. Et donc les paramètes pris un à un sont significatifs, mais pris tous ensemble ils ne le sont pas...
Tu peux régler ça, mais pas à l'aide de ton logiciel...
Tu peux régler ça, mais pas à l'aide de ton logiciel...
Invité- Invité
Re: Régression linéaire simple
Hadrien35 a écrit:Donc la valeur 3000Hz est la valeur pour laquelle la p critique est la plus faible? Absolument aucun paramètre n'est significatif? Je ne parle pas de la valeur du coefficient...
Tu n'as pas forcément de raison de prendre un seuil de décision de 1% à l'origine, mais il est plus crédible de conserver le même seuil de décision (traditionnellement 5%)
il y a un seul vecteur encore en dessous avec un p de 0.154 qui est donc quand même supérieur à 5%... Donc ma régression multiple n'est pas significative... Tu crois qu'il faudrait faire des régressions simple du coup?
J'avais comparé mes résultats de corrélation à un seuil de décision de 1% ça parce que mes coef étaient bien supérieurs au chiffre de la table non seulement pour 5 % mais aussi pour 1%. Dire qu'on a une chance sur 100 de se tromper est encore mieux que 5 chance sur 100.. Je savais bien qu'on utilisait souvent 5% mais j'ai cru que si on pouvait utiliser 1% c'était encore mieux...
Racc00n- Nombre de messages : 17
Date d'inscription : 26/03/2011
Page 1 sur 2 • 1, 2
Sujets similaires
» Régression linéaire simple
» régression linéaire simple
» Régression linéaire simple et corrélation
» régression linéaire simple avec une variable
» Régression linéaire simple non significative et corrélation
» régression linéaire simple
» Régression linéaire simple et corrélation
» régression linéaire simple avec une variable
» Régression linéaire simple non significative et corrélation
Page 1 sur 2
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum