Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Quel test effectuer ?
2 participants
Page 1 sur 1
Quel test effectuer ?
Bonjour,
Je suis nouvelle sur ce Forum et vous prie de m'excuser par avance si je ne poste pas au bon endroit ou si je ne donne pas les précisions nécessaires.
Je ne suis pas du tout statisticienne, mais archéologue.
Je dispose de 3 jeux de données normalisées (de 0 à 1). Chaque jeux de données correspond à la perception du sous-sol par un outil spécifique (0 pour aucun indice ; 1 supposition très fort de présence d'un indice). Je vais les appeler A, B et C.
Je dispose également d'un jeux de données, également normalisé (0 et 1), correspondant au réel (0 pour pas d'indice ; 1 pour présence d'indice). Je vais l'appeler D.
Je précise que l'ensemble de ces données sont spatialisées.
Ce que je souhaite, c'est faire une somme pondérée A, B et C pour qu'ils se rapprochent le plus possible de D. Le but étant d'avoir une carte de "probabilité".
A*a1 + B*b1 + C*c1 = D
(a1, b1 et c1 étant les coefficients "de pondération").
Je cherche donc à déterminer les valeurs de a1, b1 et c1.
Cela parait très simple, mais dépasse totalement mes compétences.
J'ai donc fait quelques recherches sur internet qui m'ont orienté vers une régression linéaire multiple et la recherche des coefficients de corrélation partielle et le coefficient de régression multiple. Si j'ai bien compris ce procédé, cela permet de déterminer la valeur de D en fonction des valeurs A, B et C. Ce qui est presque l'inverse de ce que je souhaite faire.
Je me retourne alors vous pour savoir si vous pouvez m'orienter vers le test ou la combinaison de méthodes qui me permettrait d'arriver à ce que je souhaite.
Je précise que je travaille avec le logiciel R. Et également que mon but est à la fois de calibrer et de valider le modèle.
Je suis nouvelle sur ce Forum et vous prie de m'excuser par avance si je ne poste pas au bon endroit ou si je ne donne pas les précisions nécessaires.
Je ne suis pas du tout statisticienne, mais archéologue.
Je dispose de 3 jeux de données normalisées (de 0 à 1). Chaque jeux de données correspond à la perception du sous-sol par un outil spécifique (0 pour aucun indice ; 1 supposition très fort de présence d'un indice). Je vais les appeler A, B et C.
Je dispose également d'un jeux de données, également normalisé (0 et 1), correspondant au réel (0 pour pas d'indice ; 1 pour présence d'indice). Je vais l'appeler D.
Je précise que l'ensemble de ces données sont spatialisées.
Ce que je souhaite, c'est faire une somme pondérée A, B et C pour qu'ils se rapprochent le plus possible de D. Le but étant d'avoir une carte de "probabilité".
A*a1 + B*b1 + C*c1 = D
(a1, b1 et c1 étant les coefficients "de pondération").
Je cherche donc à déterminer les valeurs de a1, b1 et c1.
Cela parait très simple, mais dépasse totalement mes compétences.
J'ai donc fait quelques recherches sur internet qui m'ont orienté vers une régression linéaire multiple et la recherche des coefficients de corrélation partielle et le coefficient de régression multiple. Si j'ai bien compris ce procédé, cela permet de déterminer la valeur de D en fonction des valeurs A, B et C. Ce qui est presque l'inverse de ce que je souhaite faire.
Je me retourne alors vous pour savoir si vous pouvez m'orienter vers le test ou la combinaison de méthodes qui me permettrait d'arriver à ce que je souhaite.
Je précise que je travaille avec le logiciel R. Et également que mon but est à la fois de calibrer et de valider le modèle.
Carlac- Nombre de messages : 5
Date d'inscription : 19/12/2013
Re: Quel test effectuer ?
Bonjour.
Une régression linéaire multiple donne bien ce que tu veux (à peu près). car tu cherches bien à connaître une valeur de D à partir de valeurs nouvelles de A, B et C (sinon, le modèle n'a pas d'intérêt). Ou de quelle façon linéaire D se décompose sur A,B et C. Ce qui revient au même !
Par contre je n'ai pas trop compris l'usage du mot "carte", surtout après "spatialisées".
Cordialement.
Une régression linéaire multiple donne bien ce que tu veux (à peu près). car tu cherches bien à connaître une valeur de D à partir de valeurs nouvelles de A, B et C (sinon, le modèle n'a pas d'intérêt). Ou de quelle façon linéaire D se décompose sur A,B et C. Ce qui revient au même !
Par contre je n'ai pas trop compris l'usage du mot "carte", surtout après "spatialisées".
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Quel test effectuer ?
Ce que je ne comprends pas c'est comment je peux connaitre les valeurs de a1, b1 et c1, à part à faire plusieurs tests (appliqué différentes pondération aux jeux de donnée) et à faire pour chaque test une régression jusqu'à trouver les bons coefficients.
En fait, je travaille avec un système d'information géographique. Je vais faire le calcul dans R à partir d'un échantillon, puis, une fois les valeur de a1, b1 et c1 sure, j'étendrais le calcul à la totalité de mes jeux de données. Je pense, si j'ai bine compris les différents article que j'ai lu que cela demande de faire un calcul de surface de tendance. Mais, je n'en suis pas là du tout.
Le côté spatial me permet d'avoir une vision de la répartition de l'information dans l'espace. Ce qui est important en archéologie.
J'aurai d'autres questions.
Dois-je me fier à la fonction lm de R ou dois-je tout faire "à la main" dans R ?
Est-ce-que je dois passer par un calcul de coefficient de régression centré-réduits ou par un calcul de coefficient de covariance puis de corrélation ?
Excusez moi que ces questions qui doivent vous paraître assez basic, mais je ne suis pas du tout experte en la matière.
En fait, je travaille avec un système d'information géographique. Je vais faire le calcul dans R à partir d'un échantillon, puis, une fois les valeur de a1, b1 et c1 sure, j'étendrais le calcul à la totalité de mes jeux de données. Je pense, si j'ai bine compris les différents article que j'ai lu que cela demande de faire un calcul de surface de tendance. Mais, je n'en suis pas là du tout.
Le côté spatial me permet d'avoir une vision de la répartition de l'information dans l'espace. Ce qui est important en archéologie.
J'aurai d'autres questions.
Dois-je me fier à la fonction lm de R ou dois-je tout faire "à la main" dans R ?
Est-ce-que je dois passer par un calcul de coefficient de régression centré-réduits ou par un calcul de coefficient de covariance puis de corrélation ?
Excusez moi que ces questions qui doivent vous paraître assez basic, mais je ne suis pas du tout experte en la matière.
Carlac- Nombre de messages : 5
Date d'inscription : 19/12/2013
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum