Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Le Deal du moment :
Jeux, jouets et Lego : le deuxième à ...
Voir le deal

Sens d'un calcul statistique

4 participants

Aller en bas

Sens d'un calcul statistique Empty Sens d'un calcul statistique

Message par jeps Jeu 26 Mai 2011 - 14:47

Bonjour à tous,

Je suis tout nouveau sur le forum, la réponse à ma question est peut être toute simple.
J'ai une série de données en fonction de direction de vents (donc, de 0 à 360°). Je me propose un petit calcul qui permet de déterminer si les données 'pointent' dans une direction en particulier (je précise que je ne peux avoir qu'un seul maximum...). Et c'est ce calcul qui est ouvert à débat; je ne sais pas s'il a du sens, statistiquement parlant:

coeff = 100*((95ème_centile-moyenne)/moyenne)*(ecartype/moyenne)

Qu'en dites-vous??

EDIT: je précise que ça donne des résultats plutôt cohérents!!

jeps

Nombre de messages : 8
Date d'inscription : 26/05/2011

Revenir en haut Aller en bas

Sens d'un calcul statistique Empty Re: Sens d'un calcul statistique

Message par gg Jeu 26 Mai 2011 - 15:32

Bonjour.

Je ne vois pas trop ce que tu peux calculer avec cette formule, par contre il y a un gros problème au départ : Il est difficile de mesurer la direction d'un vent à moins de quelques degrés près. Comment fais-tu la différence entre 0° et 359° (voire même 360° !) ?

Cordialement.

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Sens d'un calcul statistique Empty Re: Sens d'un calcul statistique

Message par jeps Jeu 26 Mai 2011 - 16:06

Ma résolution est assez haute (puisque j'ai des points tous les 0,05°). Et, à terme, je trace un graph en polaire.
Je voudrais calculer un coeff qui me dit si oui ou non les données sont dans une direction bien particulière
Sens d'un calcul statistique Captur10
sur l'image, 2 graph différents. La courbe rouge représente les données (en noir, gris et gris clair, l'incertitude). Sur le graph de gauche, on voit bien que ça pointe vers le NE. Par contre, a droite, il n'y a pas de direction particulière.

Si j'applique ce calcul, je trouve 85 pour le graph de gauche, et 5 pour celui de droite. Même chose pour les autres graph que j'ai.

jeps

Nombre de messages : 8
Date d'inscription : 26/05/2011

Revenir en haut Aller en bas

Sens d'un calcul statistique Empty Re: Sens d'un calcul statistique

Message par gg Jeu 26 Mai 2011 - 18:07

Je n'y comprends rien !

Quel rapport entre 85 et le Nord-est ?
Quant à la précision de 0,05° c'est de la galéjade ! Et il y a toujours le fait que entre 0,05° et 365,95°, l'écart angulaire est de 0,10°. Ce qui veut dire que si tu utilises le nord à la place de l'est comme direction 0, tout est changé !

Désolé, mais j'ai du mal à considérer cela comme sérieux.

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Sens d'un calcul statistique Empty Re: Sens d'un calcul statistique

Message par jeps Jeu 26 Mai 2011 - 21:00

Bon, je voulais éviter de rentrer dans les détails, mais la je crois que c'est nécessaire....
La courbe rouge est obtenue par régression non paramétrique en utilisant le noyau gaussien. Mon jeu de données (sur lequel j'applique la régression) s'apparente à celui d'une rose des vents (une mesure de direction de vent vs une concentration).
J'obtiens donc une courbe lissée que je représente en polaire. Il ne faut pas tenir compte des angles sur le graph; le Nord est bien a 0° et pointe en haut. Désolé de ne pas l'avoir mentionner.

Il y a une différence nette entre les 2 graphs. Celui de gauche a clairement un maximum (en direction du NORD EST), alors que celui de droite est presque un cercle (valeurs 'constantes' de 0 à 360°).

Ce que je voudrais faire, c'est 'quantifier' cela....
Et je t'assure, c'est très sérieux!

jeps

Nombre de messages : 8
Date d'inscription : 26/05/2011

Revenir en haut Aller en bas

Sens d'un calcul statistique Empty Re: Sens d'un calcul statistique

Message par c@ssoulet Ven 27 Mai 2011 - 6:43

Moi, comme ca, au pif, je tenterais un truc du genre aire sous la courbe.

Si tu prends ta figure de gauche
- tu fixes une "ligne de base" passant par le centre de la rose des vents et coupant le grand axe de ton ellipse rouge à angle droit (grosso modo une ligne 135-315 sur la figure de gauche)
- tu calcules l'aire sous la courbe "au dessus" et l'aire "au dessous"
- si l'une des aires est très supérieure à l'autre, tu as une direction privilégiée (sur la figure de gauche, l'une des aires est quasi nulle)
- Il devrait être alors facile de calculer la direction (c'est le "point haut" de ta "demi-ellipse")

c@ssoulet

Nombre de messages : 925
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

Sens d'un calcul statistique Empty Re: Sens d'un calcul statistique

Message par Nik Ven 27 Mai 2011 - 8:23

coeff = 100*((95ème_centile-moyenne)/moyenne)*(ecartype/moyenne)
Ta formule présentée comme ça en nous disant que c'est des degrés est complètement foireuse :
si tu as par ex 2 directions de vent à 45 et 315°, la moyenne vaut 180°, alors que la direction attendue est à l'exact inverse : 0°.

Donc quel est le sens de la moyenne sur de telles données ???

Nik

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

Sens d'un calcul statistique Empty Re: Sens d'un calcul statistique

Message par gg Ven 27 Mai 2011 - 8:24

Ok, Jeps,

c'est du sérieux. Donc tu traites bien le problème 360°=0° (tu n'as jamais répondu sur ce point). Et tu as parfaitement vu que sur le graphique de droite, il y a une direction privilégiée (Nord-Ouest/Sud-Est), mais dans les deux sens (des maximas au moins deux fois inférieurs au minimum en Sud-Ouest).
Mais effectivement, ce n'est pas cela qui caractérise ce que tu cherches, puisque tu veux repérer les graphiques "très décalés par rapport au centre", si je comprends bien.
Comme je ne vois pas d'interprétation de ton calcul, il reste un outil intuitif, dont on peut comprendre qu'il distingue entre les deux types de cas. Tu peux même remplacer le 95-ième centile par la valeur maximale, sauf si tu as des vents "exceptionnels" (mais comme on ne sait pas ce qui est mesuré et comment, toi seul peux savoir ce qui est "sain" et ce qui est à rejeter).
Par contre, j'ai l'impression que la réussite de ta méthode est essentiellement due au lissage, qui masque déjà fortement les disparités.

Cordialement.

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Sens d'un calcul statistique Empty Re: Sens d'un calcul statistique

Message par jeps Ven 27 Mai 2011 - 8:43

Nik a écrit:
Ta formule présentée comme ça en nous disant que c'est des degrés est complètement foireuse :
si tu as par ex 2 directions de vent à 45 et 315°, la moyenne vaut 180°, alors que la direction attendue est à l'exact inverse : 0°.

La formule est peut être mal écrite: je n'utilise en aucun cas les degrés. Tout est relatif à la courbe rouge (moyenne, 95ème centile, ecart type). Donc des valeurs numériques tout ce qui a de plus normales (ça peut des carottes, un pourcentage, à la limite, on s'en moque!)
Ne t'inquiètes pas, je sais tout a fait faire la moyenne de 2 directions de vent Wink


jeps

Nombre de messages : 8
Date d'inscription : 26/05/2011

Revenir en haut Aller en bas

Sens d'un calcul statistique Empty Re: Sens d'un calcul statistique

Message par jeps Ven 27 Mai 2011 - 8:50

[quote="gg" Donc tu traites bien le problème 360°=0° (tu n'as jamais répondu sur ce point). [/quote]

Oui, 360°=0°.... c'est le principe d'une rose des vents. Cela pose t'il un problème?


gg a écrit:
Comme je ne vois pas d'interprétation de ton calcul, il reste un outil intuitif, dont on peut comprendre qu'il distingue entre les deux types de cas.

C'est tout à fait ça!! Je ne suis pas statisticien (mon truc c'est plutot la chimie), donc tout ça est très intuitif. D'après ta réponse, j'en conclue que ça a quand même du sens? (même si c'est de la bricole)

gg a écrit:
Par contre, j'ai l'impression que la réussite de ta méthode est essentiellement due au lissage, qui masque déjà fortement les disparités.

C'est tout l'intéret de la régression non paramétrique! :-)







jeps

Nombre de messages : 8
Date d'inscription : 26/05/2011

Revenir en haut Aller en bas

Sens d'un calcul statistique Empty Re: Sens d'un calcul statistique

Message par gg Ven 27 Mai 2011 - 11:15

Bon, je vais essayer de comprendre un peu mieux :

Au départ, tu as, pour chaque angle entre 0° et 359,95°, tous les 0,05° une valeur numérique (disons le temps cumulé du vent dans cette direction; ou la force maximum du vent dans cette direction). Tu as commencé par faire un lissage, avec un outil adapté à l'aspect périodique (les valeurs voisines de 0° sont 0,05° et 359,95°). Ensuite, tu calcules la moyenne des valeurs (pas des angles) leur écart réduit et le 95-ième centile. Autrement dit, tu "oublies" complétement les directions. Puis tu calcules ton coefficient.
Ais-je bien compris ?

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Sens d'un calcul statistique Empty Re: Sens d'un calcul statistique

Message par gg Ven 27 Mai 2011 - 11:36

Je reprends maintenant ta formule : Tu utilises dans cette formules le produit de deux dispersions relatives. L'écart entre le 95-ième centile et la moyenne mesure la dispersion des valeurs au dessus de la moyenne. Le diviser par la moyenne le relativise (en particulier, ça devient un nombre sans unité). C'est un nombre qui est grand lorsque la moyenne est inférieure à la médiane, c'est à dire pour les séries dissymétriques avec une grande quantité de valeurs fortes et peu de valeurs faibles, mais qui peuvent être très faibles. Il est aussi grand quand la dispersion est grande.
Le fait de multiplier par le coefficient de variation (deuxième terme du produit) accentue la valeur lorsque la série a une moyenne nettement plus faible que sa dispersion.
Donc ton coefficient sera grand pour des données très dispersées et dissymétriques.

Maintenant, pour le lien avec les directions, un facteur est à prendre en compte : le lissage. Il fait que des directions proches ont des valeurs proches. Mais il me semble que si ta courbe présente deux bosses accentuées, tu devrais avoir aussi un coefficient fort. et même avec trois bosses, si certaines directions ont des valeurs quasi nulles.

Cordialement.

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Sens d'un calcul statistique Empty Re: Sens d'un calcul statistique

Message par jeps Ven 27 Mai 2011 - 12:23

gg a écrit:Bon, je vais essayer de comprendre un peu mieux :

Au départ, tu as, pour chaque angle entre 0° et 359,95°, tous les 0,05° une valeur numérique (disons le temps cumulé du vent dans cette direction; ou la force maximum du vent dans cette direction). Tu as commencé par faire un lissage, avec un outil adapté à l'aspect périodique (les valeurs voisines de 0° sont 0,05° et 359,95°). Ensuite, tu calcules la moyenne des valeurs (pas des angles) leur écart réduit et le 95-ième centile. Autrement dit, tu "oublies" complétement les directions. Puis tu calcules ton coefficient.
Ais-je bien compris ?

C'est tout à fait ça! ouf, on arrive à se comprendre :-)

jeps

Nombre de messages : 8
Date d'inscription : 26/05/2011

Revenir en haut Aller en bas

Sens d'un calcul statistique Empty Re: Sens d'un calcul statistique

Message par jeps Ven 27 Mai 2011 - 12:29

gg a écrit:Je reprends maintenant ta formule : Tu utilises dans cette formules le produit de deux dispersions relatives. L'écart entre le 95-ième centile et la moyenne mesure la dispersion des valeurs au dessus de la moyenne. Le diviser par la moyenne le relativise (en particulier, ça devient un nombre sans unité). C'est un nombre qui est grand lorsque la moyenne est inférieure à la médiane, c'est à dire pour les séries dissymétriques avec une grande quantité de valeurs fortes et peu de valeurs faibles, mais qui peuvent être très faibles. Il est aussi grand quand la dispersion est grande.
Le fait de multiplier par le coefficient de variation (deuxième terme du produit) accentue la valeur lorsque la série a une moyenne nettement plus faible que sa dispersion.
Donc ton coefficient sera grand pour des données très dispersées et dissymétriques.

Maintenant, pour le lien avec les directions, un facteur est à prendre en compte : le lissage. Il fait que des directions proches ont des valeurs proches. Mais il me semble que si ta courbe présente deux bosses accentuées, tu devrais avoir aussi un coefficient fort. et même avec trois bosses, si certaines directions ont des valeurs quasi nulles.

Cordialement.

Donc ça a bien du sens de multiplier ces deux valeurs entre elles....
Mais tu as raison, le lissage y est pour beaucoup. Donc le paramètre de la régression devrait entrer en ligne de compte. en multipliant le tout dans la formule par '1/paramètre' (ou même sa racine carrée, ça évite de diviser par un trop grand nombre), on trouve toujours des résultats cohérents (valeur faible quand peu de dispersion, élevée quand beaucoup de dispersion). Mais bon, là ça s'apparente plus à du bricolage, non??


jeps

Nombre de messages : 8
Date d'inscription : 26/05/2011

Revenir en haut Aller en bas

Sens d'un calcul statistique Empty Re: Sens d'un calcul statistique

Message par gg Ven 27 Mai 2011 - 13:53

C'est du bricolage.

Tout simplement parce qu'on ne sait pas ce qu'on mesure. Maintenant, à toi de voir ce que tu en fais (aucune garantie sur le fait que le résultat est utilisable).

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Sens d'un calcul statistique Empty Re: Sens d'un calcul statistique

Message par jeps Ven 27 Mai 2011 - 14:02

C'est bien ce que je pensais....
Mais pas mal de choses sont maintenant beaucoup plus claires!!

Merci beaucoup pour ton aide (et ta patience).

jeps

Nombre de messages : 8
Date d'inscription : 26/05/2011

Revenir en haut Aller en bas

Sens d'un calcul statistique Empty Re: Sens d'un calcul statistique

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum