Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Sens d'un calcul statistique
4 participants
Page 1 sur 1
Sens d'un calcul statistique
Bonjour à tous,
Je suis tout nouveau sur le forum, la réponse à ma question est peut être toute simple.
J'ai une série de données en fonction de direction de vents (donc, de 0 à 360°). Je me propose un petit calcul qui permet de déterminer si les données 'pointent' dans une direction en particulier (je précise que je ne peux avoir qu'un seul maximum...). Et c'est ce calcul qui est ouvert à débat; je ne sais pas s'il a du sens, statistiquement parlant:
coeff = 100*((95ème_centile-moyenne)/moyenne)*(ecartype/moyenne)
Qu'en dites-vous??
EDIT: je précise que ça donne des résultats plutôt cohérents!!
Je suis tout nouveau sur le forum, la réponse à ma question est peut être toute simple.
J'ai une série de données en fonction de direction de vents (donc, de 0 à 360°). Je me propose un petit calcul qui permet de déterminer si les données 'pointent' dans une direction en particulier (je précise que je ne peux avoir qu'un seul maximum...). Et c'est ce calcul qui est ouvert à débat; je ne sais pas s'il a du sens, statistiquement parlant:
coeff = 100*((95ème_centile-moyenne)/moyenne)*(ecartype/moyenne)
Qu'en dites-vous??
EDIT: je précise que ça donne des résultats plutôt cohérents!!
jeps- Nombre de messages : 8
Date d'inscription : 26/05/2011
Re: Sens d'un calcul statistique
Bonjour.
Je ne vois pas trop ce que tu peux calculer avec cette formule, par contre il y a un gros problème au départ : Il est difficile de mesurer la direction d'un vent à moins de quelques degrés près. Comment fais-tu la différence entre 0° et 359° (voire même 360° !) ?
Cordialement.
Je ne vois pas trop ce que tu peux calculer avec cette formule, par contre il y a un gros problème au départ : Il est difficile de mesurer la direction d'un vent à moins de quelques degrés près. Comment fais-tu la différence entre 0° et 359° (voire même 360° !) ?
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Sens d'un calcul statistique
Ma résolution est assez haute (puisque j'ai des points tous les 0,05°). Et, à terme, je trace un graph en polaire.
Je voudrais calculer un coeff qui me dit si oui ou non les données sont dans une direction bien particulière
sur l'image, 2 graph différents. La courbe rouge représente les données (en noir, gris et gris clair, l'incertitude). Sur le graph de gauche, on voit bien que ça pointe vers le NE. Par contre, a droite, il n'y a pas de direction particulière.
Si j'applique ce calcul, je trouve 85 pour le graph de gauche, et 5 pour celui de droite. Même chose pour les autres graph que j'ai.
Je voudrais calculer un coeff qui me dit si oui ou non les données sont dans une direction bien particulière
sur l'image, 2 graph différents. La courbe rouge représente les données (en noir, gris et gris clair, l'incertitude). Sur le graph de gauche, on voit bien que ça pointe vers le NE. Par contre, a droite, il n'y a pas de direction particulière.
Si j'applique ce calcul, je trouve 85 pour le graph de gauche, et 5 pour celui de droite. Même chose pour les autres graph que j'ai.
jeps- Nombre de messages : 8
Date d'inscription : 26/05/2011
Re: Sens d'un calcul statistique
Je n'y comprends rien !
Quel rapport entre 85 et le Nord-est ?
Quant à la précision de 0,05° c'est de la galéjade ! Et il y a toujours le fait que entre 0,05° et 365,95°, l'écart angulaire est de 0,10°. Ce qui veut dire que si tu utilises le nord à la place de l'est comme direction 0, tout est changé !
Désolé, mais j'ai du mal à considérer cela comme sérieux.
Quel rapport entre 85 et le Nord-est ?
Quant à la précision de 0,05° c'est de la galéjade ! Et il y a toujours le fait que entre 0,05° et 365,95°, l'écart angulaire est de 0,10°. Ce qui veut dire que si tu utilises le nord à la place de l'est comme direction 0, tout est changé !
Désolé, mais j'ai du mal à considérer cela comme sérieux.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Sens d'un calcul statistique
Bon, je voulais éviter de rentrer dans les détails, mais la je crois que c'est nécessaire....
La courbe rouge est obtenue par régression non paramétrique en utilisant le noyau gaussien. Mon jeu de données (sur lequel j'applique la régression) s'apparente à celui d'une rose des vents (une mesure de direction de vent vs une concentration).
J'obtiens donc une courbe lissée que je représente en polaire. Il ne faut pas tenir compte des angles sur le graph; le Nord est bien a 0° et pointe en haut. Désolé de ne pas l'avoir mentionner.
Il y a une différence nette entre les 2 graphs. Celui de gauche a clairement un maximum (en direction du NORD EST), alors que celui de droite est presque un cercle (valeurs 'constantes' de 0 à 360°).
Ce que je voudrais faire, c'est 'quantifier' cela....
Et je t'assure, c'est très sérieux!
La courbe rouge est obtenue par régression non paramétrique en utilisant le noyau gaussien. Mon jeu de données (sur lequel j'applique la régression) s'apparente à celui d'une rose des vents (une mesure de direction de vent vs une concentration).
J'obtiens donc une courbe lissée que je représente en polaire. Il ne faut pas tenir compte des angles sur le graph; le Nord est bien a 0° et pointe en haut. Désolé de ne pas l'avoir mentionner.
Il y a une différence nette entre les 2 graphs. Celui de gauche a clairement un maximum (en direction du NORD EST), alors que celui de droite est presque un cercle (valeurs 'constantes' de 0 à 360°).
Ce que je voudrais faire, c'est 'quantifier' cela....
Et je t'assure, c'est très sérieux!
jeps- Nombre de messages : 8
Date d'inscription : 26/05/2011
Re: Sens d'un calcul statistique
Moi, comme ca, au pif, je tenterais un truc du genre aire sous la courbe.
Si tu prends ta figure de gauche
- tu fixes une "ligne de base" passant par le centre de la rose des vents et coupant le grand axe de ton ellipse rouge à angle droit (grosso modo une ligne 135-315 sur la figure de gauche)
- tu calcules l'aire sous la courbe "au dessus" et l'aire "au dessous"
- si l'une des aires est très supérieure à l'autre, tu as une direction privilégiée (sur la figure de gauche, l'une des aires est quasi nulle)
- Il devrait être alors facile de calculer la direction (c'est le "point haut" de ta "demi-ellipse")
Si tu prends ta figure de gauche
- tu fixes une "ligne de base" passant par le centre de la rose des vents et coupant le grand axe de ton ellipse rouge à angle droit (grosso modo une ligne 135-315 sur la figure de gauche)
- tu calcules l'aire sous la courbe "au dessus" et l'aire "au dessous"
- si l'une des aires est très supérieure à l'autre, tu as une direction privilégiée (sur la figure de gauche, l'une des aires est quasi nulle)
- Il devrait être alors facile de calculer la direction (c'est le "point haut" de ta "demi-ellipse")
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Re: Sens d'un calcul statistique
Ta formule présentée comme ça en nous disant que c'est des degrés est complètement foireuse :coeff = 100*((95ème_centile-moyenne)/moyenne)*(ecartype/moyenne)
si tu as par ex 2 directions de vent à 45 et 315°, la moyenne vaut 180°, alors que la direction attendue est à l'exact inverse : 0°.
Donc quel est le sens de la moyenne sur de telles données ???
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Sens d'un calcul statistique
Ok, Jeps,
c'est du sérieux. Donc tu traites bien le problème 360°=0° (tu n'as jamais répondu sur ce point). Et tu as parfaitement vu que sur le graphique de droite, il y a une direction privilégiée (Nord-Ouest/Sud-Est), mais dans les deux sens (des maximas au moins deux fois inférieurs au minimum en Sud-Ouest).
Mais effectivement, ce n'est pas cela qui caractérise ce que tu cherches, puisque tu veux repérer les graphiques "très décalés par rapport au centre", si je comprends bien.
Comme je ne vois pas d'interprétation de ton calcul, il reste un outil intuitif, dont on peut comprendre qu'il distingue entre les deux types de cas. Tu peux même remplacer le 95-ième centile par la valeur maximale, sauf si tu as des vents "exceptionnels" (mais comme on ne sait pas ce qui est mesuré et comment, toi seul peux savoir ce qui est "sain" et ce qui est à rejeter).
Par contre, j'ai l'impression que la réussite de ta méthode est essentiellement due au lissage, qui masque déjà fortement les disparités.
Cordialement.
c'est du sérieux. Donc tu traites bien le problème 360°=0° (tu n'as jamais répondu sur ce point). Et tu as parfaitement vu que sur le graphique de droite, il y a une direction privilégiée (Nord-Ouest/Sud-Est), mais dans les deux sens (des maximas au moins deux fois inférieurs au minimum en Sud-Ouest).
Mais effectivement, ce n'est pas cela qui caractérise ce que tu cherches, puisque tu veux repérer les graphiques "très décalés par rapport au centre", si je comprends bien.
Comme je ne vois pas d'interprétation de ton calcul, il reste un outil intuitif, dont on peut comprendre qu'il distingue entre les deux types de cas. Tu peux même remplacer le 95-ième centile par la valeur maximale, sauf si tu as des vents "exceptionnels" (mais comme on ne sait pas ce qui est mesuré et comment, toi seul peux savoir ce qui est "sain" et ce qui est à rejeter).
Par contre, j'ai l'impression que la réussite de ta méthode est essentiellement due au lissage, qui masque déjà fortement les disparités.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Sens d'un calcul statistique
Nik a écrit:
Ta formule présentée comme ça en nous disant que c'est des degrés est complètement foireuse :
si tu as par ex 2 directions de vent à 45 et 315°, la moyenne vaut 180°, alors que la direction attendue est à l'exact inverse : 0°.
La formule est peut être mal écrite: je n'utilise en aucun cas les degrés. Tout est relatif à la courbe rouge (moyenne, 95ème centile, ecart type). Donc des valeurs numériques tout ce qui a de plus normales (ça peut des carottes, un pourcentage, à la limite, on s'en moque!)
Ne t'inquiètes pas, je sais tout a fait faire la moyenne de 2 directions de vent
jeps- Nombre de messages : 8
Date d'inscription : 26/05/2011
Re: Sens d'un calcul statistique
[quote="gg" Donc tu traites bien le problème 360°=0° (tu n'as jamais répondu sur ce point). [/quote]
Oui, 360°=0°.... c'est le principe d'une rose des vents. Cela pose t'il un problème?
C'est tout à fait ça!! Je ne suis pas statisticien (mon truc c'est plutot la chimie), donc tout ça est très intuitif. D'après ta réponse, j'en conclue que ça a quand même du sens? (même si c'est de la bricole)
C'est tout l'intéret de la régression non paramétrique! :-)
Oui, 360°=0°.... c'est le principe d'une rose des vents. Cela pose t'il un problème?
gg a écrit:
Comme je ne vois pas d'interprétation de ton calcul, il reste un outil intuitif, dont on peut comprendre qu'il distingue entre les deux types de cas.
C'est tout à fait ça!! Je ne suis pas statisticien (mon truc c'est plutot la chimie), donc tout ça est très intuitif. D'après ta réponse, j'en conclue que ça a quand même du sens? (même si c'est de la bricole)
gg a écrit:
Par contre, j'ai l'impression que la réussite de ta méthode est essentiellement due au lissage, qui masque déjà fortement les disparités.
C'est tout l'intéret de la régression non paramétrique! :-)
jeps- Nombre de messages : 8
Date d'inscription : 26/05/2011
Re: Sens d'un calcul statistique
Bon, je vais essayer de comprendre un peu mieux :
Au départ, tu as, pour chaque angle entre 0° et 359,95°, tous les 0,05° une valeur numérique (disons le temps cumulé du vent dans cette direction; ou la force maximum du vent dans cette direction). Tu as commencé par faire un lissage, avec un outil adapté à l'aspect périodique (les valeurs voisines de 0° sont 0,05° et 359,95°). Ensuite, tu calcules la moyenne des valeurs (pas des angles) leur écart réduit et le 95-ième centile. Autrement dit, tu "oublies" complétement les directions. Puis tu calcules ton coefficient.
Ais-je bien compris ?
Au départ, tu as, pour chaque angle entre 0° et 359,95°, tous les 0,05° une valeur numérique (disons le temps cumulé du vent dans cette direction; ou la force maximum du vent dans cette direction). Tu as commencé par faire un lissage, avec un outil adapté à l'aspect périodique (les valeurs voisines de 0° sont 0,05° et 359,95°). Ensuite, tu calcules la moyenne des valeurs (pas des angles) leur écart réduit et le 95-ième centile. Autrement dit, tu "oublies" complétement les directions. Puis tu calcules ton coefficient.
Ais-je bien compris ?
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Sens d'un calcul statistique
Je reprends maintenant ta formule : Tu utilises dans cette formules le produit de deux dispersions relatives. L'écart entre le 95-ième centile et la moyenne mesure la dispersion des valeurs au dessus de la moyenne. Le diviser par la moyenne le relativise (en particulier, ça devient un nombre sans unité). C'est un nombre qui est grand lorsque la moyenne est inférieure à la médiane, c'est à dire pour les séries dissymétriques avec une grande quantité de valeurs fortes et peu de valeurs faibles, mais qui peuvent être très faibles. Il est aussi grand quand la dispersion est grande.
Le fait de multiplier par le coefficient de variation (deuxième terme du produit) accentue la valeur lorsque la série a une moyenne nettement plus faible que sa dispersion.
Donc ton coefficient sera grand pour des données très dispersées et dissymétriques.
Maintenant, pour le lien avec les directions, un facteur est à prendre en compte : le lissage. Il fait que des directions proches ont des valeurs proches. Mais il me semble que si ta courbe présente deux bosses accentuées, tu devrais avoir aussi un coefficient fort. et même avec trois bosses, si certaines directions ont des valeurs quasi nulles.
Cordialement.
Le fait de multiplier par le coefficient de variation (deuxième terme du produit) accentue la valeur lorsque la série a une moyenne nettement plus faible que sa dispersion.
Donc ton coefficient sera grand pour des données très dispersées et dissymétriques.
Maintenant, pour le lien avec les directions, un facteur est à prendre en compte : le lissage. Il fait que des directions proches ont des valeurs proches. Mais il me semble que si ta courbe présente deux bosses accentuées, tu devrais avoir aussi un coefficient fort. et même avec trois bosses, si certaines directions ont des valeurs quasi nulles.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Sens d'un calcul statistique
gg a écrit:Bon, je vais essayer de comprendre un peu mieux :
Au départ, tu as, pour chaque angle entre 0° et 359,95°, tous les 0,05° une valeur numérique (disons le temps cumulé du vent dans cette direction; ou la force maximum du vent dans cette direction). Tu as commencé par faire un lissage, avec un outil adapté à l'aspect périodique (les valeurs voisines de 0° sont 0,05° et 359,95°). Ensuite, tu calcules la moyenne des valeurs (pas des angles) leur écart réduit et le 95-ième centile. Autrement dit, tu "oublies" complétement les directions. Puis tu calcules ton coefficient.
Ais-je bien compris ?
C'est tout à fait ça! ouf, on arrive à se comprendre :-)
jeps- Nombre de messages : 8
Date d'inscription : 26/05/2011
Re: Sens d'un calcul statistique
gg a écrit:Je reprends maintenant ta formule : Tu utilises dans cette formules le produit de deux dispersions relatives. L'écart entre le 95-ième centile et la moyenne mesure la dispersion des valeurs au dessus de la moyenne. Le diviser par la moyenne le relativise (en particulier, ça devient un nombre sans unité). C'est un nombre qui est grand lorsque la moyenne est inférieure à la médiane, c'est à dire pour les séries dissymétriques avec une grande quantité de valeurs fortes et peu de valeurs faibles, mais qui peuvent être très faibles. Il est aussi grand quand la dispersion est grande.
Le fait de multiplier par le coefficient de variation (deuxième terme du produit) accentue la valeur lorsque la série a une moyenne nettement plus faible que sa dispersion.
Donc ton coefficient sera grand pour des données très dispersées et dissymétriques.
Maintenant, pour le lien avec les directions, un facteur est à prendre en compte : le lissage. Il fait que des directions proches ont des valeurs proches. Mais il me semble que si ta courbe présente deux bosses accentuées, tu devrais avoir aussi un coefficient fort. et même avec trois bosses, si certaines directions ont des valeurs quasi nulles.
Cordialement.
Donc ça a bien du sens de multiplier ces deux valeurs entre elles....
Mais tu as raison, le lissage y est pour beaucoup. Donc le paramètre de la régression devrait entrer en ligne de compte. en multipliant le tout dans la formule par '1/paramètre' (ou même sa racine carrée, ça évite de diviser par un trop grand nombre), on trouve toujours des résultats cohérents (valeur faible quand peu de dispersion, élevée quand beaucoup de dispersion). Mais bon, là ça s'apparente plus à du bricolage, non??
jeps- Nombre de messages : 8
Date d'inscription : 26/05/2011
Re: Sens d'un calcul statistique
C'est du bricolage.
Tout simplement parce qu'on ne sait pas ce qu'on mesure. Maintenant, à toi de voir ce que tu en fais (aucune garantie sur le fait que le résultat est utilisable).
Tout simplement parce qu'on ne sait pas ce qu'on mesure. Maintenant, à toi de voir ce que tu en fais (aucune garantie sur le fait que le résultat est utilisable).
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Sens d'un calcul statistique
C'est bien ce que je pensais....
Mais pas mal de choses sont maintenant beaucoup plus claires!!
Merci beaucoup pour ton aide (et ta patience).
Mais pas mal de choses sont maintenant beaucoup plus claires!!
Merci beaucoup pour ton aide (et ta patience).
jeps- Nombre de messages : 8
Date d'inscription : 26/05/2011
Sujets similaires
» Calcul de la p-value
» Choix de modèle statistique pour calcul de risque relatif
» Comprendre le sens du test "lack of fit"
» Calcul d'une référence
» Calcul de représentativité
» Choix de modèle statistique pour calcul de risque relatif
» Comprendre le sens du test "lack of fit"
» Calcul d'une référence
» Calcul de représentativité
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum