Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

-20%
Le deal à ne pas rater :
Ecran PC GIGABYTE 28″ LED M28U 4K ( IPS, 1 ms, 144 Hz, FreeSync ...
399 € 499 €
Voir le deal

Quand standardiser ?

3 participants

Aller en bas

Quand standardiser ? Empty Quand standardiser ?

Message par sunshine Ven 11 Nov 2011 - 11:31

Bonjour,

ma question concerne la standradisation (dans le sens classique de centrage-réduction), si l'on souhaite étudier l'existence d'une relation de corrélation (corrélation de Pearson par exemple) entre deux variables quantitatives continues X et Y faut-il toujours effectuer une standardisation au préalable ?
Plus généralement, sur quels critères se base-t-on pour avancer qu'une standardisation est nécessaire (les ordres de grandeurs des variables sont très différents, les paramètres centraux de dispersion et les valeurs centrales sont très différents, les deux variables sont influencés par d'autres variables non prises en compte, etc.) ?

Pour situer le contexte je pose la question suite à la lecture de ceci : " Dans le cas où l'on étudie deux variables quantitatives continues X et Y, la standardisation permet de détecter la présence de relations entre les variables, que celles-ci soit positives ou négatives. Elle constitue donc le préalable indispensable au test d'hypothèses sur l'existence de relations statistiquement significatives (corrélation) ou à la mise en place de modèles d'estimation des valeurs d'une variable par rapport à une autre (régression) que nous verrons dans les chapitres suivants."

Merci d'avance.


sunshine

Nombre de messages : 31
Date d'inscription : 17/05/2011

Revenir en haut Aller en bas

Quand standardiser ? Empty Re: Quand standardiser ?

Message par Nik Sam 12 Nov 2011 - 7:48

Bonjour,

On ne standardise pas aveuglément, c'est la première chose à se dire. Dans ton cas, la normalisation est une transformation assez drastique des données et rien ne dit qu'elle ne change pas des relations dans les données étudiées.

Les standardisations sont faites pour forcer les données à correspondre aux hypothèses statistiques des tests que l'on veut pratiquer. Seulement elles ne sont pas sans conséquences et cela n'est jamais pris en compte par ceux qui les conseille à tout va.
Donc on ne standardise que si cela est nécessaire pour répondre à la question posée et surtout si cela n'affecte en rien le lien réponse-prédicteur.

Nik

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

Quand standardiser ? Empty Re: Quand standardiser ?

Message par sunshine Sam 12 Nov 2011 - 14:09

Bonjour Nik,

Justement quand est-ce que "cela est nécessaire" ?

Doit-on considérer qu'il s'agisse par exemple de faire en sorte que les données répondent à une distribution normale (par exemple pour faire une corrélation de pearson) ?

J'avais également entendu dire que si les ordres de grandeurs des 2 variables étaient très différents, une standardisation était utile.

Cependant, je ne savais pas que cela pouvait affecter la relations entre les variables, il me semblait que justement le but était de rendre ces variables comparables...

sunshine

Nombre de messages : 31
Date d'inscription : 17/05/2011

Revenir en haut Aller en bas

Quand standardiser ? Empty Re: Quand standardiser ?

Message par gg Sam 12 Nov 2011 - 16:32

Bonsoir Sunshine.

C'est bizarre ce que tu écris : " que les données répondent à une distribution normale (par exemple pour faire une corrélation de pearson)"
J'avais déjà vu ça dans ton premier message, moins clairement dit. or pour étudier une corrélation (avec Pearson ou pas), il n'y a pas besoin de distribution Normale, et même on s'en moque.

Par contre, on utilise une normalisation dans certaines circonstances (ACP par exemple) parce que justement, on ne veut pas tenir compte de l'ordre de grandeur des variables (nombreuses), mais seulement de la façon dont elles se dispersent les unes par rapport aux autres.
J'ai bien peur que tu ais "entendu dire" certaines choses dans des contextes bien précis et que tu oublies aujourd'hui que ces "dires" concernaient la situation précise évoquée.

Enfin la normalisation ne peut pas "rendre ces variables comparables" puisqu'il s'agit de changement d'échelle. Que tu travailles en m et kg, ou en km et T, une longueur ne sera toujours pas comparable à un poids. Et pour une corrélation, le coefficient de corrélation sera inchangé dans ces changements d'unité.

Cordialement.

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Quand standardiser ? Empty Re: Quand standardiser ?

Message par sunshine Ven 18 Nov 2011 - 21:01

Bonjour,

Je suis surprise car on m'a toujours enseigné que l'hypothèse de distribution normale était nécessaire pour effectuer des tests paramétriques (dont la corrélation linéaire de pearson).

Par ailleurs j'ai confondu en parlant à la fois de normalisation et de standardisation. A moins que ces deux termes signifient la même chose ? Mais il me semble que l'on peut normaliser sans standardiser (par exemple en prenant le log ou la racine carré de la variable non linéaire, selon le cas bien sure) ? D'ailleurs une variable peut avoir une distribution normale sans être standardisée ?

Je me trompe peut être mais il me semblait que le but de la standardisation était de rendre comparables des variables aux distributions très différentes en termes de paramètres de dispersion et de valeurs centrales. Pour cela, la standardisation consistait à centrer la distribution sur la valeur centrale 0 et à réduire la distribution de telle manière que la dispersion soit de valeur 1.

Du coup je ne comprends toujours pas à quel moment et sur quels critères on se base pour dire qu'une standardisation et nécessaire (et valable) ?

sunshine

Nombre de messages : 31
Date d'inscription : 17/05/2011

Revenir en haut Aller en bas

Quand standardiser ? Empty Re: Quand standardiser ?

Message par gg Sam 19 Nov 2011 - 10:14

Bonjour.

"on m'a toujours enseigné que l'hypothèse de distribution normale était nécessaire pour effectuer des tests paramétriques" Non, il existe de nombreux tests paramétriques qui utilisent comme loi paramétrée une autre loi (uniforme, Poisson, binomiale, ..).
"dont la corrélation linéaire de Pearson" : Ce n'est pas un test paramétrique.
Pour la suite, je ne connais pas le vocabulaire précis. Par contre, ce que je sais, c'est que pour comparer les valeurs de deux variables, il ne faut pas les transformer, sinon on compare autre chose. On le fait donc dans certains cas pour lesquels on veut effectivement comparer autre chose. C'est un peu le sens de ton avant dernier paragraphe, mais il ne s'agit plus de comparer les valeurs, mais leurs dispersions relatives (pour une ACP, par exemple). Et il n'y a pas de rapport avec une éventuelle normalité des variables.
En tout cas, pour une corrélation, il y a une hypothèse de normalité, mais pas des variables : des résidus. Et encore .. seulement si on veut tester. Par exemple tester la non nullité du coefficient de corrélation.

"Du coup je ne comprends toujours pas à quel moment et sur quels critères on se base pour dire qu'une standardisation et nécessaire (et valable) ?" Tu devrais revoir les cas précis où on t'a enseigné qu'une standardisation est nécessaire, et voir pourquoi (si ça ne t'a pas été dit, c'est pas sérieux !).

Cordialement.

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Quand standardiser ? Empty Re: Quand standardiser ?

Message par Nik Lun 21 Nov 2011 - 15:57

Salut,

Pour compléter la réponse de gg.
Tu as inverser le sens des définitions : la standardisation est le terme général. La normalisation est une forme de standardisation qui consiste à obtenir une moyenne nulle (centrer) et un écart-type de 1 (réduire).
Une transformation logarithmique peut s'appliquer quand on peut supposer un processus multiplicatif et qu'on veut repasser en additif car cela correspond à ce que l'on sait faire.

Donc je reprend ma réponse car il n'y a aucun cas général pour les standardisations et si on prend les transformation de Box-cox, il y a une infinité de transformation possible.
nik a écrit:Donc on ne standardise que si cela est nécessaire pour répondre à la question posée et surtout si cela n'affecte en rien le lien réponse-prédicteur.

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

Quand standardiser ? Empty Re: Quand standardiser ?

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum