Les posteurs les plus actifs de la semaine
c@ssoulet
 
maplej0e
 
Eric Wajnberg
 
Florent Aubry
 
Mlbc
 


SAS et SPSS

Aller en bas

SAS et SPSS

Message par philemon le Mer 22 Fév 2006 - 10:49

Salut à tout le monde,
je suis nouveau sur ce forum et je tiens tout d'abord à féliciter ceux qui en sont à l'initiative

j'ai déjà une petite question: je travaille actuellement avec SPSS sur une base de données qui date de 10 ans et qui fut à l'époque traitée avec SAS.
Comme la base a été transférée sous SPSS par un assez long cheminement (base ancienne donc pas de transfert quasi automatique comme on peut le faire aujourd'hui), je vérifie la cohérence des données à l'aide de sorties réalisées à l'époque sous SAS.
Tout semble ok à quelques petits détails près (et j'en viens à ma question): pour certaines variables la moyenne est strictement la même mais l'écart type est différent! j'avoue que ça dépasse mes compétences

une autre chose curieuse: les sorties sous SAS ne sont pas cohérentes au niveau des effectifs, ceux-ci sont différents au sein d'une série d'exploitations qui devraient au contraire affichés le même N, et également différents de ceux affichés par SPSS. Ceci pourrait bien sûr expliquer les différences au niveau de l'écart type, mais dans ce cas comment expliquer que l'on trouve malgré tout, avec des effectifs différents, strictement les mêmes moyennes (à la quatrième décimale après la virgule près) ?

est ce que ça peut être dû à des différences dans l'algorithme des deux logiciels? est ce que quelqu'un a déjà rencontré des problèmes similaires?

Merci d'avance

philemon

Nombre de messages : 1
Date d'inscription : 22/02/2006

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Une proposition de solution

Message par Flagada le Ven 21 Avr 2006 - 14:46

L'écart entre tes variances peut provenir du fait (mai c'est à vérifer), que l'un calcul une variance corrigées et l'autre aune variance non corrigées.
Quel est la différence entre les deux ?
Et bien contrairement, à la moyenne, la variance est un estimateur biaisé. En clair, si tu sélectionnes un grand nombre d'échantillon, la moyenne de ton échantillon aura tendance à converger vers la valeurs vrai de la moyenne (celle de la population dont est issu ton échantillon). par contre ce n'est pas vrai pour la variance. La variance estimé est minimisé par rapport à celle VRAI de ta population, donc on crée des variance corrigées.

Var = 1/n *somme(xi-xmoy)²
Var corrigées = 1/(n-1)*somme(xi-xmoy)²

Sous Excel par exemple, la 1ère variance correspond à la fonction "VAR" et la deuxième à la fonction "VARP".

Ne connaissant pas trop SPSS, je ne peux pas t'affirmer que ça vient de là mais tu peux esssayer de vérifier.

Flagada
Invité


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum