Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

-50%
Le deal à ne pas rater :
-50% sur les sacs à dos pour ordinateur portable Urban Factory ...
19.99 € 39.99 €
Voir le deal

SAS et SPSS

Aller en bas

spss - SAS et SPSS Empty SAS et SPSS

Message par philemon Mer 22 Fév 2006 - 10:49

Salut à tout le monde,
je suis nouveau sur ce forum et je tiens tout d'abord à féliciter ceux qui en sont à l'initiative

j'ai déjà une petite question: je travaille actuellement avec SPSS sur une base de données qui date de 10 ans et qui fut à l'époque traitée avec SAS.
Comme la base a été transférée sous SPSS par un assez long cheminement (base ancienne donc pas de transfert quasi automatique comme on peut le faire aujourd'hui), je vérifie la cohérence des données à l'aide de sorties réalisées à l'époque sous SAS.
Tout semble ok à quelques petits détails près (et j'en viens à ma question): pour certaines variables la moyenne est strictement la même mais l'écart type est différent! j'avoue que ça dépasse mes compétences

une autre chose curieuse: les sorties sous SAS ne sont pas cohérentes au niveau des effectifs, ceux-ci sont différents au sein d'une série d'exploitations qui devraient au contraire affichés le même N, et également différents de ceux affichés par SPSS. Ceci pourrait bien sûr expliquer les différences au niveau de l'écart type, mais dans ce cas comment expliquer que l'on trouve malgré tout, avec des effectifs différents, strictement les mêmes moyennes (à la quatrième décimale après la virgule près) ?

est ce que ça peut être dû à des différences dans l'algorithme des deux logiciels? est ce que quelqu'un a déjà rencontré des problèmes similaires?

Merci d'avance

philemon

Nombre de messages : 1
Date d'inscription : 22/02/2006

Revenir en haut Aller en bas

spss - SAS et SPSS Empty Une proposition de solution

Message par Flagada Ven 21 Avr 2006 - 14:46

L'écart entre tes variances peut provenir du fait (mai c'est à vérifer), que l'un calcul une variance corrigées et l'autre aune variance non corrigées.
Quel est la différence entre les deux ?
Et bien contrairement, à la moyenne, la variance est un estimateur biaisé. En clair, si tu sélectionnes un grand nombre d'échantillon, la moyenne de ton échantillon aura tendance à converger vers la valeurs vrai de la moyenne (celle de la population dont est issu ton échantillon). par contre ce n'est pas vrai pour la variance. La variance estimé est minimisé par rapport à celle VRAI de ta population, donc on crée des variance corrigées.

Var = 1/n *somme(xi-xmoy)²
Var corrigées = 1/(n-1)*somme(xi-xmoy)²

Sous Excel par exemple, la 1ère variance correspond à la fonction "VAR" et la deuxième à la fonction "VARP".

Ne connaissant pas trop SPSS, je ne peux pas t'affirmer que ça vient de là mais tu peux esssayer de vérifier.

Flagada
Invité


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum