Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
SAS et SPSS
Page 1 sur 1
SAS et SPSS
Salut à tout le monde,
je suis nouveau sur ce forum et je tiens tout d'abord à féliciter ceux qui en sont à l'initiative
j'ai déjà une petite question: je travaille actuellement avec SPSS sur une base de données qui date de 10 ans et qui fut à l'époque traitée avec SAS.
Comme la base a été transférée sous SPSS par un assez long cheminement (base ancienne donc pas de transfert quasi automatique comme on peut le faire aujourd'hui), je vérifie la cohérence des données à l'aide de sorties réalisées à l'époque sous SAS.
Tout semble ok à quelques petits détails près (et j'en viens à ma question): pour certaines variables la moyenne est strictement la même mais l'écart type est différent! j'avoue que ça dépasse mes compétences
une autre chose curieuse: les sorties sous SAS ne sont pas cohérentes au niveau des effectifs, ceux-ci sont différents au sein d'une série d'exploitations qui devraient au contraire affichés le même N, et également différents de ceux affichés par SPSS. Ceci pourrait bien sûr expliquer les différences au niveau de l'écart type, mais dans ce cas comment expliquer que l'on trouve malgré tout, avec des effectifs différents, strictement les mêmes moyennes (à la quatrième décimale après la virgule près) ?
est ce que ça peut être dû à des différences dans l'algorithme des deux logiciels? est ce que quelqu'un a déjà rencontré des problèmes similaires?
Merci d'avance
je suis nouveau sur ce forum et je tiens tout d'abord à féliciter ceux qui en sont à l'initiative
j'ai déjà une petite question: je travaille actuellement avec SPSS sur une base de données qui date de 10 ans et qui fut à l'époque traitée avec SAS.
Comme la base a été transférée sous SPSS par un assez long cheminement (base ancienne donc pas de transfert quasi automatique comme on peut le faire aujourd'hui), je vérifie la cohérence des données à l'aide de sorties réalisées à l'époque sous SAS.
Tout semble ok à quelques petits détails près (et j'en viens à ma question): pour certaines variables la moyenne est strictement la même mais l'écart type est différent! j'avoue que ça dépasse mes compétences
une autre chose curieuse: les sorties sous SAS ne sont pas cohérentes au niveau des effectifs, ceux-ci sont différents au sein d'une série d'exploitations qui devraient au contraire affichés le même N, et également différents de ceux affichés par SPSS. Ceci pourrait bien sûr expliquer les différences au niveau de l'écart type, mais dans ce cas comment expliquer que l'on trouve malgré tout, avec des effectifs différents, strictement les mêmes moyennes (à la quatrième décimale après la virgule près) ?
est ce que ça peut être dû à des différences dans l'algorithme des deux logiciels? est ce que quelqu'un a déjà rencontré des problèmes similaires?
Merci d'avance
philemon- Nombre de messages : 1
Date d'inscription : 22/02/2006
Une proposition de solution
L'écart entre tes variances peut provenir du fait (mai c'est à vérifer), que l'un calcul une variance corrigées et l'autre aune variance non corrigées.
Quel est la différence entre les deux ?
Et bien contrairement, à la moyenne, la variance est un estimateur biaisé. En clair, si tu sélectionnes un grand nombre d'échantillon, la moyenne de ton échantillon aura tendance à converger vers la valeurs vrai de la moyenne (celle de la population dont est issu ton échantillon). par contre ce n'est pas vrai pour la variance. La variance estimé est minimisé par rapport à celle VRAI de ta population, donc on crée des variance corrigées.
Var = 1/n *somme(xi-xmoy)²
Var corrigées = 1/(n-1)*somme(xi-xmoy)²
Sous Excel par exemple, la 1ère variance correspond à la fonction "VAR" et la deuxième à la fonction "VARP".
Ne connaissant pas trop SPSS, je ne peux pas t'affirmer que ça vient de là mais tu peux esssayer de vérifier.
Quel est la différence entre les deux ?
Et bien contrairement, à la moyenne, la variance est un estimateur biaisé. En clair, si tu sélectionnes un grand nombre d'échantillon, la moyenne de ton échantillon aura tendance à converger vers la valeurs vrai de la moyenne (celle de la population dont est issu ton échantillon). par contre ce n'est pas vrai pour la variance. La variance estimé est minimisé par rapport à celle VRAI de ta population, donc on crée des variance corrigées.
Var = 1/n *somme(xi-xmoy)²
Var corrigées = 1/(n-1)*somme(xi-xmoy)²
Sous Excel par exemple, la 1ère variance correspond à la fonction "VAR" et la deuxième à la fonction "VARP".
Ne connaissant pas trop SPSS, je ne peux pas t'affirmer que ça vient de là mais tu peux esssayer de vérifier.
Flagada- Invité
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum