Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Comparaison de moyenne suivant des groupes
Page 1 sur 1
Comparaison de moyenne suivant des groupes
Bonjour,
Je mets le sujet ici (alors que je l'avais mis dans R auparavant) car en fait le problème est plus d'ordre "stat".
J'ai donc une population de N individus sur lesquels j'ai 10 variables quantitatives et 1 variable qualitative qui représente le numéro du cluster d'appartenance de l'individu "i".
J'aimerai tester si ma moyenne dans ma sous-population "Classe j" pour la variable quantitative X, notons la mu_j, est significativement différente de la moyenne dans la population entière, notons la mu.
A priori la statistique de test sous H0 (abus de langage ici je pense) serait la suivante :
v = (mu_j-mu)/\sqrt((s2/Nj)*(N-Nj/N-1)), où Nj est l'effectif qui prend la modalité "j"
Car sous H0 la variable aléatoire qui représente la moyenne de la variable X pour les individus prenant la modalité j suivrait une loi Normal de paramètres :
- moyenne = mu
- variance = (s²/Nj)*(N-Nj/N-1)
Là où je galère le plus c'est dans le raisonnement. (c'est ballot!)
Je vois l'hypothèse H0: La moyenne de X pour la modalité j est égale à la moyenne générale (mu_j = mu)
Mais après quand je ne vois pas pourquoi on utilise comme v.a. la moyenne de la variable X pour les individus prenant la modalité j et pas la différence.
Après j'ai du mal à récupérer la même variance ... le terme (N-Nj/N-1) est là parce qu'on prend une variance sans biais?
Si quelqu'un pouvait m'éclairer ça serait top!!
Bien cordialement,
Khalid
Ci-après le précédent message (la fonction catdes() est là pour cela et suit bien les hypothèses décrites plus haut):
Bonjour tout le monde,
Voilà j'ai des données numériques sur lesquelles j'ai fait une classification donc chaque individu appartient bien à une classe.
J'aimerai maintenant tester si suivant les groupes la moyenne d'une de mes variables quanti. est différente de la moyenne de cette variable quanti. sur toute la population.
En gros (car là c'est pas clair ) voici un exemple :
Et j'aimerai donc savoir si pour les individus de ma classe 6 (ou 5 ou etc.) la moyenne de Variable.Quanti est différente que la moyenne de Variable.Quanti sur toute la population.
Je vois que c'est une analyse anova à 1 facteur mais j'arrive pas à le formaliser avec la fonction aov() ou encore avec la fonction lm()+anova().
Si quelqu'un avait une idée je suis preneur
Cdlt,
Khalid
Je mets le sujet ici (alors que je l'avais mis dans R auparavant) car en fait le problème est plus d'ordre "stat".
J'ai donc une population de N individus sur lesquels j'ai 10 variables quantitatives et 1 variable qualitative qui représente le numéro du cluster d'appartenance de l'individu "i".
J'aimerai tester si ma moyenne dans ma sous-population "Classe j" pour la variable quantitative X, notons la mu_j, est significativement différente de la moyenne dans la population entière, notons la mu.
A priori la statistique de test sous H0 (abus de langage ici je pense) serait la suivante :
v = (mu_j-mu)/\sqrt((s2/Nj)*(N-Nj/N-1)), où Nj est l'effectif qui prend la modalité "j"
Car sous H0 la variable aléatoire qui représente la moyenne de la variable X pour les individus prenant la modalité j suivrait une loi Normal de paramètres :
- moyenne = mu
- variance = (s²/Nj)*(N-Nj/N-1)
Là où je galère le plus c'est dans le raisonnement. (c'est ballot!)
Je vois l'hypothèse H0: La moyenne de X pour la modalité j est égale à la moyenne générale (mu_j = mu)
Mais après quand je ne vois pas pourquoi on utilise comme v.a. la moyenne de la variable X pour les individus prenant la modalité j et pas la différence.
Après j'ai du mal à récupérer la même variance ... le terme (N-Nj/N-1) est là parce qu'on prend une variance sans biais?
Si quelqu'un pouvait m'éclairer ça serait top!!
Bien cordialement,
Khalid
Ci-après le précédent message (la fonction catdes() est là pour cela et suit bien les hypothèses décrites plus haut):
Bonjour tout le monde,
Voilà j'ai des données numériques sur lesquelles j'ai fait une classification donc chaque individu appartient bien à une classe.
J'aimerai maintenant tester si suivant les groupes la moyenne d'une de mes variables quanti. est différente de la moyenne de cette variable quanti. sur toute la population.
En gros (car là c'est pas clair ) voici un exemple :
- Code:
Variable.Quanti
10 8
11 36
12 12
14 72
16 23
17 4
Classe
10 6
11 6
12 5
14 6
16 6
17 6
Et j'aimerai donc savoir si pour les individus de ma classe 6 (ou 5 ou etc.) la moyenne de Variable.Quanti est différente que la moyenne de Variable.Quanti sur toute la population.
Je vois que c'est une analyse anova à 1 facteur mais j'arrive pas à le formaliser avec la fonction aov() ou encore avec la fonction lm()+anova().
Si quelqu'un avait une idée je suis preneur
Cdlt,
Khalid
HDKalit- Nombre de messages : 85
Date d'inscription : 10/01/2013
Re: Comparaison de moyenne suivant des groupes
En fait avec la variable aléatoire considérée (moyenne de la variable X pour les individus appartenant aux groupes J), la moyenne (ok) mais la variance je n'arrive pas à la calculer.
De ce que je vois de la fonction j'ai l'impression qu'on suppose que les 2 variances sont connues (pour utiliser la loi normale) alors que j'aurai eu tendance à partir sur un test de Student pour échantillons dépendants ... là je m'y perds.
Cordialement,
Khalid
De ce que je vois de la fonction j'ai l'impression qu'on suppose que les 2 variances sont connues (pour utiliser la loi normale) alors que j'aurai eu tendance à partir sur un test de Student pour échantillons dépendants ... là je m'y perds.
Cordialement,
Khalid
HDKalit- Nombre de messages : 85
Date d'inscription : 10/01/2013
[Résolu]
Bon je me suis pris la tête pour rien.
C'est tout simplement un test de la moyenne "simple" où la valeur de la moyenne que l'on veut tester est celle de la population.
Voilà si quelqu'un se pose la question, pas de complication en fait, juste le plus simple ^^
Même si je me demande encore si on a pas une "coquille" en "niant" l'indépendance.
Cdlt,
Khalid
C'est tout simplement un test de la moyenne "simple" où la valeur de la moyenne que l'on veut tester est celle de la population.
Voilà si quelqu'un se pose la question, pas de complication en fait, juste le plus simple ^^
Même si je me demande encore si on a pas une "coquille" en "niant" l'indépendance.
Cdlt,
Khalid
HDKalit- Nombre de messages : 85
Date d'inscription : 10/01/2013
Sujets similaires
» Comparaison moyenne théorique et moyenne expériementale
» comparaison d'une variable quantitative dans 3 groupes
» Comparaison de groupes
» comparaison porportions 3 groupes
» Comparaison groupes variables binaires
» comparaison d'une variable quantitative dans 3 groupes
» Comparaison de groupes
» comparaison porportions 3 groupes
» Comparaison groupes variables binaires
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum