Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

Le Deal du moment :
Google Pixel 7 5G – Smartphone 6,3″ OLED ...
Voir le deal
316 €

Quel test choisir ?

3 participants

Aller en bas

test - Quel test choisir ? Empty Quel test choisir ?

Message par LMOR Dim 12 Avr 2020 - 21:21

Bonsoir,

Je dois comparer l'évolution dans le temps (du temps T0 au temps T1) de deux lots, un lot Test (TS) et un lot témoin (T1) via des indices :

Indice de diversité

Lots T0 T1 Evolution temporelle
TS 0,38 0,43 +0,08
TM 0,42 0,45 +0,03


Indice de variabilité

Lots T0 T1 Evolution temporelle
TS 0,53 0,62 +0,09
TM 0,69 0,67 -0,02


Le lot test semble montrer une évolution des indices plus marquée dans le temps. Quel test stat dois-je choisir pour en faire la démonstration statistique?
J'ai également les mêmes tableaux mais faisant apparaître des proportions (nombre de mots induits...), quel test choisir dans ce cas?

En vous remerciant,

Bonne soirée,

LMOR

Nombre de messages : 14
Date d'inscription : 24/08/2019

Revenir en haut Aller en bas

test - Quel test choisir ? Empty Re: Quel test choisir ?

Message par Eric Wajnberg Lun 13 Avr 2020 - 8:05

Votre question n'est pas claire. Les valeurs que vous donnez ici sont-elles des moyennes sur plusieurs répétitions ? Si oui, il vous suffirait de faire de simples tests t pour comparer les valeurs d'évolution entre les deux lots. Si non, on ne peut vous répondre si vous n'expliquez pas d'avantage comment les indices sont calculés, si jamais on peut faire quelque chose.

Cordialement, Eric.
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1237
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

test - Quel test choisir ? Empty Re: Quel test choisir ?

Message par LMOR Lun 13 Avr 2020 - 9:39

Bonjour,

Les indices de diversité et de variabilité sont des indices calculés pour une analyse lexicométrique d'un corpus textuel.

L'indice de diversité = Nombre de types (nombre de mots exprimés différents) / Nombre d'occurences (nombre de mots exprimés totaux). Il s'agit d'un rapport qui varie de 0 à 1.

L'indice de variabilité = Nombre d'hapax (nombre de mots exprimés une seule fois) / Nombre de types (nombre de mots exprimés différents). Il s'agit d'un rapport qui varie de 0 à 1.

Mes effectifs sur lesquels j'effectue mes analyses sont les suivants:
A T0, 64 individus en lot TS et 64 TM. A T1, j'ai perdu un peu d'individus car certains n'étaient plus joignable, 48 en TS et 48 en TM.

J'essaie de reformuler ma question. L'objectif est d'analyser l'impact d'une action menée sur les lots TS. Je dois donc comparer dans le temps les évolutions potentielles des lots TM et TS.

Dans un 1er temps, je comparer les lots TS et TM au même temps. Par exemple, j'obtiens le tableau suivant au temps T0:


J'obtiens par exemple les deux tableaux suivants:

Nombre d'occurrences Nombre de types Nombre d'hapax Indice de diversité Indice de variabilité
TS 124 52 33 0,43 0,62
TM 110 49 33 0,45 0,67

Afin de démontrer que mes échantillons sont bien homogènes au temps T0, avant l'application d'une action, je souhaite savoir si les différences constatées dans ce tableau sont statistiquement significatives. J'ai donc effectué un test de CHI2 sur les trois première colonnes car il me semble que le chi2 permet de comparer des proportions. Je ne suis pas certaine d'avoir choisi le bon test. Ma 1ère question est donc la suivante, pour cette comparaison au temps T0, est-ce bien le bon test?

Dans un second temps, je souhaite comparer les deux lots du T0 au T1. J'obtiens le tableau suivant: (je n'ai pas mis les nombre d'occurence, de types et d'hapax car il me semble qu'ils ne sont plus comparable car je n'ai plus les mêmes effectifs d'individus questionnés, en revanche les indices étant des rapports, il me semble que je peux les comparer)

Indice de diversité:

Lots T0 T1 Evolution temporelle
TS 0,38 0,43 +0,08
TM 0,42 0,45 +0,03


Indice de variabilité

Lots T0 T1 Evolution temporelle
TS 0,53 0,62 +0,09
TM 0,69 0,67 -0,02


Pour ces deux tableaux j'ai également effectué un test CHI2 basé sur les effectifs permettant de calculer les indices mais je ne suis pas certaine qu'il s'agisse du bon test. Faut-il faire un test t? Sur quelles valeurs?

En vous remerciant,

Cordialement,


LMOR

Nombre de messages : 14
Date d'inscription : 24/08/2019

Revenir en haut Aller en bas

test - Quel test choisir ? Empty Re: Quel test choisir ?

Message par LMOR Lun 13 Avr 2020 - 9:56


Re bonjour,

Je vois que mes tableaux sont peu lisibles dans le message précédent, je vous les remets dans ce message grâce à servimg.

https://i.servimg.com/u/f65/20/10/64/90/captur12.jpg
https://i.servimg.com/u/f65/20/10/64/90/captur11.jpg

Cordialement,

LMOR

Nombre de messages : 14
Date d'inscription : 24/08/2019

Revenir en haut Aller en bas

test - Quel test choisir ? Empty Re: Quel test choisir ?

Message par Eric Wajnberg Mar 14 Avr 2020 - 15:19

Le principal problème que vous avez dans vos données, c'est qu'elles ne sont pas indépendantes. Je vois même deux sources de non indépendance :

1) A chaque temps donné : plusieurs mots sont pris en compte pour chaque individu. Ceci se voit car votre table à T0 a des effectifs plus élevés que les 2x64 individus.

2) Entre les deux temps : Ce sont les mêmes individus qui sont suivis de T0 à T1.

Dans les analyses "classiques" (y compris pour vos simples chi2 sur vos tables) les données doivent être indépendantes. Or elles ne le semblent pas. Il faut re-concevoir votre analyse en rajoutant l'effet "individu".

Dans la mesure où vos deux indices sont en fait des pourcentages, ils suivent des lois binomiales. Une solution serait donc de partir sur un GLM de type binomial (régression logistique) en rajoutant l'effet "individu" pour tenir compte de la non-indépendance de vos données.

Il y a deux solutions, soit utiliser de qu'on appelle un modèle mixe (où l'effet "individu" est rentré comme un facteur aléatoire), soit un GEE (generalized estimating equation). Le problème est qu'il s'agit de modèles statistiques dont l'usage demande des compétences en statistiques et qui nécessitent un apprentissage relativement long. Si ce n'est pas votre cas, je pense que vous devriez vous rapprochez d'un statisticien. Sans quoi, je crains que vous n'arriviez pas à vous en sortir.

HTH, Eric.
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1237
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

test - Quel test choisir ? Empty Re: Quel test choisir ?

Message par LMOR Mer 15 Avr 2020 - 8:42

Je vous remercie beaucoup!
Je tente de contacter un statisticien.

LMOR

Nombre de messages : 14
Date d'inscription : 24/08/2019

Revenir en haut Aller en bas

test - Quel test choisir ? Empty Re: Quel test choisir ?

Message par Gilles TIXIER Mar 5 Mai 2020 - 17:12

Et si pour chaque individu vous calculiez la surface sous la courbe d'évolution dans le temps pour chaque indice
Et compariez les surfaces moyenens dexu deux groupes par un test de t, pour chaque groupe ?
Bien sur après avoir vérifié que les groupe sont comparable à T0.
Gilles TIXIER
Gilles TIXIER

Nombre de messages : 23
Localisation : Sud-est PACA
Date d'inscription : 25/01/2009

http://www.reseau-case.com/gti/amplitude

Revenir en haut Aller en bas

test - Quel test choisir ? Empty Re: Quel test choisir ?

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum