Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Le deal à ne pas rater :
KTC Écran PC Gaming 24″ (1920 x 1080) 100Hz, dalle VA à 67,39
67.39 €
Voir le deal
Le Deal du moment : -29%
DYSON V8 Origin – Aspirateur balai sans fil
Voir le deal
269.99 €

Aide analyse données de mon mémoire

2 participants

Aller en bas

Aide analyse données de mon mémoire Empty Aide analyse données de mon mémoire

Message par pepsiglass Mar 28 Déc 2010 - 18:32

Bonjour,

Je suis étudiante en linguistique (M2R) et on ne peut pas dire que les stats sont mon point fort (en fait j'ai jamais eu de cours...Sad ).
J'ai récolté tout un tas de données, et je ne sais pas quel(s) test statistique leur appliquer pour les traiter le plus efficacement possible.
En fait j'ai enregistré la position du regard de mes sujets en fonction du temps (ils avaient 4 images devants eux, pendant 5 secondes). J'avais 16 séries de 4 images. Pour chaque série, ma caméra a relevé la position du regard toutes les 17ms. Parmi les 4 images j'avais une image cible, un compétiteur 1, un compétiteur 2 et un distracteur.
Pour chaque série de 4 images j'ai calculé les taux de regard (combien, parmi mes 40 sujets regardaient l'image 1 à T1, combien regardaient l'image 2 à T1...) par image pour chacun des points relevés par la caméra (ça en fait un paquet !). Je me retrouve donc avec 16 graphes représentant l'évolution de la position du regard en fonction du temps. Chacun de ces graphiques comportent 4 courbes (une pour le pourcentage de regard porté à la cible, une pour le pourcentage de regard porté au compétiteur 1...).

1) Mes 16 graphiques se ressemblent (ce qui m'arrange, compte-tenu de mon hypothèse de recherche). Je veux dire que les courbes semblent varier de la même façon en fonction du temps. Ai-je un moyen statistique pour savoir s'ils diffèrent significativement les un des autres (et donc si je peux les moyenner) ?

2) Chacun de mes graphiques comporte 3 grandes phases. Dans l'intervalle de temps 1 (sans stimulus), les 4 images semblent être regardées de manière identique (à peu près 25% chacune), dans l'intervalle 2 (apparition du premier stimulus), les taux de regard vers la cible et vers le compétiteur 1 augmentent alors que ceux vers le compétiteur 2 et le ditracteur diminue. Dans l'intervalle 3 (second stimulus), le taux de regard pour la cible augmente et finit par atteindre un plafond, le taux de regard pour le compétiteur 1 se met à chuter et les taux de regard pour le compétiteur 2 et le distracteurs continuent de chuter (pour arriver à 0).
--> Y'a-t-il un moyen de montrer que ces intervalles ne sont pas le fruit de mon imagination mais qu'ils correspondent à une réalité concrète (pourrait-on, par exemple, utiliser la méthode des groupes latents pour les mettre à jour ? Je ne sais pas si j'ai le droit d'appliquer ça dans ce contexte) ?
--> Comment montrer que dans l'intervalle 1 les différences observées ne sont pas significatives (enfin j'espère !) ? Y'a-t-il un test qui peut s'appliquer sur la pente d'une courbe (même si il ne s'agit pas vraiment d'une courbe puisque je n'ai pas de fonction mathématique...) ?
--> Comment montrer que les variations observées dans les intervalles 2 et 3 sont significatives ?

D'après mes lectures, le seul test qui m'inspire un peu pour répondre à ma deuxième question serait une analyse de variance ANOVA en mesure répétées. Mais je ne sais pas si je peux faire ça avec 4 groupes en même temps (mes 4 courbes).

Voilà... J'espère que j'ai suffisament expliquer mon problème. Je vous assure que je me creuse la tête la dessus depuis quelque temps déjà, j'ai consulté des livres de stats pleins de formules mais mon niveau en maths m'empêche de suivre les raisonnements mathématiques plus poussés que ceux utilisés pour le Chi-2 ou le t de student (et encore, pour une étudiante en linguistique, je trouve que je m'en sors pas mal... Wink ).

A vous tous qui avez eu la patience de me lire (et même si vous ne pouvez pas me répondre), j¨'espère que vous avez passé un joyeux Noël et je vous souhaite le meilleur pour 2011 !

Pepsiglass

pepsiglass

Nombre de messages : 12
Age : 37
Localisation : Tours
Date d'inscription : 28/12/2010

Revenir en haut Aller en bas

Aide analyse données de mon mémoire Empty Re: Aide analyse données de mon mémoire

Message par Ordin Mar 4 Jan 2011 - 21:06

Bonsoir,
J'ai regardé un peu votre problème. C'est un problème de comparaison de courbes que traitent les anova fonctionnelles (fANOVA si vous avez le temps de regarder sur internet).
A ma connaissance, il n'y a pas de test statistique global permettant de comparer des courbes. En gros le problème est qu'il y a beaucoup de données pour chaque courbe et si on fait des tests points par points le seuil de signification n'est plus utilisable (inflation du risque alpha dans la littérature). Donc l'idée générale est de réduire chaque courbe à quelques données "bien représentatives" et/ou de maitriser ce risque alpha.

Je vous sent perplexe mais ne nous décourageons pas!!

Premièrement c'est un mémoire de linguistique donc, à mon avis, on ne vous demande pas de dévopper des techniques stats maths sophistiquées que vous n'aurez certainement pas le temps d'assimiler, de maitriser et de défendre devant un jury qui au mieux va s'ennuyer parce qu'il ne comprend rien, au pire va poser la petite question piège qu'il a déja entendu quelque part. Donc il faut faire clair et utile et pour cela coller aux données et à la problématique.
Deuxièmement, la stat et les tests en particuliers ne vont pas "sortir" une idée ou une théorie. Elles vont permettrent de décrire, synthétiser les données et de confirmer ou non une hypothèse dans un cadre bien précisé.

Pour en venir au fait voilà ce que je propose :
- Déja, bien avoir en mémoire la problématique, pourquoi on a receuilli ces données, à quoi vont elles servir, qu'est ce qu'on veut montrer.
- Ensuite faire tout un travail de description des données avec des graphiques, des caractéristiques.
Vous pouvez faire pour chaque "image" un graphique donnant les 16 courbes et la courbe moyenne. On peut ajouter deux courbes donnant un intervalle à 95% en faisant en chaque point la moyenne + - 1.96 x écart-type (J'ajoute que pour être plus rigoureux, il vaudrait mieux faire ceci avec la médiane et l'intervalle interquartile).
Ceci permettra de "voir" si les courbes s'écartent de la moyenne, si des points ou des courbes sont très différentes des autres (données abérrantes). Puis voir pourquoi ces données sont différentes et éventuellement les corriger ou les supprimer de l'analyse.
On peut aussi faire la même chose avec l'ensemble des courbes (on verra peut être apparaitre 4 groupes correspondant aux 4 images).
Il y a aussi d'autres visualisations possibles avec des box plots ou en faisant une ACP (Analyse en composantes principales). Je pourrai détailler si vous voulez.
- Après vous avez cette décomposition en 3 phases qui semble intéressante car elle peut permettre de "réduire " les données. Pour cela vous pouvez essayer d'ajuster, avec les moindres carrés, un modèle sur chacune des phases par ex linéaire si ces morceaux de courbe sont des droites. Ceci permet de n'avoir plus que 6 coefficients par courbes (les 3 pentes et les 3 ordonnées à l'origine) et de pouvoir , enfin, faire des tests.
Ici le genre anova avec un facteur "image" et un facteur "série" semble adapté mais je n'ai pas bien réflichi (la fatigue arrive à cette heure).
Voilà, j'espère vous avoir été utile . Si vous voulez des précisions n'hésitez pas.
Cordialement.

Ordin

Nombre de messages : 6
Date d'inscription : 20/12/2010

Revenir en haut Aller en bas

Aide analyse données de mon mémoire Empty Re: Aide analyse données de mon mémoire

Message par pepsiglass Mer 5 Jan 2011 - 20:28

Merci Ordin !

Je vais regarder de plus près les solutions que vous me proposez. Effectivement c'est un mémoire de linguistique et donc pas besoin d'être ultra balèze en stat normalement mais c'est un master de cognition et le jury sera composé de représentants de différentes disciplines de la cognition donc de gens probablement plus calés que moi en stat. Je veux donc faire du mieux possible. Et puis, pour ma conscience perso, je préfère ne rien laisser au hasard !
Je sais bien que les stats ne vont pas faire sortir une théorie du chapeau. En fait ma théorie c'est que le regard vers l'une ou l'autre des images est influencé par les stimuli linguistiques (et donc que les courbes se mettent à "bouger" une centaine de millisecondes après certains mots perçus). J'aimerai être en mesure d'affirmer que les variations observées ne sont pas le fruit du hasard. Car même si les stats ne font pas la théorie, mal interprétées, elles peuvent conduire à admettre une mauvaise hypothèse ou à en rejeter une bonne.
Je vais appliquer le traitement que vous me conseillez pour repérer les données abérrantes (au cas où mon logiciel ne les ai pas déjà considéré comme telles puisqu'il est censé le faire), en espérant faire ressortir les 4 groupes d'images, ce qui me permettrait de justifier un traitement de groupe (et pas série par série).
Merci pour l'idée de "réduire" les données, je connaissais la technique, mais je n'y avais tout bêtement pas pensé ! En plus, les 3 phases ont l'air d'être assez facilement modélisables en linéaire !
Je vais continuer à réfléchir là-dessus mais en tout cas je vous remercie pour vos conseils !
Cordialement.

pepsiglass

Nombre de messages : 12
Age : 37
Localisation : Tours
Date d'inscription : 28/12/2010

Revenir en haut Aller en bas

Aide analyse données de mon mémoire Empty Re: Aide analyse données de mon mémoire

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum