anipassion.com

Précisions pour analyse des données d'un mémoire

Voir le sujet précédent Voir le sujet suivant Aller en bas

Précisions pour analyse des données d'un mémoire

Message par lemecdu13 le Jeu 2 Mai 2013 - 21:51

Bonjour à tous,

Je me dirige vers vous au regard de la qualité apparente des interventions présentes sur ce forum.

Je vais essayer de vous présenter mes problèmes de la manière la plus synthétique possible.

Je suis actuellement entrain de rédiger mon mémoire. L'analyse générale de mes données ne m'a pas posé de problèmes. J'ai ainsi pu à partir de questionnaires et de recueil de données concernant des populations différentes, aboutir à des conclusions sur la base d'histogrammes simples (comparaison de variations, comparaison de moyenne...). Or, là ou ça se complique, c'est que je dois pouvoir vérifier la "normalité" de ma population et vérifier mes hypothèses de manière statistique pour dire si elles sont significatives (P inf. à 0.05).

Après de nombreuses lectures, j'ai téléchargé Xls STAT et l'ai installé sur mon PC en démo. Mais maintenant je bloque depuis plusieurs jours sur l'utilisation du bon test (je n'ai jamais fait de stats).

Voici donc mes données et ce que je veux faire :

J'ai une classe de seconde composée de 35 élèves.

Questionnaire de départ :

1) Fais tu du sport ?
a) Régulièrement.
b) Peu.
c) Jamais.


Test réalisé ensuite : réaliser un "entraînement intense"



Recueil de données et hypothèses :
A) La variation des paramètres de l'entraînement entre ce qui est prévu et ce qui est réalisé, est différente chez ceux qui font du sport régulièrement, peu ou jamais (en résumé on voit que le % de variation diminue avec l'augmentation du vécu sportif).
B) Les élèves répondent à des questions à chaque exercice de l'entraînement sous la forme "je coche OUI, je coche PEU, je coche NON" (en résumé on voit qu'il y a plus de OUI, de NON, de PEU, dans certains groupes que dans d'autres).


Voici donc mes questions :
1 ) Quel test dois-je utiliser pour vérifier la normalité de ma population initiale ? et est-ce nécessaire ? (en d'autres termes, est ce problématique par rapport à mes questionnaires, si j'ai une classe avec beaucoup d'élèves qui font "régulièrement du sport", et peu d'élèves appartenant aux groupes "peu de sport" et "jamais de sport"). Est ce que le fait que ma population ne soit pas équitablement répartie m'empêche d'exploiter mes données ? (ce qui bloquerait tout mon travail).
2 ) Quel test dois-je utiliser pour voir si les différences de variations de pourcentage d'un échantillon à un autre sont significatives ? Je précise et c'est ça qui me bloque, que mes échantillons ne sont pas composés du MEME nombre d'élèves (j'ai par exemple 15 régulièrement sportifs, 5 peu sportifs et 10 non sportifs), les tests utilisés pour l'instant sur XL STAT ne me donnent donc pas de conclusion possible à cause du nombre de données différentes pour chaque variable :s
3 ) Même question que précédemment mais pour comparer des réponses de type "OUI, PEU, NON" dans mes différents échantillons.

Je vous remercie grandement d'avance pour ceux qui auront le courage de me lire et surtout de me répondre.

lemecdu13

Nombre de messages : 3
Date d'inscription : 02/05/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Précisions pour analyse des données d'un mémoire

Message par joyeux_lapin13 le Ven 3 Mai 2013 - 12:41

1) Ca sert à rien de tester la normalité sur des données nominales... c'est réservé aux variables continues. Pour ta seconde question, tout dépend de la répartition des effectifs dans chacune de tes modalités/réponses aux questions sur tes 3 groupes. Il faut savoir que les outils statistiques développés et utilisés s'adaptent assez bien à des répartitions bancales (heureusement sinon on en ferait jamais de stat dans certain domaine d'application...) mais il y a une limite à ne pas franchir qui est, selon moi, pas théorique mais logique, si tu as un groupe de 40 individus et un autre de 3 il est évident que ça sert à rien de faire autre chose que du visuelle... C'est pour ça que la première phase d'une étude statistique est le nettoyage/optimisation des données qui consistent, dans ton cas, peut-être à regrouper les "peu de sport" avec les "jamais de sport" si tu es en dessous de la limite acceptable logique.

2) Puisque tu es sur des données qualitatives et non numériques, tu vas devoir t'orienter vers des tests du chi2 voir de Fisher's exact (dont tu peux t'affranchir si xlstat permet de procéder à une estimation du chi2 par approche MCMC) ou si tes effectifs sont vraiment trop déséquilibré faire du quantitatif avec un V de Cramer moins biaisé par cet effet (le Chi2 ayant la mauvaise tendance a aussi bien détecté un effet univarié que bivarié).

joyeux_lapin13

Nombre de messages : 1674
Age : 33
Localisation : Mayotte
Date d'inscription : 21/04/2010

Voir le profil de l'utilisateur https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

Re: Précisions pour analyse des données d'un mémoire

Message par lemecdu13 le Sam 4 Mai 2013 - 9:17

Bonjour,

Merci pour votre réponse.

En ce qui concerne ma population par rapport au questionnaire, je n'ai donc pas besoin de vérifier sa "normalité" par rapport aux différents groupes.

En revanche, concernant le second point je rencontre des problèmes. Xlstat me propose effectivement le test du khi2 (avec possibilité de sélectionner ou non le test de fisher's exact). Cependant, lorsque je sélectionne mes deux colonnes qui correspondent à mes deux échantillons : colonne A pour le groupe "sportif" et colonne B pour le groupe "non sportif", le test me dit que les données ne peuvent être comparées car il n'y a pas le même nombre de valeurs dans chacune d'entre elles.

Dès lors :
1) Comment faire pour comparer deux échantillons en ayant un nombre différent de personnes dans chacun d'entre-eux ?
2) Comment comparer 3 échantillons ? (le test du khi² semble se limiter à 2 groupes à comparer).

lemecdu13

Nombre de messages : 3
Date d'inscription : 02/05/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Précisions pour analyse des données d'un mémoire

Message par joyeux_lapin13 le Sam 4 Mai 2013 - 12:15

En ce qui concerne ma population par rapport au questionnaire, je n'ai donc pas besoin de vérifier sa "normalité" par rapport aux différents groupes.

Simple précision car c'est toi et non moi qui a les données sous les yeux: si pas de variables continues alors pas de normalité à tester.

1) Comment faire pour comparer deux échantillons en ayant un nombre différent de personnes dans chacun d'entre-eux ?
2) Comment comparer 3 échantillons ? (le test du khi² semble se limiter à 2 groupes à comparer).

Je ne comprend pas... si tu m'avais parlé du test de Fisher alors je t'aurais dit qu'en fonction du logiciel en effet la version pour tableau n x n n'est pas toujours implémenté et qu'il faut alors s'orienter vers la version MCMC du test du Chi2, mais s'il s'agit bien du test du Chi2 alors sa formule est universelle et en aucun cas limitable à la taille du tableau. Désolé pour cette réponse par l'absurde mais il n'y a aucune raison pour que tu ne puisses faire ton test.

joyeux_lapin13

Nombre de messages : 1674
Age : 33
Localisation : Mayotte
Date d'inscription : 21/04/2010

Voir le profil de l'utilisateur https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

Re: Précisions pour analyse des données d'un mémoire

Message par lemecdu13 le Sam 4 Mai 2013 - 15:17

Effectivement, j'ai pu sélectionner uniquement le test du khi² en ajoutant la méthode de Monte Carlo et en supprimant "test exact de fisher" (il a fallu que je choisisse "d'ignorer les cases vides" qu'il me signalait). J'ai pu utiliser le test avec un tableau de contingence mettant en lien 3 paramètres pour les x (jamais, peu, régulièrement) et 3 paramètres pour les y (oui, peu, non) en mettant les effectifs dans les cases.

J'arrive donc à faire la moitié du boulot.

Par contre, je butte toujours sur l'autre partie, car il ne s'agit pas de réponses, mais de pourcentage de variation d'un essai à l'autre. Y a t-il une autre manière d'exploiter le khi² que dans un tableau de contigence simple ? Je pourrais faire un tableau du type pour les x (jamais, peu, régulièrement) et pour les y (Pourcentage de 0 à 5% de variation, de 5% à 10%......), mais ça ne m'intéresse pas de trier comme ça.

lemecdu13

Nombre de messages : 3
Date d'inscription : 02/05/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Précisions pour analyse des données d'un mémoire

Message par Contenu sponsorisé Aujourd'hui à 20:23


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum