Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

Le deal à ne pas rater :
Pokémon EV06 : où acheter le Bundle Lot 6 Boosters Mascarade ...
Voir le deal

besoin d'aide SVP!!!

Aller en bas

besoin d'aide SVP!!! Empty besoin d'aide SVP!!!

Message par amina Sam 19 Avr 2008 - 17:44

Bonsoir.Smile
je me présente:je suis une éléve ingénieur en statistique et analyse de l'information.
j'ai un trés grand probléme en mon projet de fin d'année et j'espére que vous pouvez m'aider.Crying or Very sad
j'ai une base de données composée de 7129 génes et 38 cellules cancéreuses(leucémie), chaque géne s'exprime dans cette cellule, donc ma base est en fait les expression de ces 7129 génes dans les 38 cellules(ie, chaque géne a 38 observations)(une expression est une valeur numérique).
ces cellules sont infectées par deux types de leucémie, soient 1 et 2 pour vous simplifier.
il ya des génes dont l'expression change d'un type à un autre,ce sont nommés les génes informatifs, et par contre il ya des génes qui n'ont aucune différence au niveau d'expres​sion(ie, pour toutes les cellules, il garde la mème expression que ce soit elle est infectée ou non) , et sont nommés les gènes non informarifs.
mon projet consiste à identifier les génes informatifs parmi ces 7129 génes et puis faire une classification de ces génes pour trouver enfin deux classes, classe de type 1 et une classe de type 2 qui contiennent les génes appropriés pour chaque type.
et là je me bloque car:
-R ne peut me faire une analyse descriptive pour tt ces génes(mémoire insuffisante):çad, moyenne, variance, coef de variation, et surtout le box plot.
-normalement les échantillons ne suivent pas la loi normale, et c pour ça qu'on passe aux tests non paramétriques, mais g pas pu faire les tests de normalité avec R pour tt ces génes(le test se fait géne par géne pour les 7129 gènes) pour vérifier qu'ils ne sont pas normales!!
-en passant à la statistique inférntielle(test stat), je sais pas comment appliquer le test de wilcoxon(qui me permet de détecter les génes différentiellement exprimés) pour tt ces génes,
-aprés le test de wilcoxon, je dois récupérer les génes différentiellement exprimés (çad ceux dont a accepté l'hypothése de différence via le test de wilcoxon )
c'est la premiére aprtie de mon travail, car aprés la récupération de génes informatifs,je dois faire la classification....
j'espére bien que j'étais un peu claire et vraiment j'ai besoin de votre aide énormément.
merci d'avance.

amina

Nombre de messages : 5
Date d'inscription : 19/04/2008

Revenir en haut Aller en bas

besoin d'aide SVP!!! Empty Re: besoin d'aide SVP!!!

Message par Invité Lun 21 Avr 2008 - 8:31

Bonjour,

Pour ce qui est de R tu peux lui augmenter la mémoire allouée, je viens perso de créer un data.frame de 38 lignes et 7129 colonnes sans problèmes. Une des façons de faire est de créer un raccourci pour R. Yne fois que tu l'as crée tu fais un clique droit, propriétés "Raccourci". Dans la case "cible", après le texte correspondant au chemin tu peux rajouter la commande suivante : --max-mem-size=209715200, si tu veux allouer jusqu'à 200Mo de mémoire pour R. (200*1024^4). Ce qui te donne un truc du genre : "C:\Program Files\R\R-2.6.2\bin\Rgui.exe" --max-mem-size=209715200. Tu dois pouvoir aussi augmenter cette mémoire en tapant dans R memory.limit(size=200).
Après tu pourras très bien tester la normalité de tes 7129 gènes avec un truc du genre apply(tab,2,function(x) shapiro.test(x)$p.value).

Après je ne sais pas exactement ce que tu mesures pour chaque gène et j'avoue avoir du mal à voir ce que tu veux.

micros

Invité
Invité


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum