Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Problème en analyse de données
3 participants
Page 1 sur 1
Problème en analyse de données
Bonjour,
J'ai un problème sur la méthode d'analyse de ces données. En fait moi je chercher à faire sortir des infos de ce tableau. si je veux tracer des courbe pour chaque individu en fonction du temps. (j'ai des données de 106000 lignes (4000 individus))
si qqn a une comment voire s'il y a relation entre les modalité de "examen".
merci d'avance pour votre aide
tt conseil ou toute idée est la bienvenue
code sexe age service examen resultat date
1 M 34 réanimation chlore 12 2016-02-03 13:05:27.000
1 M 34 réanimation calcium 23 2016-02-03 13:05:27.000
1 M 34 cardiologie glucose 0,9 2016-02-03 13:05:27.000
1 M 35 cardiologie chlore 16 2016-02-03 13:05:27.000
1 M 35 cardiologie glucose 2 2016-02-03 13:35:27.001
2 F 12 pédiatrie glucose 2 2015-12-03 10:51:44.000
2 F 12 pédiatrie proteine 35 2015-12-03 10:51:44.000
2 F 12 pédiatrie sodium 137 2015-12-03 10:51:44.000
2 F 12 pédiatrie glucose 1,9 2015-12-04 10:51:45.000
2 f 12 pédiatrie calcium 151 2015-12-04 10:51:45.000
2 F 12 pédiatrie albumine 34 2015-12-04 10:51:45.001
3 F 23 pneumologie triglycéride 1,18 2015-11-03 12:17:26.000
3 F 23 pneumologie glucose 3 2015-11-03 12:17:26.000
3 F 23 pneumologie ACE 34 2015-11-03 12:17:26.000
3 F 23 pneumologie bilirubine 64 2015-11-04 12:59:31.000
3 F 23 pneumologie glucose 2,03 2015-11-04 12:59:32.000
3 f 23 pneumologie triglycéride 1,16 2015-11-04 12:59:32.000
J'ai un problème sur la méthode d'analyse de ces données. En fait moi je chercher à faire sortir des infos de ce tableau. si je veux tracer des courbe pour chaque individu en fonction du temps. (j'ai des données de 106000 lignes (4000 individus))
si qqn a une comment voire s'il y a relation entre les modalité de "examen".
merci d'avance pour votre aide
tt conseil ou toute idée est la bienvenue
code sexe age service examen resultat date
1 M 34 réanimation chlore 12 2016-02-03 13:05:27.000
1 M 34 réanimation calcium 23 2016-02-03 13:05:27.000
1 M 34 cardiologie glucose 0,9 2016-02-03 13:05:27.000
1 M 35 cardiologie chlore 16 2016-02-03 13:05:27.000
1 M 35 cardiologie glucose 2 2016-02-03 13:35:27.001
2 F 12 pédiatrie glucose 2 2015-12-03 10:51:44.000
2 F 12 pédiatrie proteine 35 2015-12-03 10:51:44.000
2 F 12 pédiatrie sodium 137 2015-12-03 10:51:44.000
2 F 12 pédiatrie glucose 1,9 2015-12-04 10:51:45.000
2 f 12 pédiatrie calcium 151 2015-12-04 10:51:45.000
2 F 12 pédiatrie albumine 34 2015-12-04 10:51:45.001
3 F 23 pneumologie triglycéride 1,18 2015-11-03 12:17:26.000
3 F 23 pneumologie glucose 3 2015-11-03 12:17:26.000
3 F 23 pneumologie ACE 34 2015-11-03 12:17:26.000
3 F 23 pneumologie bilirubine 64 2015-11-04 12:59:31.000
3 F 23 pneumologie glucose 2,03 2015-11-04 12:59:32.000
3 f 23 pneumologie triglycéride 1,16 2015-11-04 12:59:32.000
bech- Nombre de messages : 4
Date d'inscription : 29/09/2016
Re: Problème en analyse de données
Bonjour,
Ton message est trop confus. On ne comprend rien de ce que tu souhaites faire. Tu parles de courbes par individu sans préciser ce que tu veux exprimer en fonction du temps puis tu parles de lien entre des modalités de "examen" et tout ça sans dire ce qu'est réellement l'objectif avec ces données à part dire que tu veux faire sortir des infos...
Un peu de précision serait la bienvenue.
Nik
Ton message est trop confus. On ne comprend rien de ce que tu souhaites faire. Tu parles de courbes par individu sans préciser ce que tu veux exprimer en fonction du temps puis tu parles de lien entre des modalités de "examen" et tout ça sans dire ce qu'est réellement l'objectif avec ces données à part dire que tu veux faire sortir des infos...
Un peu de précision serait la bienvenue.
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Problème en analyse de données
Entièrement d'accord avec Nik. On a l'impression que la question vient d'un médecin (ou étudiant en médecine) auquel son patron à demander de tirer quelque chose d'un gros tableau de données. Ce n'est pas la bonne démarche, je le crains. La bonne démarche est d'avoir une question (au besoin plusieurs) et - ensuite - de cherche comment y répondre à partir des données. En d'autres termes, quelque(s) est(sont) la(les) question(s) à la quelle (auxquelles) on veut répondre ici ?
Eric.
Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Problème en analyse de données
oui je suis tout a fait d'accord avec vous, moi même je suis perdue dans ce sujet. en fait je fais une thèse de statistique sur la régression mutivariée. en plus je dois travailler pour un biochimiste sur ces données. lui il veut explorer ces données on en tirant un max d'infos. mais pour moi j'arrive pas à voir ce qu'il faut faire.
Pour les courbes par individus, je pensais à faire graphe d'évolution de chaque examen par rapport au temps. mais le problème est que la date est sous forme de date (jj/mm/aaaa) et heure. jje suis désespérée:cry:
Pour les courbes par individus, je pensais à faire graphe d'évolution de chaque examen par rapport au temps. mais le problème est que la date est sous forme de date (jj/mm/aaaa) et heure. jje suis désespérée:cry:
bech- Nombre de messages : 4
Date d'inscription : 29/09/2016
Re: Problème en analyse de données
Au risque de me répéter, "explorer les données en tirant un max d'info" ne rime à rien. Il faut avoir d'abord des questions, et ensuite voir comment répondre à ces questions à partir des données. On ne pourra guère vous aider s'il n'y a pas de question(s) à priori. Au besoin, vous devez répondre ceci au biochimiste pour lequel vous travaillez.
Pour la gestion des données de date, c'est un problème de manipulation de données, pas un problème statistique. Et ce problème ne devrait (en théorie) ne pas en être un pour quelqu'un comme vous qui fait une thèse de stat sur la régression multivariée !
Cordialement, Eric.
Pour la gestion des données de date, c'est un problème de manipulation de données, pas un problème statistique. Et ce problème ne devrait (en théorie) ne pas en être un pour quelqu'un comme vous qui fait une thèse de stat sur la régression multivariée !
Cordialement, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Problème en analyse de données
Merci pour votre réponse Eric,
Ok pour la première partie.
Pour la deuxième partie, certe je fais une thèse mais après un arrêt de dix ans c'est pour ça que je me sens perdue. j'ai essayé de dispatcher la date de l'heure, et la date je l'ai transformé en trois col (jour, mois, année). que pensez-vous?
Je m'excuse pour ces questions
Ok pour la première partie.
Pour la deuxième partie, certe je fais une thèse mais après un arrêt de dix ans c'est pour ça que je me sens perdue. j'ai essayé de dispatcher la date de l'heure, et la date je l'ai transformé en trois col (jour, mois, année). que pensez-vous?
Je m'excuse pour ces questions
bech- Nombre de messages : 4
Date d'inscription : 29/09/2016
Re: Problème en analyse de données
Bech,
On ne peut rien penser car on ne sait toujours pas quel est réellement l'objectif : les questions scientifiques posées et pour lesquelles ces données sont utilisées.
Tu parles d'examen en fonction du temps, mais la variable "examen" est, sauf erreur, une variable nominale et non numérique. Je ne vois donc pas bien quelle graphique tu veux faire. Et surtout, pourquoi représenter cette évolution ? Quelle est la question scientifique ? C'est à ton biochimiste de te donner ces orientations et à toi de les traduire en analyses adéquates en sachant lui dire non s'il est à côté de la plaque en termes de prérequis statistiques.
Pour revenir à la gestion des dates dans R, il existes différents formats de date dans R avec leurs avantages et leurs inconvénients (POSIX, Date...) et des fonctions associées pour les manipuler. Donc encore une fois tout dépend de ce que tu souhaites faire et il te restera de toute façon à lire pas mal de doc car on ne pourra t'orienter bien plus que ce que je viens de faire si tu n'arrives pas avec un minimum d'essai de code et un objectif clair.
Nik
On ne peut rien penser car on ne sait toujours pas quel est réellement l'objectif : les questions scientifiques posées et pour lesquelles ces données sont utilisées.
Tu parles d'examen en fonction du temps, mais la variable "examen" est, sauf erreur, une variable nominale et non numérique. Je ne vois donc pas bien quelle graphique tu veux faire. Et surtout, pourquoi représenter cette évolution ? Quelle est la question scientifique ? C'est à ton biochimiste de te donner ces orientations et à toi de les traduire en analyses adéquates en sachant lui dire non s'il est à côté de la plaque en termes de prérequis statistiques.
Pour revenir à la gestion des dates dans R, il existes différents formats de date dans R avec leurs avantages et leurs inconvénients (POSIX, Date...) et des fonctions associées pour les manipuler. Donc encore une fois tout dépend de ce que tu souhaites faire et il te restera de toute façon à lire pas mal de doc car on ne pourra t'orienter bien plus que ce que je viens de faire si tu n'arrives pas avec un minimum d'essai de code et un objectif clair.
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Problème en analyse de données
Merci Nik, je parlerai à mon biochimiste
désolée pour ces répétitions
désolée pour ces répétitions
bech- Nombre de messages : 4
Date d'inscription : 29/09/2016
Sujets similaires
» Problème normalisation données
» Boxplot, problème données manquantes - debutante
» problème tranformer des données, résidus non normaux
» Problème analyse de données avec R (ACM)
» Problème d'importation des données R vers Excel
» Boxplot, problème données manquantes - debutante
» problème tranformer des données, résidus non normaux
» Problème analyse de données avec R (ACM)
» Problème d'importation des données R vers Excel
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum