Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Analyse discriminantes conditions d'application
2 participants
Page 1 sur 1
Analyse discriminantes conditions d'application
Bonsoir à tous !
Voici mon petit soucis de statistique :
Contexte :
Je dispose des données de 5 individus : pour chacun 40 vocalisations sur lesquelles je mesure 8 paramètres acoustiques (la durée du cri, la fréquence maximale etc).
Mon but est de determiner qu’un individu possède des caractéristiques acoustiques qui lui sont propres et qu’en gros on peut le reconnaitre à son cri. Je fais donc une analyse discriminante (DFA).
J’en arrive aux problèmes : les conditions d’application de la DFA !
1 - aucune de mes variables (les 8 paramètres acoustiques) ne suit de loi normale (test de Kolmogorov Smirnov) . J’ai essayé de les transformer pour quelques-une (log (X), 1/X , racine(X) …) mais cela ne marche pas très bien.
J’ai entendu dire qu’il est possible de reperer quelles valeurs sont « anormales », ce qui me permettrait de les exclure de mon analyse et obtenir des variables normales , mais je ne sais pas du tout comment m’y prendre pour trouver ces valeurs ! J’utilise surtout le logiciel Statistica mais j’ai aussi accès à R si besoin, est ce qu’il existe une fonction qui permet de signaler ces brebis égarées ?
La deuxième option à laquelle j’avais pensé c’est faire malgré tout ma DFA (qui donne par ailleurs des résultats très jolis ) en considérant que comme l’ANOVA, elle est suffisemment robuste à la non-normalité, pourvu que le N soit assez grand (ici 200) et que graphiquement les distributions ne soient pas exagérement éloignées d’une distribution normale. Mais cela sort peut etre tout droit de mon imagination et n’est peut être pas du tout vrai ???
2- Certaines de mes variables sont corrélées entre elles (j’ai fait une correlation de Pearson) pour ne pas dire toutes. Or j’ai cru voir aussi qu’une des conditions pour pouvoir réaliser une DFA dans de bonnes conditions était que les variables ne soient pas fortement correlées entre elles … Mais que veut dire fortement ???
Voila j’espère que je ne me suis pas trop embrouillée dans la présentation de ma demande d’aide !
Si quelqu’un peut m’éclairer ce serait super !!!
Merci beaucoup beaucoup !!
Voici mon petit soucis de statistique :
Contexte :
Je dispose des données de 5 individus : pour chacun 40 vocalisations sur lesquelles je mesure 8 paramètres acoustiques (la durée du cri, la fréquence maximale etc).
Mon but est de determiner qu’un individu possède des caractéristiques acoustiques qui lui sont propres et qu’en gros on peut le reconnaitre à son cri. Je fais donc une analyse discriminante (DFA).
J’en arrive aux problèmes : les conditions d’application de la DFA !
1 - aucune de mes variables (les 8 paramètres acoustiques) ne suit de loi normale (test de Kolmogorov Smirnov) . J’ai essayé de les transformer pour quelques-une (log (X), 1/X , racine(X) …) mais cela ne marche pas très bien.
J’ai entendu dire qu’il est possible de reperer quelles valeurs sont « anormales », ce qui me permettrait de les exclure de mon analyse et obtenir des variables normales , mais je ne sais pas du tout comment m’y prendre pour trouver ces valeurs ! J’utilise surtout le logiciel Statistica mais j’ai aussi accès à R si besoin, est ce qu’il existe une fonction qui permet de signaler ces brebis égarées ?
La deuxième option à laquelle j’avais pensé c’est faire malgré tout ma DFA (qui donne par ailleurs des résultats très jolis ) en considérant que comme l’ANOVA, elle est suffisemment robuste à la non-normalité, pourvu que le N soit assez grand (ici 200) et que graphiquement les distributions ne soient pas exagérement éloignées d’une distribution normale. Mais cela sort peut etre tout droit de mon imagination et n’est peut être pas du tout vrai ???
2- Certaines de mes variables sont corrélées entre elles (j’ai fait une correlation de Pearson) pour ne pas dire toutes. Or j’ai cru voir aussi qu’une des conditions pour pouvoir réaliser une DFA dans de bonnes conditions était que les variables ne soient pas fortement correlées entre elles … Mais que veut dire fortement ???
Voila j’espère que je ne me suis pas trop embrouillée dans la présentation de ma demande d’aide !
Si quelqu’un peut m’éclairer ce serait super !!!
Merci beaucoup beaucoup !!
ManaM- Nombre de messages : 12
Date d'inscription : 18/05/2012
Re: Analyse discriminantes conditions d'application
Pour la normalisation, as-tu testé une transformation boxcox?
Et ce que tu appelles DFA c'est bien l'analyse discriminante de Fisher?
Par contre je n'ai pas très bien compris comment se configure ta base de données, mais combien as-tu d'observations? Disons qu'en dessous d'un certain nombre d'observation, une transformation boxcox peut amener un certain sur-apprentissage du modèle que tu vas concevoir sur les données que tu auras normalisés via cette méthodo.
Et ce que tu appelles DFA c'est bien l'analyse discriminante de Fisher?
Par contre je n'ai pas très bien compris comment se configure ta base de données, mais combien as-tu d'observations? Disons qu'en dessous d'un certain nombre d'observation, une transformation boxcox peut amener un certain sur-apprentissage du modèle que tu vas concevoir sur les données que tu auras normalisés via cette méthodo.
Re: Analyse discriminantes conditions d'application
Merci pour la réponse super rapide !
Oui c’est bien une analyse disciminante de Fisher
Alors du coup je n’avais pas essayé la tranformation de box cox, je viens de le faire, 2 variables sur les 8 deviennent normales avec cette méthode.
Voici comment se présentent mes données :
Caractéristiques
acoustiques :.................Dt..............Fmax..............Fmin................Fpic …
Indiv 1 cri 1.................0.078............3174..............1495...............2467
Indiv 1 cri 2.................0.089............2771..............1342...............2503
Indiv 1 cri 3.................0.024............5272..............4379...............4915
…
Indiv 1 cri 40...............0.68..............3129..............1699...............2950
Indiv 2 cri 1.................0.11..............6843..............1570...............6316
…
Indiv 2 cri 40...............0.16...............7019.............1394...............6931
…
Indiv 5 cri 40...............0.088.............7148..............1342..............7059
Au total j’ai 200 observations (les cris) , 8 variables acoustiques, 5 individus différents
Oui c’est bien une analyse disciminante de Fisher
Alors du coup je n’avais pas essayé la tranformation de box cox, je viens de le faire, 2 variables sur les 8 deviennent normales avec cette méthode.
Voici comment se présentent mes données :
Caractéristiques
acoustiques :.................Dt..............Fmax..............Fmin................Fpic …
Indiv 1 cri 1.................0.078............3174..............1495...............2467
Indiv 1 cri 2.................0.089............2771..............1342...............2503
Indiv 1 cri 3.................0.024............5272..............4379...............4915
…
Indiv 1 cri 40...............0.68..............3129..............1699...............2950
Indiv 2 cri 1.................0.11..............6843..............1570...............6316
…
Indiv 2 cri 40...............0.16...............7019.............1394...............6931
…
Indiv 5 cri 40...............0.088.............7148..............1342..............7059
Au total j’ai 200 observations (les cris) , 8 variables acoustiques, 5 individus différents
ManaM- Nombre de messages : 12
Date d'inscription : 18/05/2012
Re: Analyse discriminantes conditions d'application
Il n'y a pas un biais flagrant ici entre le fait de faire un modèle qui suppose que chaque observation est indépendante de l'autre et justement le fait qu'elle soit indépendante 5 par 5? Attention, il existe des algorithmes sur-mesures basés sur l'échantillonnage de Gibbs et les processus Markovien dans le cas de corrélation entre observation...
Outre celà, tu as assez d'échantillon pour normaliser, personnellement je normalise au delà de 80 observations, en dessous je prends le risque de ne pas normaliser sauf par une transformation logarithmique, mais bon après je ne fais pas de la classification avec la même confiance de généralisation non plus.
Concernant la multicolinéarité, forcément plus il y en a moins ton nuage de point est dispersé, aussi un classifieur linéaire souffre et encore plus un classifieur quadratique... mais ce n'est pas propre à cet outil là, c'est le triste lot de toutes les méthodos de modélisation et de classification.
Enfin, quel seuil de confiance prends-tu pour conclure à la normalité ou non d'une variable?
Outre celà, tu as assez d'échantillon pour normaliser, personnellement je normalise au delà de 80 observations, en dessous je prends le risque de ne pas normaliser sauf par une transformation logarithmique, mais bon après je ne fais pas de la classification avec la même confiance de généralisation non plus.
Concernant la multicolinéarité, forcément plus il y en a moins ton nuage de point est dispersé, aussi un classifieur linéaire souffre et encore plus un classifieur quadratique... mais ce n'est pas propre à cet outil là, c'est le triste lot de toutes les méthodos de modélisation et de classification.
Enfin, quel seuil de confiance prends-tu pour conclure à la normalité ou non d'une variable?
Re: Analyse discriminantes conditions d'application
J’ai pris 0.85 comme seuil de confiance pour la normalité. Si je prend 0.95 je gagne 1 variable normale ^^.
Pour ce qui est de la multicolinéarité mon cerveau vient de tilter ! Statistica me sort un tableau récap dans lequel il m’indique la valeur de tolérance (1-R²) pour chaque variable et si cette valeur est inférieur à 0.01 elle est considéré comme redondante et Statistica ne veut pas faire le test.
Donc si j’ai bien compris, même si mes variables sont corrélées ce n’est pas catastrophique puisqu’aucune n’est inférieure à cette valeur seuil, et la seule conséquence serait que la discrimination par la DFA est un peu moins importante, c’est bien ca ? (Désolé pour mon jargon de non statisticienne qui utilise des mots de tous les jours pour decrire ce que vois, je ne connais pas le bon vocabulaire ^^)
Pour ce qui est de la multicolinéarité mon cerveau vient de tilter ! Statistica me sort un tableau récap dans lequel il m’indique la valeur de tolérance (1-R²) pour chaque variable et si cette valeur est inférieur à 0.01 elle est considéré comme redondante et Statistica ne veut pas faire le test.
Donc si j’ai bien compris, même si mes variables sont corrélées ce n’est pas catastrophique puisqu’aucune n’est inférieure à cette valeur seuil, et la seule conséquence serait que la discrimination par la DFA est un peu moins importante, c’est bien ca ? (Désolé pour mon jargon de non statisticienne qui utilise des mots de tous les jours pour decrire ce que vois, je ne connais pas le bon vocabulaire ^^)
ManaM- Nombre de messages : 12
Date d'inscription : 18/05/2012
Re: Analyse discriminantes conditions d'application
En effet la seule chose qui peut t'arriver c'est d'avoir des performances moins bonnes ainsi qu'un manque de cohérence de ton modèle via un excés de redondance...
Bon une chose que tu peux faire, c'est soit faire de la sélection de variables, je sais que sous SAS il y a un mixte de processus FORWARD, STEPWISE, BACKWARD avec le lambda de Wilks pour déterminer le modèle le plus performant parmi les variables que tu lui entres, à voir si ton logiciel propose la même chose. Ca c'est la partie jolie, la partie bourrin c'est de simplement faire toutes les combinaisons de 2 à 8 parmi 8 et de retenir le modèle qui te plait le plus, dans l'industrie pharmaceutique c'est ce qu'on fait, mais là aussi la plupart du temps l'objectif n'est pas d'optimiser la modélisation mais la classification.
Bon une chose que tu peux faire, c'est soit faire de la sélection de variables, je sais que sous SAS il y a un mixte de processus FORWARD, STEPWISE, BACKWARD avec le lambda de Wilks pour déterminer le modèle le plus performant parmi les variables que tu lui entres, à voir si ton logiciel propose la même chose. Ca c'est la partie jolie, la partie bourrin c'est de simplement faire toutes les combinaisons de 2 à 8 parmi 8 et de retenir le modèle qui te plait le plus, dans l'industrie pharmaceutique c'est ce qu'on fait, mais là aussi la plupart du temps l'objectif n'est pas d'optimiser la modélisation mais la classification.
Re: Analyse discriminantes conditions d'application
Ok super!!!!
Merci beaucoup pour ton aide en tout cas! j'y vois beaucoup plus clair
Effectivement mon but est également d'optimiser ma classification et non pas mon modèle et encore même si la classification n'est pas optimale du moment qu'elle fonctionne ca me va
Encore merci merci !!!
Merci beaucoup pour ton aide en tout cas! j'y vois beaucoup plus clair
Effectivement mon but est également d'optimiser ma classification et non pas mon modèle et encore même si la classification n'est pas optimale du moment qu'elle fonctionne ca me va
Encore merci merci !!!
ManaM- Nombre de messages : 12
Date d'inscription : 18/05/2012
Re: Analyse discriminantes conditions d'application
Par contre je reviens sur une chose, qu'en est-il de la corrélation inter-ligne?
Re: Analyse discriminantes conditions d'application
Heuu
Je ne comprends pas très bien la question.
Je suppose qu’il y a une corrélation entre les cris d’un individu identique (interligne pour le même individu) mais je ne l’ai pas testée, c’est bien ça dont tu parles ? Mais je ne vois pas vraiment où tu veux en venir…
Je ne comprends pas très bien la question.
Je suppose qu’il y a une corrélation entre les cris d’un individu identique (interligne pour le même individu) mais je ne l’ai pas testée, c’est bien ça dont tu parles ? Mais je ne vois pas vraiment où tu veux en venir…
ManaM- Nombre de messages : 12
Date d'inscription : 18/05/2012
Re: Analyse discriminantes conditions d'application
C'est exactement ça, tu veux faire un modèle qui va ajuster une frontière linéaire ou quadratique en fonction de tes données, le souci est alors de pouvoir réutiliser ce modèle pour prédire un nouvel individu, mais est-ce que le cri dépend de l'individu ou non? Si non alors tu peux reproduire ton modèle (ce dont je doute), si oui alors ton modèle est inutilisable puisque chaque individu est différent et ton modèle serait faux ou plutot en plein sur-apprentissage (enfn adapté exclusivement à ces individus là).
Maintenant il existe des modèles qui travaille en prenant en compte les corrélations entre observations (notamment dans le domaine des plantes ou souvent plusieurs sous-espèces sont reliées entre eux par rapport à un ancêtre commun et sont liés par rapport à un arbre phylogénétique).
Maintenant il existe des modèles qui travaille en prenant en compte les corrélations entre observations (notamment dans le domaine des plantes ou souvent plusieurs sous-espèces sont reliées entre eux par rapport à un ancêtre commun et sont liés par rapport à un arbre phylogénétique).
Re: Analyse discriminantes conditions d'application
Ahh ok je crois que j'ai compris !
Alors en fait mon étude porte sur un cri particulier de loutres et mon but avec cette DFA était vraiment limité : être capable de dire que les cris de loutres ont des caractéristiques acoustiques propres à chaque individu.
A l'origine j'avais fait un test de Kruskal Wallis suivit de tests de Mann-Whitney pour voir quels paramètres diffèraient en fonction des individus.
Mais une DFA c'est plus simple et plus visuel (et très utilisé en acoustique pour montrer ce genre de choses).
Du coup effectivement cette DFA ne me permet pas de prédire un nouvel individu, mais il reste valable pour mes individus, c'est ça?
Par exemple si j'entre des nouvelles données acoustiques pour lesquelles je ne connais pas l'individu émetteur , si je sais qu'il fait parti de mes 5 individus qui m'ont permis de faire la DFA, alors ça va marcher.
En revanche si les caractéristiques proviennent d'un cri d'un nouvel individu je dois pas utiliser ce modèle.
Donc si je limite l'application de ce modèle à mes 5 individus d'origine je peux l'utiliser. Par contre si je veux le généraliser et prédire de nouveaux individus je dois utiliser les modèles dont tu parles qui prennent en compte les corrélations entre observations.
J'ai bien compris ou je suis à la ramasse?
Alors en fait mon étude porte sur un cri particulier de loutres et mon but avec cette DFA était vraiment limité : être capable de dire que les cris de loutres ont des caractéristiques acoustiques propres à chaque individu.
A l'origine j'avais fait un test de Kruskal Wallis suivit de tests de Mann-Whitney pour voir quels paramètres diffèraient en fonction des individus.
Mais une DFA c'est plus simple et plus visuel (et très utilisé en acoustique pour montrer ce genre de choses).
Du coup effectivement cette DFA ne me permet pas de prédire un nouvel individu, mais il reste valable pour mes individus, c'est ça?
Par exemple si j'entre des nouvelles données acoustiques pour lesquelles je ne connais pas l'individu émetteur , si je sais qu'il fait parti de mes 5 individus qui m'ont permis de faire la DFA, alors ça va marcher.
En revanche si les caractéristiques proviennent d'un cri d'un nouvel individu je dois pas utiliser ce modèle.
Donc si je limite l'application de ce modèle à mes 5 individus d'origine je peux l'utiliser. Par contre si je veux le généraliser et prédire de nouveaux individus je dois utiliser les modèles dont tu parles qui prennent en compte les corrélations entre observations.
J'ai bien compris ou je suis à la ramasse?
ManaM- Nombre de messages : 12
Date d'inscription : 18/05/2012
Re: Analyse discriminantes conditions d'application
En fait là j'ai un doute... je pense qu'il faudrait soit que tu fasses autant de modèle que tu as de type de loutre, soit tu fais un modèle sur ce jeu là complet mais il te faut également l'information du type de loutre (sous forme d'une variable en plus mais à ce moment l'analyse discriminante de Fisher n'est plus adaptée...).
J'a vraiment peur qu'un biais s'instaure, je pense que la modélisation idéale serait une modélisation qui prend en compte le type de loutre (soit l'une des 3 propositions, les 2 du dessus et celle qui permet de tenir compte des corrélations entre observation).
J'a vraiment peur qu'un biais s'instaure, je pense que la modélisation idéale serait une modélisation qui prend en compte le type de loutre (soit l'une des 3 propositions, les 2 du dessus et celle qui permet de tenir compte des corrélations entre observation).
Re: Analyse discriminantes conditions d'application
Hum j'ai dû m'embrouiller dans ma présentation je pense (enfin j'espère sinon je n'ai rien compris ).
Alors en fait j'ai 5 individus (5 loutres) de la même espèce. Et dans ma DFA ma variable de classement c'est justement les individus (donc les 5 loutres).
Du coup c'est bon non ?
Je suis vraiment désolée j'ai du mal à être claire et précise ! Merci en tout cas de passer autant de temps à m'aider !
Alors en fait j'ai 5 individus (5 loutres) de la même espèce. Et dans ma DFA ma variable de classement c'est justement les individus (donc les 5 loutres).
Du coup c'est bon non ?
Je suis vraiment désolée j'ai du mal à être claire et précise ! Merci en tout cas de passer autant de temps à m'aider !
ManaM- Nombre de messages : 12
Date d'inscription : 18/05/2012
Re: Analyse discriminantes conditions d'application
Caractéristiques
acoustiques :.................Dt..............Fmax..............Fmin................Fpic …
Indiv 1 cri 1.................0.078............3174..............1495...............2467
Indiv 1 cri 2.................0.089............2771..............1342...............2503
Indiv 1 cri 3.................0.024............5272..............4379...............4915
…
Indiv 1 cri 40...............0.68..............3129..............1699...............2950
Indiv 2 cri 1.................0.11..............6843..............1570...............6316
…
Indiv 2 cri 40...............0.16...............7019.............1394...............6931
…
Indiv 5 cri 40...............0.088.............7148..............1342..............7059
Je pense qu'on s'est très bien compris, mais je pense que ça t'arrange pas trop l'idée de ne pas bosser sur ta population complète alors tu préfères croire qu'on s'est mal compris! (je rigole biensûr sur la forme...)
En fait là j'ai ta base de données, et tu à 40 * 5 lignes pour lesquels tu as des caractéristiques (colonne), le souci étant que tes lignes sont surement corrélées 40 par 40 et qu'il ne s'agit pas d'observations indépendantes entre eux mais liées car il s'agit de cri certe mais ces cris sont pour 5 loutres et donc il y a surement une liaison entre la façon de crier et la loutre non? Ce biais là tu vas te le prendre dans ton modèle... tu vas mélanger des caractéristiques sur des choses qui ne sont surement pas comparable, ça aurait été plus simple d'avoir 200 loutres d'une même espèce (avec leur prope ligne de caractéristiques) que 5 loutres avec 40 lignes de caractéristiques (une par cri donc), dans le premier cas tu aurais eu une réelle indépendance, dans le second ça n'est pas le cas, suis-je clair?
La solution que je propose (outre le modèle prenant en compte les corrélations entre observations) serait de faire 5 modèles, 1 par loutre et un modèle sur tout le jeu et les comparer (voir une analyse des résidus).
Maintenant je ne connais rien en loutre, peut-être qu'il a été démontré que travailler sur une base de données comme celle-ci est tout à fait normal... voir avec ton domaine d'expertise, mais il faut élucider ce point qui me semble très important.
Re: Analyse discriminantes conditions d'application
Je post une seconde fois de suite car j'ai un exemple qui peux t'aider, soit une base de données sur le PMU, il y a des courses de 1200m, de 2400m et de 4000m et imaginons que j'ai pour chaque catégorie 50 courses. Si je fais un modèle sur ma base de données de 50 courses * 3 types et bien je cherche un modèle commun qui classe aussi bien pour les courses de 1200, 2400 et 4000m or le souci c'est que ce sont des courses différentes qui ont chacunes leur raison d'être difficile à prévoir et leur raison d'être facil à prédir (je raccourcis toute mon explication volontairement), au final j'estime des coefficients à partir de caractéristiques qui n'ont pas du tout le même rôle en fonction de ma course.
Vois-tu où je veux en venir?
Vois-tu où je veux en venir?
Re: Analyse discriminantes conditions d'application
Ahah j'avoue que je préfèrais croire qu'on s'était mal compris
Par contre si je suis ton exemple, le type de course correspondrait à la variable de classement.
En fait là ou j'ai du mal à te suivre c'est que pour une DFA on choisit la variable de classement, et au final on espère que les variables "dépendent" en quelque sorte de cette variable de classement (désolée j'utilise encore du jargon de non initiée !).
Si par exemple j'avais ma population de 200 loutres et un cri unique par loutre, je cherche à discriminer mes loutres et imaginons que la discriminante me montre 4 groupes qui correspondent en fait à 4 espèces de loutres, là aussi il y aurait une sorte de corrélation inter-ligne non?? C'est juste à une échelle différente ??? Et en plus dans cette DFA j’aurais probablement choisi comme variable de classement mes 4 espèces de loutres.
Bon je dois avouer que j'essaie de défendre l'idée de garder ma population complète mais si ce n'est pas ça j'ai beaucoup de mal à comprendre comment fonctionne la DFA car je pensais qu'elle s'appliquait justement quand on voulait vérifier un classement par exemple en incluant ce classement avec une variable de classement (désolé beaucoup de répétitions! ).
Juste pour reprendre ton exemple, dans les courses ce que tu cherches à discriminer c'est le type de courses (1200, 2400 et 4000m) en fonction des différentes variables qui caractérisent chaque course, c'est bien ca? Du coup ce qui me gène c'est que pour faire un modèle correct il faudrait le faire uniquement sur un seul type de course, mais dans ce cas que va discriminer la DFA et qu’est ce que tu inclus comme variable de classement?
Par contre si je suis ton exemple, le type de course correspondrait à la variable de classement.
En fait là ou j'ai du mal à te suivre c'est que pour une DFA on choisit la variable de classement, et au final on espère que les variables "dépendent" en quelque sorte de cette variable de classement (désolée j'utilise encore du jargon de non initiée !).
Si par exemple j'avais ma population de 200 loutres et un cri unique par loutre, je cherche à discriminer mes loutres et imaginons que la discriminante me montre 4 groupes qui correspondent en fait à 4 espèces de loutres, là aussi il y aurait une sorte de corrélation inter-ligne non?? C'est juste à une échelle différente ??? Et en plus dans cette DFA j’aurais probablement choisi comme variable de classement mes 4 espèces de loutres.
Bon je dois avouer que j'essaie de défendre l'idée de garder ma population complète mais si ce n'est pas ça j'ai beaucoup de mal à comprendre comment fonctionne la DFA car je pensais qu'elle s'appliquait justement quand on voulait vérifier un classement par exemple en incluant ce classement avec une variable de classement (désolé beaucoup de répétitions! ).
Juste pour reprendre ton exemple, dans les courses ce que tu cherches à discriminer c'est le type de courses (1200, 2400 et 4000m) en fonction des différentes variables qui caractérisent chaque course, c'est bien ca? Du coup ce qui me gène c'est que pour faire un modèle correct il faudrait le faire uniquement sur un seul type de course, mais dans ce cas que va discriminer la DFA et qu’est ce que tu inclus comme variable de classement?
ManaM- Nombre de messages : 12
Date d'inscription : 18/05/2012
Re: Analyse discriminantes conditions d'application
Ohlalalala!
Je t'ai dis n'importe quoi, désolé j'ai zappé ça, oublie mon trip sur cet histoire de biais et de corrélation entre les observations, bien au contraire il te faut des profiles typiques des différentes races de loutre que tu vas chercher à prédire plus tard pour de nouvelles observation, je pensais que tu cherchais à discriminer autre chose.
Donc ce que tu veux c'est constituer un modèle qui, en lui rentrant les variables Dt..............Fmax..............Fmin................Fpic … te permet de prédire la race de ta loutre? (sachant que ton modèle marchera que pour ces 5 espèces là). Par contre je vois pas le lien avec le crie... le crie est une variable également que tu n'as pas décrite ici exprès? Je veux dire, c'est également une variable explicative?
Désolé si je te fais répéter...
Mon but est de determiner qu’un individu possède des caractéristiques acoustiques qui lui sont propres et qu’en gros on peut le reconnaitre à son cri. Je fais donc une analyse discriminante (DFA).
Je t'ai dis n'importe quoi, désolé j'ai zappé ça, oublie mon trip sur cet histoire de biais et de corrélation entre les observations, bien au contraire il te faut des profiles typiques des différentes races de loutre que tu vas chercher à prédire plus tard pour de nouvelles observation, je pensais que tu cherchais à discriminer autre chose.
Donc ce que tu veux c'est constituer un modèle qui, en lui rentrant les variables Dt..............Fmax..............Fmin................Fpic … te permet de prédire la race de ta loutre? (sachant que ton modèle marchera que pour ces 5 espèces là). Par contre je vois pas le lien avec le crie... le crie est une variable également que tu n'as pas décrite ici exprès? Je veux dire, c'est également une variable explicative?
Désolé si je te fais répéter...
Re: Analyse discriminantes conditions d'application
ahhhhh ouffffffffffffff je suis super soulagée
Oui c'est exactement ça ! Alors désolée pour le cri de loutre j’ai oublié de préciser !
En fait les variables : Dt , Fmax Fmin Fpic ... sont des variables que je mesure sur mes cris de loutres (et oui il y en a qui n'ont rien d'autre à faire ^^). Donc 1 cri est représenté par une ligne dans mon tableau.
Par exemple pour le cri n°1, la variable de classification c'est : individu 1 et ensuite j’ai une valeur pour chaque variable (Dt = 0.078 , Fmax = 3174 , Fmin = 1495, Fpic = 2467 …)
Ici je cherche à prédire mon individu la race c’est juste un exemple sorti de mon imagination .
Oui c'est exactement ça ! Alors désolée pour le cri de loutre j’ai oublié de préciser !
En fait les variables : Dt , Fmax Fmin Fpic ... sont des variables que je mesure sur mes cris de loutres (et oui il y en a qui n'ont rien d'autre à faire ^^). Donc 1 cri est représenté par une ligne dans mon tableau.
Par exemple pour le cri n°1, la variable de classification c'est : individu 1 et ensuite j’ai une valeur pour chaque variable (Dt = 0.078 , Fmax = 3174 , Fmin = 1495, Fpic = 2467 …)
Ici je cherche à prédire mon individu la race c’est juste un exemple sorti de mon imagination .
ManaM- Nombre de messages : 12
Date d'inscription : 18/05/2012
Re: Analyse discriminantes conditions d'application
AHHHH alors je n'ai rien dit! Vraiment désolé, ça m'arrive parfois de partir à l'ouest tout seul!
Re: Analyse discriminantes conditions d'application
Non c'est pas grave !!!
Merci beaucoup pour toute ton aide !!!
Merci beaucoup pour toute ton aide !!!
ManaM- Nombre de messages : 12
Date d'inscription : 18/05/2012
Re: Analyse discriminantes conditions d'application
Concernant la normalité de tes données, je réalise que tu peux regarder avec un QQplot pour celles qui ne suivraient pas une loi normale selon ton test, ça se fait en général du fait que les tests de normalité ne sont pas toujours fiables... soit trop pessimiste soit trop optimiste, il convient souvent de mettre le QQplot et la p-value et conclure à la normalité uniquement avec le QQplot.
Re: Analyse discriminantes conditions d'application
Ok donc si je comprends bien si je vois que mes données suivent à peu près la droite théorique c'est bon?
Si par exemple je vois qu'il y a 3 ou 4 valeurs qui sont complètement en dehors de cette droite, est ce que je peux considérer que ma variable suit à peu près une loi normale, ou je dois retirer ces valeurs de mon analyse pour être sûre ?
Si par exemple je vois qu'il y a 3 ou 4 valeurs qui sont complètement en dehors de cette droite, est ce que je peux considérer que ma variable suit à peu près une loi normale, ou je dois retirer ces valeurs de mon analyse pour être sûre ?
ManaM- Nombre de messages : 12
Date d'inscription : 18/05/2012
Re: Analyse discriminantes conditions d'application
Complètement en dehors c'est assez embêtant même s'il y en a pas, en général faut tout de même que ça soit assez proche ou alors pour quelques dernières que ça soit vraiment pas loin.
Re: Analyse discriminantes conditions d'application
Ok merci beaucoup !
J'ai encore un soucis : une de mes variables est discrète ... je sais pas quoi en faire ... ^^
J'ai encore un soucis : une de mes variables est discrète ... je sais pas quoi en faire ... ^^
ManaM- Nombre de messages : 12
Date d'inscription : 18/05/2012
Sujets similaires
» analyse factorielle discriminante : conditions d'application
» Conditions de validité test Chi2
» ANOVA: conditions d'application, démarche
» Les conditions d’application du test de Student (et autres)
» test de khi 2 mais conditions non remplies, ke faire?
» Conditions de validité test Chi2
» ANOVA: conditions d'application, démarche
» Les conditions d’application du test de Student (et autres)
» test de khi 2 mais conditions non remplies, ke faire?
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum