Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Analyse discriminante
2 participants
Page 1 sur 1
Analyse discriminante
Bonjour à tous,
J'essaie de comprendre comment interpréter une analyse discriminante.
Tout d'abord, savez-vous s'il est possible d'inclure un poids (individuel) dans une telle analyse? En effet, je n'ai trouvé nulle part de cas où cela était fait, et il ne semble pas non plus y avoir d'option le permettant dans la fonction R que j'utilise.
Ensuite, concernant la procédure de sélection de variables, j'utilise le critère du lambda de Wilks. Est-ce le plus approprié? J'ai vu également qu'il existait le critère du V de Rao.
De plus, lorsque mon jeu de données est trop grand (beaucoup d'individus), la fonction R que j'utilise pour le critère de Wilks est très lente, et je dois avouer l'utiliser assez en "boîte noire" sans bien savoir comment choisir les paramètres... Auriez-vous des références de documentation décrivant la manière dont se déroule cette sélection de variables basée sur le critère du lambda de Wilks?
Enfin, dans le cas où les variables explicatives sont qualitatives, j'ai vu qu'il fallait avoir recours à la méthode DISQUAL. Y a-t-il d'autres alternatives?
Sinon, si j'ai bien compris, cette méthode consiste à effectuer une ACM sur les variables explicatives qualitatives, puis à réaliser l'analyse discriminante sur les (ou du moins certaines) composantes de l'ACM, c'est bien cela? Dans ce cas, comment interpréter les résultats afin d'en tirer des conclusions sur les variables initiales?
Je suis en plein recherche mais ne trouve pas les réponse à mes questions, certaines docs étant trop pointues pour que je les comprenne et d'autres trop évasives avec peu d'interprétation.
Je vous remercie d'avance pour vos réponses et éclaircissements sur le sujet
Cordialement,
A.D.
J'essaie de comprendre comment interpréter une analyse discriminante.
Tout d'abord, savez-vous s'il est possible d'inclure un poids (individuel) dans une telle analyse? En effet, je n'ai trouvé nulle part de cas où cela était fait, et il ne semble pas non plus y avoir d'option le permettant dans la fonction R que j'utilise.
Ensuite, concernant la procédure de sélection de variables, j'utilise le critère du lambda de Wilks. Est-ce le plus approprié? J'ai vu également qu'il existait le critère du V de Rao.
De plus, lorsque mon jeu de données est trop grand (beaucoup d'individus), la fonction R que j'utilise pour le critère de Wilks est très lente, et je dois avouer l'utiliser assez en "boîte noire" sans bien savoir comment choisir les paramètres... Auriez-vous des références de documentation décrivant la manière dont se déroule cette sélection de variables basée sur le critère du lambda de Wilks?
Enfin, dans le cas où les variables explicatives sont qualitatives, j'ai vu qu'il fallait avoir recours à la méthode DISQUAL. Y a-t-il d'autres alternatives?
Sinon, si j'ai bien compris, cette méthode consiste à effectuer une ACM sur les variables explicatives qualitatives, puis à réaliser l'analyse discriminante sur les (ou du moins certaines) composantes de l'ACM, c'est bien cela? Dans ce cas, comment interpréter les résultats afin d'en tirer des conclusions sur les variables initiales?
Je suis en plein recherche mais ne trouve pas les réponse à mes questions, certaines docs étant trop pointues pour que je les comprenne et d'autres trop évasives avec peu d'interprétation.
Je vous remercie d'avance pour vos réponses et éclaircissements sur le sujet
Cordialement,
A.D.
Re: Analyse discriminante
bonjour,
pour ce qui est du poids ce n'est pas un souci, il te suffit juste de multiplier tes données en entrée par le poids que tu veux leur accorder :
Pour ce qui est des données qualitatives, disqual ets surement une alternative mais je ne vois pas pourquoi tu ne peux pas utiliser les variables qualitatives directement. L'analyse discriminante est une analyse linéaire donc à priori pas de soucis. Peut-être que disqual corrige certains truc, mais je ne connais pas assez bien ce genre d'analyse pour pouvoir te répondre.
As-tu regarder dans un livre comme numerical ecology (Legendre 1998) ? il y a aussi la versio numerical ecology with r.
pour ce qui est du poids ce n'est pas un souci, il te suffit juste de multiplier tes données en entrée par le poids que tu veux leur accorder :
- Code:
x <- rnorm(100)
y <- rnorm(100)+3*x
z <- runif(100)
z <- z/sum(z)
z2 <- sqrt(z)
lm1 <- lm(y~x, weights=z)
lm2 <- lm(I(y*z2)~I(1*z2)+I(x*z2)-1)
coef(lm1)
(Intercept) x
0.0844521 2.8837580
coef(lm2)
I(1 * z2) I(x * z2)
0.0844521 2.8837580
Pour ce qui est des données qualitatives, disqual ets surement une alternative mais je ne vois pas pourquoi tu ne peux pas utiliser les variables qualitatives directement. L'analyse discriminante est une analyse linéaire donc à priori pas de soucis. Peut-être que disqual corrige certains truc, mais je ne connais pas assez bien ce genre d'analyse pour pouvoir te répondre.
As-tu regarder dans un livre comme numerical ecology (Legendre 1998) ? il y a aussi la versio numerical ecology with r.
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Analyse discriminante
Bonjour droopy,
Merci beaucoup pour votre réponse rapide
Pour les poids c'est ce que j'avais pensé faire, mais je ne savais pas si c'était faisable dans le cas de variables qualitatives.
Les cas sur lesquels je travaille principalement sont constitués de variables explicatives qualitatives et je souhaite au final pourvoir déterminer quelles modalités de ces variables sont significatives/importantes (et dans quelle mesure) dans le fait d'appartenir à tel ou tel groupe.
Pour cela, j'ai transformé mon jeu de données en tableau disjonctif complet, ie. chaque colonne du tableau correspond à une modalité d'une des variables et est composée de 1 ou de 0 selon que l'individu présente cette modalité ou non. Comme chaque individu ne peux posséder qu'une seule modalité parmis les k possibles pour une variable données, je ne peux pas inclure mon tableau disjonctif tel quel dans l'analyse discriminante puisque certaines colonnes sont liées entre elles.
J'ai donc pensé procéder comme dans le cas de la régression, à savoir choisir une des modalités de chaque variable comme "référence", et supprimer la colonne (de 0 et de 1) correspondante.
Cependant, je n'arrive pas bien à déterminer comment interpréter les résultats dans un tel cas (vu que certaines modalités n'apparaitront pas). Est-ce comme dans le cas de la régression, on doit comparer les modalités d'une variable donnée par rapport à celle de référence?
Si je parlais de la méthode disqual c'est parce que je n'ai pas trouvé d'exemples d'analyse discriminante où les variables qualitatives étaient traitées sans passer par cette méthode.
Je vais poursuivre mes recherches et voir si je peux accéder aux références d'ouvrages que vous m'indiquez.
Si quelqu'un d'autre a des informations intéressantes sur le sujet, qu'il n'hésite pas !
Merci encore droopy
Cordialement,
A.D.
Merci beaucoup pour votre réponse rapide
Pour les poids c'est ce que j'avais pensé faire, mais je ne savais pas si c'était faisable dans le cas de variables qualitatives.
Les cas sur lesquels je travaille principalement sont constitués de variables explicatives qualitatives et je souhaite au final pourvoir déterminer quelles modalités de ces variables sont significatives/importantes (et dans quelle mesure) dans le fait d'appartenir à tel ou tel groupe.
Pour cela, j'ai transformé mon jeu de données en tableau disjonctif complet, ie. chaque colonne du tableau correspond à une modalité d'une des variables et est composée de 1 ou de 0 selon que l'individu présente cette modalité ou non. Comme chaque individu ne peux posséder qu'une seule modalité parmis les k possibles pour une variable données, je ne peux pas inclure mon tableau disjonctif tel quel dans l'analyse discriminante puisque certaines colonnes sont liées entre elles.
J'ai donc pensé procéder comme dans le cas de la régression, à savoir choisir une des modalités de chaque variable comme "référence", et supprimer la colonne (de 0 et de 1) correspondante.
Cependant, je n'arrive pas bien à déterminer comment interpréter les résultats dans un tel cas (vu que certaines modalités n'apparaitront pas). Est-ce comme dans le cas de la régression, on doit comparer les modalités d'une variable donnée par rapport à celle de référence?
Si je parlais de la méthode disqual c'est parce que je n'ai pas trouvé d'exemples d'analyse discriminante où les variables qualitatives étaient traitées sans passer par cette méthode.
Je vais poursuivre mes recherches et voir si je peux accéder aux références d'ouvrages que vous m'indiquez.
Si quelqu'un d'autre a des informations intéressantes sur le sujet, qu'il n'hésite pas !
Merci encore droopy
Cordialement,
A.D.
Sujets similaires
» Analyse discriminante
» Analyse discriminante
» analyse discriminante?
» Analyse discriminante linéaire [RESOLU]
» méthode analyse discriminante disqual
» Analyse discriminante
» analyse discriminante?
» Analyse discriminante linéaire [RESOLU]
» méthode analyse discriminante disqual
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum