Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Le Deal du moment : -50%
-50% sur les sacs à dos pour ordinateur ...
Voir le deal
19.99 €
Le deal à ne pas rater :
Xiaomi Mi Smart Camera 2K Standard Edition (design compact / support ...
11.39 €
Voir le deal

Analyse discriminante

2 participants

Aller en bas

analyse - Analyse discriminante Empty Analyse discriminante

Message par A.D. Lun 3 Oct 2011 - 10:30

Bonjour à tous,

J'essaie de comprendre comment interpréter une analyse discriminante.

Tout d'abord, savez-vous s'il est possible d'inclure un poids (individuel) dans une telle analyse? En effet, je n'ai trouvé nulle part de cas où cela était fait, et il ne semble pas non plus y avoir d'option le permettant dans la fonction R que j'utilise.

Ensuite, concernant la procédure de sélection de variables, j'utilise le critère du lambda de Wilks. Est-ce le plus approprié? J'ai vu également qu'il existait le critère du V de Rao.
De plus, lorsque mon jeu de données est trop grand (beaucoup d'individus), la fonction R que j'utilise pour le critère de Wilks est très lente, et je dois avouer l'utiliser assez en "boîte noire" sans bien savoir comment choisir les paramètres... Auriez-vous des références de documentation décrivant la manière dont se déroule cette sélection de variables basée sur le critère du lambda de Wilks?

Enfin, dans le cas où les variables explicatives sont qualitatives, j'ai vu qu'il fallait avoir recours à la méthode DISQUAL. Y a-t-il d'autres alternatives?
Sinon, si j'ai bien compris, cette méthode consiste à effectuer une ACM sur les variables explicatives qualitatives, puis à réaliser l'analyse discriminante sur les (ou du moins certaines) composantes de l'ACM, c'est bien cela? Dans ce cas, comment interpréter les résultats afin d'en tirer des conclusions sur les variables initiales?

Je suis en plein recherche mais ne trouve pas les réponse à mes questions, certaines docs étant trop pointues pour que je les comprenne et d'autres trop évasives avec peu d'interprétation.
Je vous remercie d'avance pour vos réponses et éclaircissements sur le sujet Smile


Cordialement,

A.D.

A.D.

Nombre de messages : 305
Age : 35
Localisation : Nantes
Date d'inscription : 02/12/2009

http://www.dacta.fr

Revenir en haut Aller en bas

analyse - Analyse discriminante Empty Re: Analyse discriminante

Message par droopy Lun 3 Oct 2011 - 11:07

bonjour,

pour ce qui est du poids ce n'est pas un souci, il te suffit juste de multiplier tes données en entrée par le poids que tu veux leur accorder :
Code:
x <- rnorm(100)
y <- rnorm(100)+3*x
z <- runif(100)
z <- z/sum(z)
z2 <- sqrt(z)
lm1 <- lm(y~x, weights=z)
lm2 <- lm(I(y*z2)~I(1*z2)+I(x*z2)-1)
coef(lm1)
(Intercept)          x
  0.0844521  2.8837580
coef(lm2)
I(1 * z2) I(x * z2)
0.0844521 2.8837580
le même principe s'applique à tes données.

Pour ce qui est des données qualitatives, disqual ets surement une alternative mais je ne vois pas pourquoi tu ne peux pas utiliser les variables qualitatives directement. L'analyse discriminante est une analyse linéaire donc à priori pas de soucis. Peut-être que disqual corrige certains truc, mais je ne connais pas assez bien ce genre d'analyse pour pouvoir te répondre.

As-tu regarder dans un livre comme numerical ecology (Legendre 1998) ? il y a aussi la versio numerical ecology with r.
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

analyse - Analyse discriminante Empty Re: Analyse discriminante

Message par A.D. Lun 3 Oct 2011 - 13:18

Bonjour droopy,

Merci beaucoup pour votre réponse rapide Smile

Pour les poids c'est ce que j'avais pensé faire, mais je ne savais pas si c'était faisable dans le cas de variables qualitatives.

Les cas sur lesquels je travaille principalement sont constitués de variables explicatives qualitatives et je souhaite au final pourvoir déterminer quelles modalités de ces variables sont significatives/importantes (et dans quelle mesure) dans le fait d'appartenir à tel ou tel groupe.
Pour cela, j'ai transformé mon jeu de données en tableau disjonctif complet, ie. chaque colonne du tableau correspond à une modalité d'une des variables et est composée de 1 ou de 0 selon que l'individu présente cette modalité ou non. Comme chaque individu ne peux posséder qu'une seule modalité parmis les k possibles pour une variable données, je ne peux pas inclure mon tableau disjonctif tel quel dans l'analyse discriminante puisque certaines colonnes sont liées entre elles.
J'ai donc pensé procéder comme dans le cas de la régression, à savoir choisir une des modalités de chaque variable comme "référence", et supprimer la colonne (de 0 et de 1) correspondante.
Cependant, je n'arrive pas bien à déterminer comment interpréter les résultats dans un tel cas (vu que certaines modalités n'apparaitront pas). Est-ce comme dans le cas de la régression, on doit comparer les modalités d'une variable donnée par rapport à celle de référence?

Si je parlais de la méthode disqual c'est parce que je n'ai pas trouvé d'exemples d'analyse discriminante où les variables qualitatives étaient traitées sans passer par cette méthode.

Je vais poursuivre mes recherches et voir si je peux accéder aux références d'ouvrages que vous m'indiquez.
Si quelqu'un d'autre a des informations intéressantes sur le sujet, qu'il n'hésite pas !

Merci encore droopy Smile


Cordialement,

A.D.

A.D.

Nombre de messages : 305
Age : 35
Localisation : Nantes
Date d'inscription : 02/12/2009

http://www.dacta.fr

Revenir en haut Aller en bas

analyse - Analyse discriminante Empty Re: Analyse discriminante

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum