anipassion.com

L'analyse multivariée exploratoire et prédictive

Voir le sujet précédent Voir le sujet suivant Aller en bas

Ce récapitulatif vous a-t'il aidé?

20% 20% 
[ 2 ]
80% 80% 
[ 8 ]
 
Total des votes : 10

L'analyse multivariée exploratoire et prédictive

Message par joyeux_lapin13 le Jeu 10 Mai 2012 - 15:32

Statistique exploratoire

Données continues: ACP

Données qualitatives:
- ACM
- AFC

Données continues et qualitatives: analyse d'Hill & Smith

Analyse multivariée non supervisée

Classification des observations:
- clustering hiérarchique
- carte de Kohonen

Classification des variables: algorithme VARCLUS

Analyse multivariée pour la prédiction et/ou classification

Variable réponse (Y) continue - variables explicatives (X) continues et/ou qualitatives:
- régression linéaire
- régression PLS
- réseau de neurones
- arbre de régression
- forêt aléatoire

Variable réponse (Y) qualitative - variables explicatives (X) continues et/ou qualitatives:
- régression logistique
- arbre de décision
- réseau de neurones
- forêt aléatoire
- régression logistique PLS

Variable réponse (Y) qualitative - variables explicatives (X) continues:
- analyse discriminante de Fisher (linéaire/quadratique)
- Adaboost
- Modèle additif GAM
- GBM
- SVM

Variable réponse (Y) qualitative - variables explicatives (X) qualitatives: analyse discriminante DISQUAL


Dernière édition par joyeux_lapin13 le Lun 29 Oct 2012 - 9:00, édité 4 fois

joyeux_lapin13

Nombre de messages : 1674
Age : 33
Localisation : Mayotte
Date d'inscription : 21/04/2010

Voir le profil de l'utilisateur https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

Re: L'analyse multivariée exploratoire et prédictive

Message par Dizzy84 le Dim 10 Juin 2012 - 19:01

formidable initiative!

je fais partie des "individus peu accoutumés aux stats" et après avoir beaucoup cherché de cours ou conseil sur le net mais n'ayant jamais trouvé vraiment réponses à mes questions, je suis enthousiaste à cette idée, car:

je suis sûre qu'en partant des questionnements posés sur un forum (en partant du bas de l'échelle des savoirs), le résultat proposé en sera d'autant plus pertinent que s'il avait été proposé par quelqu'un maitrisant la science mais n'ayant pas connaissance des besoins précis et particuliers des individus.
Bref, une démarche de transmission qui va du bas vers le haut plutôt que du haut vers le bas.

C'est très noble et très utile.

merci d'avance!

Dizzy84

Nombre de messages : 1
Date d'inscription : 10/06/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: L'analyse multivariée exploratoire et prédictive

Message par Qualitative le Ven 21 Déc 2012 - 0:04

Oui cela m'a aidé.

Maintenant il serait sympa d'indiquer des ouvrages de références peut être?

Par exemple le livre de G.Saporta (professeur au CNAM) est pour moi un "must" à avoir absolument. Après c'est très "matheux" je trouve et du coup c'est plus un complément si on veut approfondir à mon sens.

Des livres (un peu plus sur l'utilisation du logiciel R) intéressants également sont les livres des éditions PUR (Presse Universitaire de Rennes je crois) sur l'Analyse de données (ACP, ACF, ACM, Classification) de Pagès, Lé & Husson ou encore Statistiques avec R (courte intro sur R, et des fiches exemple/exo sur chaque méthode classique en stat inférentielle ou descriptives.

A priori le livre de Tuffery sur le Data Mining est très bien fait mais je ne l'ai pas encore consulté.


Qualitative

Nombre de messages : 25
Date d'inscription : 20/12/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: L'analyse multivariée exploratoire et prédictive

Message par joyeux_lapin13 le Ven 21 Déc 2012 - 5:50

Salut,

La section dont tu parles existe déjà: http://statistiques.forumpro.fr/t2955-les-ouvrages-incontournables

Malheureusement on peut regretter un léger manque d'investissement ou plutôt de temps on va dire de la part de ceux qui ont le recul nécessaire pour venir compléter l'ensemble des rubriques créées sur ce forum.

Concernant le livre de S. Tufféry: Data Mining et statistique décisionnelle, je suis actuellement en train de le lire, plus exactement j'en suis à la moitié. Mon avis est qu'il s'agit d'un superbe ouvrage qui doit être complété par celui de Saporta vis à vis des parties théoriques. L'oeuvre de S. Tufféry regorge également de petites idées à mettre en application pour ses projets personnels quelque soit le domaine d'application, je pense notamment:
- aux différents types de réseaux de neurones qu'il cite
- l'auto-modalisation de variables continues par arbre de décision
- l'usage prédictif du clustering hiérarchique en lançant d'abords une approche non supervisée, puis après avoir récupérer les classes construites lancer un outil d'analyse comme les arbres de décision sous condition pour permettre de construire une règle de classification associé aux clusters construit
- mesurer la multicolinéarité via une régression linéaire multiple
- ou encore dans le cadre de contrainte connue de l'industrie pharmaceutique, utiliser l'algorithme Apriori afin de déceler les associations innovantes de biomarqueurs sur les différents combinaisons les plus performantes relevées

N'étant qu'à la moitié du bouquin, je pense que la suite réserve encore bon nombre de surprises bien précieuses.

Pour l'ouvrage de Saporta, sur un plan personnel je prends le temps de le bosser tous les jours et quand je le finis je le recommence, il permet notamment de s'entretenir sur les bases des probas, de la théorie de la mesure et des stats et en fait pas seulement les bases mais même sur le bagage essentiel pour être très à l'aise dans ses 3 domaines.

J'ai commandé l'ouvrage suivant: Théorie des sondages de P. Ardilly ou plutôt maitre Ardilly, étant désormais à l'INSEE forcément c'est un pré-requis d'avoir son ouvrage entre les mains. Donc courant 2013 je pense faire un petit résumé.

Enfin, j'avoue qu'il serait bien que quelqu'un poste les références d'un excellent bouquin de programmation R, surtout que pour avoir récemment cherché à toucher aux paramètres par défaut graphique, il y a vraiment énormément de choses à connaitre sur ce logiciel même quand on est persuadé tout savoir. Pour SAS les références liées à O. Decourt sont suffisantes tant ses ouvrages sont complets, pratiques et agréables à lire.

Voilà, je cesse de faire du hors-sujet sur mon propre topic lol, mais pour rappeler les 2 réponses essentielles: il y a déjà un topic dédié à ta demande et en effet il serait bien que les habitués du forum aussi bien que ceux qui ne sont que de passage nous fasse part de le retour sur les différents ouvrages liés aux Stats et à leur différent logiciel d'application.

joyeux_lapin13

Nombre de messages : 1674
Age : 33
Localisation : Mayotte
Date d'inscription : 21/04/2010

Voir le profil de l'utilisateur https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

Re: L'analyse multivariée exploratoire et prédictive

Message par xierqi le Ven 8 Mar 2013 - 8:54

Outre l'analyse d'Hill & Smith, il faut également citer l'Iconographie des Corrélations qui permet l'analyse simultanée des variables qualitatives et quantitatives.

xierqi

Nombre de messages : 6
Date d'inscription : 07/03/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: L'analyse multivariée exploratoire et prédictive

Message par SAKRAB044 le Mar 16 Avr 2013 - 9:48

merci pour cette présentation;
ça répond à beaucoup d'interrogations qu'on peut se poser sur les analyses des comportements de populations, selon la natures des réponses.
il manque peut être le classement en l'absence de Variable réponse (Y).
ce type d'analyse est utile pour classer une population selon des variables explicatives pré définies : fidélité, classe socioprofessionnelles...

SAKRAB044

Nombre de messages : 5
Age : 38
Localisation : Casablanca
Date d'inscription : 03/04/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: L'analyse multivariée exploratoire et prédictive

Message par joyeux_lapin13 le Mar 16 Avr 2013 - 10:34

C'est ce qu'on appel l'analyse non supervisée (voir le haut du topic).

Logiquement ce qu'il manque réellement c'est plutôt tout ce qui est modèle mixte, modèle de survie et série chronologique ou je suis assez inculte, si quelqu'un veut m'envoyer un listing pour ces domaines là d'application je suis preneur.

joyeux_lapin13

Nombre de messages : 1674
Age : 33
Localisation : Mayotte
Date d'inscription : 21/04/2010

Voir le profil de l'utilisateur https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

Re: L'analyse multivariée exploratoire et prédictive

Message par Candemum le Mer 12 Juin 2013 - 8:09

Bonjour,

A mon sens, il manque également les régressions sur données catégorielles à plus de 2 classes. Je suis en train de me tirer les cheveux à comprendre ces régressions (je ne suis pas statisticienne et oui, il y en a plusieurs!)! Je pourrais peut-être commencer un post... ou alors il rentre dans celui-là! Je ne sais pas!

Candemum

Candemum

Nombre de messages : 14
Date d'inscription : 09/06/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: L'analyse multivariée exploratoire et prédictive

Message par joyeux_lapin13 le Mer 12 Juin 2013 - 8:32

Quand j'écris
variables explicatives (X) continues et/ou qualitatives
je parle justement de variables qualitatives (ordinales ou nominales) à K modalités, K n'étant pas restreint à 2.

Après si des outils manquent, n'hésitez pas à faire une proposition, je veillerais alors à mettre à jour ce post-it.

Quand à comprendre la régression logistique sur données catégorielles, c'est assez basique dans le sens où l'algorithme utilisé (scoring de Fisher ou descente de gradient de Newton-Raphson) est le même que pour données continues (à ceci prés que la colonne de la modalité de référence du tableau disjonctif complet est supprimé), mais peut-être ai-je mal compris ce que tu veux dire.

joyeux_lapin13

Nombre de messages : 1674
Age : 33
Localisation : Mayotte
Date d'inscription : 21/04/2010

Voir le profil de l'utilisateur https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

Re: L'analyse multivariée exploratoire et prédictive

Message par Candemum le Mer 12 Juin 2013 - 8:48

N'étant pas statisticienne, j'ai du mal à comprendre ce que tu essaies de me dire Rolling Eyes

D'après ce que j'ai pu lire, il existe la régression logistique multinomiale dans le cas de variables nominales et plusieurs types de régressions logistiques dans le cas de variables ordinales:
- régression à odds (partiellement) proportionnels (dit aussi cumulatif)
- Continuation-ratio model
- Modèle stéréotype (on garde une catégories de référence!)
- Modèle logistique sur catégories adjacentes.

C'est ce que je proposais d'ajouter dans ton post.

Candemum.



Candemum

Nombre de messages : 14
Date d'inscription : 09/06/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: L'analyse multivariée exploratoire et prédictive

Message par Contenu sponsorisé Aujourd'hui à 10:44


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum