Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
L'analyse multivariée exploratoire et prédictive
+2
Dizzy84
joyeux_lapin13
6 participants
Page 1 sur 1
Ce récapitulatif vous a-t'il aidé?
L'analyse multivariée exploratoire et prédictive
Statistique exploratoire
Données continues: ACP
Données qualitatives:
- ACM
- AFC
Données continues et qualitatives: analyse d'Hill & Smith
Analyse multivariée non supervisée
Classification des observations:
- clustering hiérarchique
- carte de Kohonen
Classification des variables: algorithme VARCLUS
Analyse multivariée pour la prédiction et/ou classification
Variable réponse (Y) continue - variables explicatives (X) continues et/ou qualitatives:
- régression linéaire
- régression PLS
- réseau de neurones
- arbre de régression
- forêt aléatoire
Variable réponse (Y) qualitative - variables explicatives (X) continues et/ou qualitatives:
- régression logistique
- arbre de décision
- réseau de neurones
- forêt aléatoire
- régression logistique PLS
Variable réponse (Y) qualitative - variables explicatives (X) continues:
- analyse discriminante de Fisher (linéaire/quadratique)
- Adaboost
- Modèle additif GAM
- GBM
- SVM
Variable réponse (Y) qualitative - variables explicatives (X) qualitatives: analyse discriminante DISQUAL
Dernière édition par joyeux_lapin13 le Lun 29 Oct 2012 - 9:00, édité 4 fois
Re: L'analyse multivariée exploratoire et prédictive
formidable initiative!
je fais partie des "individus peu accoutumés aux stats" et après avoir beaucoup cherché de cours ou conseil sur le net mais n'ayant jamais trouvé vraiment réponses à mes questions, je suis enthousiaste à cette idée, car:
je suis sûre qu'en partant des questionnements posés sur un forum (en partant du bas de l'échelle des savoirs), le résultat proposé en sera d'autant plus pertinent que s'il avait été proposé par quelqu'un maitrisant la science mais n'ayant pas connaissance des besoins précis et particuliers des individus.
Bref, une démarche de transmission qui va du bas vers le haut plutôt que du haut vers le bas.
C'est très noble et très utile.
merci d'avance!
je fais partie des "individus peu accoutumés aux stats" et après avoir beaucoup cherché de cours ou conseil sur le net mais n'ayant jamais trouvé vraiment réponses à mes questions, je suis enthousiaste à cette idée, car:
je suis sûre qu'en partant des questionnements posés sur un forum (en partant du bas de l'échelle des savoirs), le résultat proposé en sera d'autant plus pertinent que s'il avait été proposé par quelqu'un maitrisant la science mais n'ayant pas connaissance des besoins précis et particuliers des individus.
Bref, une démarche de transmission qui va du bas vers le haut plutôt que du haut vers le bas.
C'est très noble et très utile.
merci d'avance!
Dizzy84- Nombre de messages : 1
Date d'inscription : 10/06/2012
Re: L'analyse multivariée exploratoire et prédictive
Oui cela m'a aidé.
Maintenant il serait sympa d'indiquer des ouvrages de références peut être?
Par exemple le livre de G.Saporta (professeur au CNAM) est pour moi un "must" à avoir absolument. Après c'est très "matheux" je trouve et du coup c'est plus un complément si on veut approfondir à mon sens.
Des livres (un peu plus sur l'utilisation du logiciel R) intéressants également sont les livres des éditions PUR (Presse Universitaire de Rennes je crois) sur l'Analyse de données (ACP, ACF, ACM, Classification) de Pagès, Lé & Husson ou encore Statistiques avec R (courte intro sur R, et des fiches exemple/exo sur chaque méthode classique en stat inférentielle ou descriptives.
A priori le livre de Tuffery sur le Data Mining est très bien fait mais je ne l'ai pas encore consulté.
Maintenant il serait sympa d'indiquer des ouvrages de références peut être?
Par exemple le livre de G.Saporta (professeur au CNAM) est pour moi un "must" à avoir absolument. Après c'est très "matheux" je trouve et du coup c'est plus un complément si on veut approfondir à mon sens.
Des livres (un peu plus sur l'utilisation du logiciel R) intéressants également sont les livres des éditions PUR (Presse Universitaire de Rennes je crois) sur l'Analyse de données (ACP, ACF, ACM, Classification) de Pagès, Lé & Husson ou encore Statistiques avec R (courte intro sur R, et des fiches exemple/exo sur chaque méthode classique en stat inférentielle ou descriptives.
A priori le livre de Tuffery sur le Data Mining est très bien fait mais je ne l'ai pas encore consulté.
Qualitative- Nombre de messages : 25
Date d'inscription : 20/12/2012
Re: L'analyse multivariée exploratoire et prédictive
Salut,
La section dont tu parles existe déjà: https://statistiques.forumpro.fr/t2955-les-ouvrages-incontournables
Malheureusement on peut regretter un léger manque d'investissement ou plutôt de temps on va dire de la part de ceux qui ont le recul nécessaire pour venir compléter l'ensemble des rubriques créées sur ce forum.
Concernant le livre de S. Tufféry: Data Mining et statistique décisionnelle, je suis actuellement en train de le lire, plus exactement j'en suis à la moitié. Mon avis est qu'il s'agit d'un superbe ouvrage qui doit être complété par celui de Saporta vis à vis des parties théoriques. L'oeuvre de S. Tufféry regorge également de petites idées à mettre en application pour ses projets personnels quelque soit le domaine d'application, je pense notamment:
- aux différents types de réseaux de neurones qu'il cite
- l'auto-modalisation de variables continues par arbre de décision
- l'usage prédictif du clustering hiérarchique en lançant d'abords une approche non supervisée, puis après avoir récupérer les classes construites lancer un outil d'analyse comme les arbres de décision sous condition pour permettre de construire une règle de classification associé aux clusters construit
- mesurer la multicolinéarité via une régression linéaire multiple
- ou encore dans le cadre de contrainte connue de l'industrie pharmaceutique, utiliser l'algorithme Apriori afin de déceler les associations innovantes de biomarqueurs sur les différents combinaisons les plus performantes relevées
N'étant qu'à la moitié du bouquin, je pense que la suite réserve encore bon nombre de surprises bien précieuses.
Pour l'ouvrage de Saporta, sur un plan personnel je prends le temps de le bosser tous les jours et quand je le finis je le recommence, il permet notamment de s'entretenir sur les bases des probas, de la théorie de la mesure et des stats et en fait pas seulement les bases mais même sur le bagage essentiel pour être très à l'aise dans ses 3 domaines.
J'ai commandé l'ouvrage suivant: Théorie des sondages de P. Ardilly ou plutôt maitre Ardilly, étant désormais à l'INSEE forcément c'est un pré-requis d'avoir son ouvrage entre les mains. Donc courant 2013 je pense faire un petit résumé.
Enfin, j'avoue qu'il serait bien que quelqu'un poste les références d'un excellent bouquin de programmation R, surtout que pour avoir récemment cherché à toucher aux paramètres par défaut graphique, il y a vraiment énormément de choses à connaitre sur ce logiciel même quand on est persuadé tout savoir. Pour SAS les références liées à O. Decourt sont suffisantes tant ses ouvrages sont complets, pratiques et agréables à lire.
Voilà, je cesse de faire du hors-sujet sur mon propre topic lol, mais pour rappeler les 2 réponses essentielles: il y a déjà un topic dédié à ta demande et en effet il serait bien que les habitués du forum aussi bien que ceux qui ne sont que de passage nous fasse part de le retour sur les différents ouvrages liés aux Stats et à leur différent logiciel d'application.
La section dont tu parles existe déjà: https://statistiques.forumpro.fr/t2955-les-ouvrages-incontournables
Malheureusement on peut regretter un léger manque d'investissement ou plutôt de temps on va dire de la part de ceux qui ont le recul nécessaire pour venir compléter l'ensemble des rubriques créées sur ce forum.
Concernant le livre de S. Tufféry: Data Mining et statistique décisionnelle, je suis actuellement en train de le lire, plus exactement j'en suis à la moitié. Mon avis est qu'il s'agit d'un superbe ouvrage qui doit être complété par celui de Saporta vis à vis des parties théoriques. L'oeuvre de S. Tufféry regorge également de petites idées à mettre en application pour ses projets personnels quelque soit le domaine d'application, je pense notamment:
- aux différents types de réseaux de neurones qu'il cite
- l'auto-modalisation de variables continues par arbre de décision
- l'usage prédictif du clustering hiérarchique en lançant d'abords une approche non supervisée, puis après avoir récupérer les classes construites lancer un outil d'analyse comme les arbres de décision sous condition pour permettre de construire une règle de classification associé aux clusters construit
- mesurer la multicolinéarité via une régression linéaire multiple
- ou encore dans le cadre de contrainte connue de l'industrie pharmaceutique, utiliser l'algorithme Apriori afin de déceler les associations innovantes de biomarqueurs sur les différents combinaisons les plus performantes relevées
N'étant qu'à la moitié du bouquin, je pense que la suite réserve encore bon nombre de surprises bien précieuses.
Pour l'ouvrage de Saporta, sur un plan personnel je prends le temps de le bosser tous les jours et quand je le finis je le recommence, il permet notamment de s'entretenir sur les bases des probas, de la théorie de la mesure et des stats et en fait pas seulement les bases mais même sur le bagage essentiel pour être très à l'aise dans ses 3 domaines.
J'ai commandé l'ouvrage suivant: Théorie des sondages de P. Ardilly ou plutôt maitre Ardilly, étant désormais à l'INSEE forcément c'est un pré-requis d'avoir son ouvrage entre les mains. Donc courant 2013 je pense faire un petit résumé.
Enfin, j'avoue qu'il serait bien que quelqu'un poste les références d'un excellent bouquin de programmation R, surtout que pour avoir récemment cherché à toucher aux paramètres par défaut graphique, il y a vraiment énormément de choses à connaitre sur ce logiciel même quand on est persuadé tout savoir. Pour SAS les références liées à O. Decourt sont suffisantes tant ses ouvrages sont complets, pratiques et agréables à lire.
Voilà, je cesse de faire du hors-sujet sur mon propre topic lol, mais pour rappeler les 2 réponses essentielles: il y a déjà un topic dédié à ta demande et en effet il serait bien que les habitués du forum aussi bien que ceux qui ne sont que de passage nous fasse part de le retour sur les différents ouvrages liés aux Stats et à leur différent logiciel d'application.
Re: L'analyse multivariée exploratoire et prédictive
Outre l'analyse d'Hill & Smith, il faut également citer l'Iconographie des Corrélations qui permet l'analyse simultanée des variables qualitatives et quantitatives.
xierqi- Nombre de messages : 6
Date d'inscription : 07/03/2013
Re: L'analyse multivariée exploratoire et prédictive
merci pour cette présentation;
ça répond à beaucoup d'interrogations qu'on peut se poser sur les analyses des comportements de populations, selon la natures des réponses.
il manque peut être le classement en l'absence de Variable réponse (Y).
ce type d'analyse est utile pour classer une population selon des variables explicatives pré définies : fidélité, classe socioprofessionnelles...
ça répond à beaucoup d'interrogations qu'on peut se poser sur les analyses des comportements de populations, selon la natures des réponses.
il manque peut être le classement en l'absence de Variable réponse (Y).
ce type d'analyse est utile pour classer une population selon des variables explicatives pré définies : fidélité, classe socioprofessionnelles...
SAKRAB044- Nombre de messages : 5
Age : 46
Localisation : Casablanca
Date d'inscription : 03/04/2013
Re: L'analyse multivariée exploratoire et prédictive
C'est ce qu'on appel l'analyse non supervisée (voir le haut du topic).
Logiquement ce qu'il manque réellement c'est plutôt tout ce qui est modèle mixte, modèle de survie et série chronologique ou je suis assez inculte, si quelqu'un veut m'envoyer un listing pour ces domaines là d'application je suis preneur.
Logiquement ce qu'il manque réellement c'est plutôt tout ce qui est modèle mixte, modèle de survie et série chronologique ou je suis assez inculte, si quelqu'un veut m'envoyer un listing pour ces domaines là d'application je suis preneur.
Re: L'analyse multivariée exploratoire et prédictive
Bonjour,
A mon sens, il manque également les régressions sur données catégorielles à plus de 2 classes. Je suis en train de me tirer les cheveux à comprendre ces régressions (je ne suis pas statisticienne et oui, il y en a plusieurs!)! Je pourrais peut-être commencer un post... ou alors il rentre dans celui-là! Je ne sais pas!
Candemum
A mon sens, il manque également les régressions sur données catégorielles à plus de 2 classes. Je suis en train de me tirer les cheveux à comprendre ces régressions (je ne suis pas statisticienne et oui, il y en a plusieurs!)! Je pourrais peut-être commencer un post... ou alors il rentre dans celui-là! Je ne sais pas!
Candemum
Candemum- Nombre de messages : 22
Date d'inscription : 09/06/2011
Re: L'analyse multivariée exploratoire et prédictive
Quand j'écris
Après si des outils manquent, n'hésitez pas à faire une proposition, je veillerais alors à mettre à jour ce post-it.
Quand à comprendre la régression logistique sur données catégorielles, c'est assez basique dans le sens où l'algorithme utilisé (scoring de Fisher ou descente de gradient de Newton-Raphson) est le même que pour données continues (à ceci prés que la colonne de la modalité de référence du tableau disjonctif complet est supprimé), mais peut-être ai-je mal compris ce que tu veux dire.
je parle justement de variables qualitatives (ordinales ou nominales) à K modalités, K n'étant pas restreint à 2.variables explicatives (X) continues et/ou qualitatives
Après si des outils manquent, n'hésitez pas à faire une proposition, je veillerais alors à mettre à jour ce post-it.
Quand à comprendre la régression logistique sur données catégorielles, c'est assez basique dans le sens où l'algorithme utilisé (scoring de Fisher ou descente de gradient de Newton-Raphson) est le même que pour données continues (à ceci prés que la colonne de la modalité de référence du tableau disjonctif complet est supprimé), mais peut-être ai-je mal compris ce que tu veux dire.
Re: L'analyse multivariée exploratoire et prédictive
N'étant pas statisticienne, j'ai du mal à comprendre ce que tu essaies de me dire
D'après ce que j'ai pu lire, il existe la régression logistique multinomiale dans le cas de variables nominales et plusieurs types de régressions logistiques dans le cas de variables ordinales:
- régression à odds (partiellement) proportionnels (dit aussi cumulatif)
- Continuation-ratio model
- Modèle stéréotype (on garde une catégories de référence!)
- Modèle logistique sur catégories adjacentes.
C'est ce que je proposais d'ajouter dans ton post.
Candemum.
D'après ce que j'ai pu lire, il existe la régression logistique multinomiale dans le cas de variables nominales et plusieurs types de régressions logistiques dans le cas de variables ordinales:
- régression à odds (partiellement) proportionnels (dit aussi cumulatif)
- Continuation-ratio model
- Modèle stéréotype (on garde une catégories de référence!)
- Modèle logistique sur catégories adjacentes.
C'est ce que je proposais d'ajouter dans ton post.
Candemum.
Candemum- Nombre de messages : 22
Date d'inscription : 09/06/2011
Sujets similaires
» Analyse exploratoire temporelle
» Statistique exploratoire sur des données industrielles
» Statistique descriptive bivariée ou analyse exploratoire
» Calcul d'un nombre de sujets nécessaires étude exploratoire
» Analyse multivariée
» Statistique exploratoire sur des données industrielles
» Statistique descriptive bivariée ou analyse exploratoire
» Calcul d'un nombre de sujets nécessaires étude exploratoire
» Analyse multivariée
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum