Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

Le Deal du moment :
Réassort du coffret Pokémon 151 ...
Voir le deal

Discrétisation de variables qualitatives nominales et autres

4 participants

Aller en bas

Discrétisation de variables qualitatives nominales et autres Empty Discrétisation de variables qualitatives nominales et autres

Message par stdenis90 Lun 29 Jan 2018 - 20:14

Bonjour,

Dans le cadre de ma thèse j'ai réalisé une enquête quantitative (questionnaire standardisé).

Pour le traitement statistique j'ai discrétisé les variables qualitatives (ordinales) essentiellement en échelle de Likert; ce qui était sans complication. Pour discrétiser l'expérience, j'ai procédé par médiane (0 à 2 ans = 1; 2 à 7 ans = 5; > 7 ans = 9). Trouvez-vous cela juste?

Enfin, dans mon analyse par composantes principales (sur le logiciel TANAGRA), les deux axes significatifs (selon le critère de Kaiseur=> valeur propre >1) n'atteignent pas 70% (62%). Au lieu d'intégrer le 3ème axe pour atteindre 70%, je voudrais intégrer au modèle des éléments collectés mais non utilisés car je n'ai pas pu les discrétiser. Par exemple, peut-on discrétiser des variables qualitatives nominales telles que le domaine d'activité (informatique, finance, RH, etc.), le diplôme (doctorat, master, licence, etc.), les niveaux de besoins de la pyramide de maslow, etc. Je pense qu'en les ajoutant au modèle ACP, il y'aura assez d'éléments pour le construit, et il sera possible d'atteindre 70% de significativité sur deux axes.

Par ailleurs, avec le modèle à l'état actuel, lorsque je teste les hypothèses (générale et adjacentes) par la méthode des équations structurelles (sur le logiciel SPSS AMOS), les résultats et les tests sont globalement satisfaisants. Cependant, ils (les résultats) changent négativement (surtout le test du khi2 qui n'est pas bon) lorsque je teste les inter corrélations entre sous-variables avec les liaisons (flèches). Est-ce parce qu'elles ne sont pas indépendantes ou y'aurait-il un raté de ma part?

Merci !!

Cordialement

stdenis90

Nombre de messages : 6
Date d'inscription : 29/01/2018

Revenir en haut Aller en bas

Discrétisation de variables qualitatives nominales et autres Empty Re: Discrétisation de variables qualitatives nominales et autres

Message par Eric Wajnberg Mar 30 Jan 2018 - 10:21

Votre question n'est pas claire.

D'abord, pourquoi vouloir discrétiser ? Vous allez perdre une énorme quantité d'information sans rien gagner en échange.

Ensuite, vous parlez d'ACP. Mais dans une ACP les variables sont toutes quantitatives. Pas de discrétisation nécessaire ici.

Par ailleurs, d'où sortez-vous cette règle de 70% ? Ca dépend du nombre de variables dans votre ACP (et vous ne dites rien là-dessus). 70% sur deux ou trois axes, si vous avez par exemple 30 variables, c'est énorme..

Il me semble que des informations de base sur l'utilisation d'une ACP vous seraient utiles avant de vous lancer dans des calculs compliqués, et en apparence sans objet.

HTH, Eric.
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1238
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

Discrétisation de variables qualitatives nominales et autres Empty Re: Discrétisation de variables qualitatives nominales et autres

Message par Florent Aubry Mar 30 Jan 2018 - 12:42

Pour compléter la réponse d'Eric concernant l'ACP quand elle s'applique, le choix du nombre de dimension par un seuil en pourcentage peut conduire à conserver des dimensions non significatives quand les variables sont très corrélées (exemple caricatural : 10 variables dont deux corrélées à 0.95 et les autres non corrélées, i.e. corrélation nulle), 70% conduit à conserver 5 dimensions ce qui n'a pas de sens. Le critère de Kaiser n'est pas meilleur. Il existe des critères formels soit basés sur une hypothèses de normalité des données qui ne donnent pas non plus de très bons résultats dans le cas général (données éloignées de la normalité) ou sur des techniques de rééchantillonnage qui peuvent être efficaces mais à manipuler aussi avec précaution. A mon avis, la méthode visuelle empirique dite du coude, ou critère de Cattell, est très souvent le meilleur compromis. De plus, elle est souvent inutilisable pour toutes les techniques d'analyse exploratoire multidimensionnelle.

Florent Aubry

Nombre de messages : 251
Date d'inscription : 02/11/2015

Revenir en haut Aller en bas

Discrétisation de variables qualitatives nominales et autres Empty Re: Discrétisation de variables qualitatives nominales et autres

Message par stdenis90 Mar 30 Jan 2018 - 19:54

Bonsoir,

Je vous remercie pour vos réponses.

J'ai fait une ACP car je sais à peu près l'utiliser. Comme parmi les résultats obtenus de l'enquête il y'a quelques variables nominales (diplôme par exemple), je ne peut pas les utiliser. Je voudrais utiliser, si possibles ces autres variables afin d'obtenir un meilleur construit ou du moins en dégager des informations (ex: les diplômés en finance sont moins bon en relation client que ceux en RH). Peut-être qu'une autre méthode serait mieux appropriée, pour éviter d'avoir à vouloir discrétiser ces variables non utilisées dans l'ACP; d'où mon post.

Le critère de 70% est, m'a dit un professeur, considéré dans la pratique.


Je ne peux hélas ni joindre de fichier ni poster un lien au vu de mon ancienneté sur le forum. Je tenterai dans 6 jours. En espérant que vous pourrez y jeter un coup d'oeil.


Merci !


Cordialement

stdenis90

Nombre de messages : 6
Date d'inscription : 29/01/2018

Revenir en haut Aller en bas

Discrétisation de variables qualitatives nominales et autres Empty Re: Discrétisation de variables qualitatives nominales et autres

Message par stdenis90 Mar 30 Jan 2018 - 19:56

S'il est possible d'envoyer des fichiers ou lien en MP, je peux le faire, avec vos autorisations.


Cordialement

stdenis90

Nombre de messages : 6
Date d'inscription : 29/01/2018

Revenir en haut Aller en bas

Discrétisation de variables qualitatives nominales et autres Empty Re: Discrétisation de variables qualitatives nominales et autres

Message par Florent Aubry Mer 31 Jan 2018 - 8:06

Peut-être qu'une autre méthode serait mieux appropriée, pour éviter d'avoir à vouloir discrétiser ces variables non utilisées dans l'ACP; d'où mon post.
Tu peux utiliser l'analyse factorielle multiple ou l'analyse factorielle pour données mixtes (cf. l'équipe de J. Pagès à Rennes, une des références sur ce type de problème).

Quant au 70%, on trouve aussi dans la littérature et encore plus souvent 80% mais comme Eric et moi l'avons souligné cela n'a pas grand sens car cela dépend des liens entre les variables. Quelques références : https://www.agroparistech.fr/IMG/pdf/AnalyseComposantesPrincipales-AgroParisTech.pdf, http://iml.univ-mrs.fr/~reboul/ADD3-MAB.pdf, https://www.math.univ-toulouse.fr/~besse/Wikistat/pdf/st-m-explo-acp.pdf

Florent Aubry

Nombre de messages : 251
Date d'inscription : 02/11/2015

Revenir en haut Aller en bas

Discrétisation de variables qualitatives nominales et autres Empty Re: Discrétisation de variables qualitatives nominales et autres

Message par droopy Mer 31 Jan 2018 - 8:59

Bonjour,

tu as l'analyse mixte ou analyse dite de Hill & Smith qui permet de conjuguer dans une même analyse des données quantitatives et qualitatives. Si tu n'avais que des données catégorielles l'analyse se comporte comme une ACM (analyse des correspondances multiples), si tu n'avais que des données quantitatives alors l'analyse se comporte comme une ACP centrée réduite.
https://pbil.univ-lyon1.fr/R/pdf/thema2B.pdf

cdlt
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Discrétisation de variables qualitatives nominales et autres Empty Re: Discrétisation de variables qualitatives nominales et autres

Message par stdenis90 Mer 31 Jan 2018 - 18:11

Bonsoir,

Merci beaucoup pour vos réponses!


Cordialement

stdenis90

Nombre de messages : 6
Date d'inscription : 29/01/2018

Revenir en haut Aller en bas

Discrétisation de variables qualitatives nominales et autres Empty Re: Discrétisation de variables qualitatives nominales et autres

Message par stdenis90 Jeu 22 Fév 2018 - 0:30

Bonjour,

Je me permets de revenir solliciter vos avis.

Si une analyse mixte ou une ACP infirme l'une de mes hypothèses adjacentes, est-il logique de faire des tests par équation structurelle sachant que les SEM ont pour buts de quantifier les relations de cause à effet? Les tests ont ont ainsi peu ou pas de chance d'être probants. Les tests doivent-ils n'être fait qu'avec les variables composantes de l'hypothèse adjacente confirmée? 


Ma réflexion est-elle bonne?


Cordialement

stdenis90

Nombre de messages : 6
Date d'inscription : 29/01/2018

Revenir en haut Aller en bas

Discrétisation de variables qualitatives nominales et autres Empty Re: Discrétisation de variables qualitatives nominales et autres

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum