Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Discrétisation de variables qualitatives nominales et autres
4 participants
Page 1 sur 1
Discrétisation de variables qualitatives nominales et autres
Bonjour,
Dans le cadre de ma thèse j'ai réalisé une enquête quantitative (questionnaire standardisé).
Pour le traitement statistique j'ai discrétisé les variables qualitatives (ordinales) essentiellement en échelle de Likert; ce qui était sans complication. Pour discrétiser l'expérience, j'ai procédé par médiane (0 à 2 ans = 1; 2 à 7 ans = 5; > 7 ans = 9). Trouvez-vous cela juste?
Enfin, dans mon analyse par composantes principales (sur le logiciel TANAGRA), les deux axes significatifs (selon le critère de Kaiseur=> valeur propre >1) n'atteignent pas 70% (62%). Au lieu d'intégrer le 3ème axe pour atteindre 70%, je voudrais intégrer au modèle des éléments collectés mais non utilisés car je n'ai pas pu les discrétiser. Par exemple, peut-on discrétiser des variables qualitatives nominales telles que le domaine d'activité (informatique, finance, RH, etc.), le diplôme (doctorat, master, licence, etc.), les niveaux de besoins de la pyramide de maslow, etc. Je pense qu'en les ajoutant au modèle ACP, il y'aura assez d'éléments pour le construit, et il sera possible d'atteindre 70% de significativité sur deux axes.
Par ailleurs, avec le modèle à l'état actuel, lorsque je teste les hypothèses (générale et adjacentes) par la méthode des équations structurelles (sur le logiciel SPSS AMOS), les résultats et les tests sont globalement satisfaisants. Cependant, ils (les résultats) changent négativement (surtout le test du khi2 qui n'est pas bon) lorsque je teste les inter corrélations entre sous-variables avec les liaisons (flèches). Est-ce parce qu'elles ne sont pas indépendantes ou y'aurait-il un raté de ma part?
Merci !!
Cordialement
Dans le cadre de ma thèse j'ai réalisé une enquête quantitative (questionnaire standardisé).
Pour le traitement statistique j'ai discrétisé les variables qualitatives (ordinales) essentiellement en échelle de Likert; ce qui était sans complication. Pour discrétiser l'expérience, j'ai procédé par médiane (0 à 2 ans = 1; 2 à 7 ans = 5; > 7 ans = 9). Trouvez-vous cela juste?
Enfin, dans mon analyse par composantes principales (sur le logiciel TANAGRA), les deux axes significatifs (selon le critère de Kaiseur=> valeur propre >1) n'atteignent pas 70% (62%). Au lieu d'intégrer le 3ème axe pour atteindre 70%, je voudrais intégrer au modèle des éléments collectés mais non utilisés car je n'ai pas pu les discrétiser. Par exemple, peut-on discrétiser des variables qualitatives nominales telles que le domaine d'activité (informatique, finance, RH, etc.), le diplôme (doctorat, master, licence, etc.), les niveaux de besoins de la pyramide de maslow, etc. Je pense qu'en les ajoutant au modèle ACP, il y'aura assez d'éléments pour le construit, et il sera possible d'atteindre 70% de significativité sur deux axes.
Par ailleurs, avec le modèle à l'état actuel, lorsque je teste les hypothèses (générale et adjacentes) par la méthode des équations structurelles (sur le logiciel SPSS AMOS), les résultats et les tests sont globalement satisfaisants. Cependant, ils (les résultats) changent négativement (surtout le test du khi2 qui n'est pas bon) lorsque je teste les inter corrélations entre sous-variables avec les liaisons (flèches). Est-ce parce qu'elles ne sont pas indépendantes ou y'aurait-il un raté de ma part?
Merci !!
Cordialement
stdenis90- Nombre de messages : 6
Date d'inscription : 29/01/2018
Re: Discrétisation de variables qualitatives nominales et autres
Votre question n'est pas claire.
D'abord, pourquoi vouloir discrétiser ? Vous allez perdre une énorme quantité d'information sans rien gagner en échange.
Ensuite, vous parlez d'ACP. Mais dans une ACP les variables sont toutes quantitatives. Pas de discrétisation nécessaire ici.
Par ailleurs, d'où sortez-vous cette règle de 70% ? Ca dépend du nombre de variables dans votre ACP (et vous ne dites rien là-dessus). 70% sur deux ou trois axes, si vous avez par exemple 30 variables, c'est énorme..
Il me semble que des informations de base sur l'utilisation d'une ACP vous seraient utiles avant de vous lancer dans des calculs compliqués, et en apparence sans objet.
HTH, Eric.
D'abord, pourquoi vouloir discrétiser ? Vous allez perdre une énorme quantité d'information sans rien gagner en échange.
Ensuite, vous parlez d'ACP. Mais dans une ACP les variables sont toutes quantitatives. Pas de discrétisation nécessaire ici.
Par ailleurs, d'où sortez-vous cette règle de 70% ? Ca dépend du nombre de variables dans votre ACP (et vous ne dites rien là-dessus). 70% sur deux ou trois axes, si vous avez par exemple 30 variables, c'est énorme..
Il me semble que des informations de base sur l'utilisation d'une ACP vous seraient utiles avant de vous lancer dans des calculs compliqués, et en apparence sans objet.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Discrétisation de variables qualitatives nominales et autres
Pour compléter la réponse d'Eric concernant l'ACP quand elle s'applique, le choix du nombre de dimension par un seuil en pourcentage peut conduire à conserver des dimensions non significatives quand les variables sont très corrélées (exemple caricatural : 10 variables dont deux corrélées à 0.95 et les autres non corrélées, i.e. corrélation nulle), 70% conduit à conserver 5 dimensions ce qui n'a pas de sens. Le critère de Kaiser n'est pas meilleur. Il existe des critères formels soit basés sur une hypothèses de normalité des données qui ne donnent pas non plus de très bons résultats dans le cas général (données éloignées de la normalité) ou sur des techniques de rééchantillonnage qui peuvent être efficaces mais à manipuler aussi avec précaution. A mon avis, la méthode visuelle empirique dite du coude, ou critère de Cattell, est très souvent le meilleur compromis. De plus, elle est souvent inutilisable pour toutes les techniques d'analyse exploratoire multidimensionnelle.
Florent Aubry- Nombre de messages : 251
Date d'inscription : 02/11/2015
Re: Discrétisation de variables qualitatives nominales et autres
Bonsoir,
Je vous remercie pour vos réponses.
J'ai fait une ACP car je sais à peu près l'utiliser. Comme parmi les résultats obtenus de l'enquête il y'a quelques variables nominales (diplôme par exemple), je ne peut pas les utiliser. Je voudrais utiliser, si possibles ces autres variables afin d'obtenir un meilleur construit ou du moins en dégager des informations (ex: les diplômés en finance sont moins bon en relation client que ceux en RH). Peut-être qu'une autre méthode serait mieux appropriée, pour éviter d'avoir à vouloir discrétiser ces variables non utilisées dans l'ACP; d'où mon post.
Le critère de 70% est, m'a dit un professeur, considéré dans la pratique.
Je ne peux hélas ni joindre de fichier ni poster un lien au vu de mon ancienneté sur le forum. Je tenterai dans 6 jours. En espérant que vous pourrez y jeter un coup d'oeil.
Merci !
Cordialement
Je vous remercie pour vos réponses.
J'ai fait une ACP car je sais à peu près l'utiliser. Comme parmi les résultats obtenus de l'enquête il y'a quelques variables nominales (diplôme par exemple), je ne peut pas les utiliser. Je voudrais utiliser, si possibles ces autres variables afin d'obtenir un meilleur construit ou du moins en dégager des informations (ex: les diplômés en finance sont moins bon en relation client que ceux en RH). Peut-être qu'une autre méthode serait mieux appropriée, pour éviter d'avoir à vouloir discrétiser ces variables non utilisées dans l'ACP; d'où mon post.
Le critère de 70% est, m'a dit un professeur, considéré dans la pratique.
Je ne peux hélas ni joindre de fichier ni poster un lien au vu de mon ancienneté sur le forum. Je tenterai dans 6 jours. En espérant que vous pourrez y jeter un coup d'oeil.
Merci !
Cordialement
stdenis90- Nombre de messages : 6
Date d'inscription : 29/01/2018
Re: Discrétisation de variables qualitatives nominales et autres
S'il est possible d'envoyer des fichiers ou lien en MP, je peux le faire, avec vos autorisations.
Cordialement
Cordialement
stdenis90- Nombre de messages : 6
Date d'inscription : 29/01/2018
Re: Discrétisation de variables qualitatives nominales et autres
Tu peux utiliser l'analyse factorielle multiple ou l'analyse factorielle pour données mixtes (cf. l'équipe de J. Pagès à Rennes, une des références sur ce type de problème).Peut-être qu'une autre méthode serait mieux appropriée, pour éviter d'avoir à vouloir discrétiser ces variables non utilisées dans l'ACP; d'où mon post.
Quant au 70%, on trouve aussi dans la littérature et encore plus souvent 80% mais comme Eric et moi l'avons souligné cela n'a pas grand sens car cela dépend des liens entre les variables. Quelques références : https://www.agroparistech.fr/IMG/pdf/AnalyseComposantesPrincipales-AgroParisTech.pdf, http://iml.univ-mrs.fr/~reboul/ADD3-MAB.pdf, https://www.math.univ-toulouse.fr/~besse/Wikistat/pdf/st-m-explo-acp.pdf
Florent Aubry- Nombre de messages : 251
Date d'inscription : 02/11/2015
Re: Discrétisation de variables qualitatives nominales et autres
Bonjour,
tu as l'analyse mixte ou analyse dite de Hill & Smith qui permet de conjuguer dans une même analyse des données quantitatives et qualitatives. Si tu n'avais que des données catégorielles l'analyse se comporte comme une ACM (analyse des correspondances multiples), si tu n'avais que des données quantitatives alors l'analyse se comporte comme une ACP centrée réduite.
https://pbil.univ-lyon1.fr/R/pdf/thema2B.pdf
cdlt
tu as l'analyse mixte ou analyse dite de Hill & Smith qui permet de conjuguer dans une même analyse des données quantitatives et qualitatives. Si tu n'avais que des données catégorielles l'analyse se comporte comme une ACM (analyse des correspondances multiples), si tu n'avais que des données quantitatives alors l'analyse se comporte comme une ACP centrée réduite.
https://pbil.univ-lyon1.fr/R/pdf/thema2B.pdf
cdlt
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Discrétisation de variables qualitatives nominales et autres
Bonsoir,
Merci beaucoup pour vos réponses!
Cordialement
Merci beaucoup pour vos réponses!
Cordialement
stdenis90- Nombre de messages : 6
Date d'inscription : 29/01/2018
Re: Discrétisation de variables qualitatives nominales et autres
Bonjour,
Je me permets de revenir solliciter vos avis.
Si une analyse mixte ou une ACP infirme l'une de mes hypothèses adjacentes, est-il logique de faire des tests par équation structurelle sachant que les SEM ont pour buts de quantifier les relations de cause à effet? Les tests ont ont ainsi peu ou pas de chance d'être probants. Les tests doivent-ils n'être fait qu'avec les variables composantes de l'hypothèse adjacente confirmée?
Ma réflexion est-elle bonne?
Cordialement
Je me permets de revenir solliciter vos avis.
Si une analyse mixte ou une ACP infirme l'une de mes hypothèses adjacentes, est-il logique de faire des tests par équation structurelle sachant que les SEM ont pour buts de quantifier les relations de cause à effet? Les tests ont ont ainsi peu ou pas de chance d'être probants. Les tests doivent-ils n'être fait qu'avec les variables composantes de l'hypothèse adjacente confirmée?
Ma réflexion est-elle bonne?
Cordialement
stdenis90- Nombre de messages : 6
Date d'inscription : 29/01/2018
Sujets similaires
» Test d'association sur variables nominales ou ordinale ?
» Ajustement sur variables qualitatives et rég. logistique
» variables qualitatives
» Inter dépendance variables qualitatives
» intéractions entre variables qualitatives
» Ajustement sur variables qualitatives et rég. logistique
» variables qualitatives
» Inter dépendance variables qualitatives
» intéractions entre variables qualitatives
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum