Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Le Deal du moment : -67%
Carte Fnac+ à 4,99€ au lieu de 14,99€ ...
Voir le deal
4.99 €

problème de modélisation

2 participants

Aller en bas

problème de modélisation Empty problème de modélisation

Message par statistiques Mar 17 Aoû 2010 - 20:18

Bonjour,

J'ai des données sur lesquelles j'aimerais créer une fonction statistique ou utiliser une méthode pour comparer les données et en faire sortir de l'information agrégée.
Le hic c'est que je trouve que les données ne sont pas manipulables statistiquement (quali ? quanti ? ou alors les deux ??? mais alors quelle méthode ???) et voilà pourquoi j'aimerais un peu d'aide : (d'avance merci alien )


voici les données avec à chaque fois le type de variable (bon, je déguise certaines variables) :
colonne 1 à 5 : les caractéristiques de mes objets (les objets : x1 x2 ... x20) :
a) famille : nominale (quali)
x = objet
b) marque : nominale et quali
c) largeur : continue et quanti (avec un max et un mim)
d) couleur/sans couleur : nominale et binaire donc quali (0/1)
e) dans une boîte/sans boîte : nominale et binaire donc quali (0/1)

colonne 5 à 10 : que des quantitatives (continues) qui sont les substances constituants les objets, qui sont issues de relevés. on dira f) g) h) i) j) sachant que ces variables ne sont pas exprimées dans la même unité.

Arrow Mon objectif est de pouvoir comparer chaque objet avec les autres objets, tout en prenant en compte les caractéristiques qui sont intrinsèques à un produit donné :
-comparer x1/x2, x1/x3..., x2/x1, x2/x3, x3/x4, x3/x5, ... en fonction de a), b)... What a Face
-x est obligatoirement une fonction agrégée de (largeur, couleur/sans couleur, dans une boîte/sans boîte).
-x = quantité de f + quantité de g + quantité de h + quantité de i + quantité de j (sachant que ces substances sont liées à la composition de l'objet, donc quelque part indissociables).


alien Alors, faut-il une matrice de corrélation ? Franchement, si vous avez une idée... A L'AIDE!!!

A première vue, les données ne semblent pas linéaires si on cherche la normalité de la répartition de la quantité pour une substance donnée, c'est-à-dire : pour la substance g, la fonction de fréquence ne montre pas une distribution normale. Or, vu le peu d'objets (20), peut-on conclure ?

Comment tirer de l'information pertinente pour comparer les objets entre eux au sein d'une famille et entre les familles ?

Méthode statistique ? matrice de comparaison ? JE NAGE!! Information : je travaille sous excel, au besoin. merci clown


statistiques

Nombre de messages : 8
Date d'inscription : 17/08/2010

Revenir en haut Aller en bas

problème de modélisation Empty Re: problème de modélisation

Message par joyeux_lapin13 Mer 18 Aoû 2010 - 7:24

Bonjour,

as-tu une variable réponse? je demande au cas où j'aurais mal lu où tu l'aurais oublié.

Si ce n'est pas le cas il te faudra partir sur de la classification non supervisée je pense.
joyeux_lapin13
joyeux_lapin13

Nombre de messages : 1927
Age : 41
Localisation : Mayotte
Date d'inscription : 21/04/2010

https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

problème de modélisation Empty Re: problème de modélisation

Message par statistiques Mer 18 Aoû 2010 - 18:39

Qu'entendez-vous par variable réponse ?

Et pourquoi une classification non supervisée ? J'avais pensé à la classification mais les données ne suivaient pas un aspect linéaire, je ne sais pas comment faire.

merci pour votre réponse, je serais curieux d'entendre la suite.

statistiques

Nombre de messages : 8
Date d'inscription : 17/08/2010

Revenir en haut Aller en bas

problème de modélisation Empty Re: problème de modélisation

Message par joyeux_lapin13 Mer 18 Aoû 2010 - 19:20

Une variable réponse est la colonne qui te donne le statut de tes individus en fait, c'était celà que je voulais savoir.

Aprés:
- classification supervisée = règle de classification construite à partir d'un jeux de données dont on connait le statut des individus
- classificiation non supervisée = règle de classification construite à partir d'un jeux de données dont on ne connait pas des invidivus
joyeux_lapin13
joyeux_lapin13

Nombre de messages : 1927
Age : 41
Localisation : Mayotte
Date d'inscription : 21/04/2010

https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

problème de modélisation Empty Re: problème de modélisation

Message par statistiques Mer 18 Aoû 2010 - 19:33

Peut-on faire cela sous excel ? (Je regarde en même temps sur le net)
à propos, super la mascotte!

statistiques

Nombre de messages : 8
Date d'inscription : 17/08/2010

Revenir en haut Aller en bas

problème de modélisation Empty Re: problème de modélisation

Message par joyeux_lapin13 Mer 18 Aoû 2010 - 19:39

J'imagine que tu demandes si on peut construire des règles de classifications sous Excel... je crois savoir qu'on peut y faire de la régression, par contre le logiciel R qui reste l'un des musts pour faire de l'analyse statistique est gratuit et vraiment trés trés bien, si tu as des notions d'algorithmiques tu devrais vite trouver de quoi faire.
joyeux_lapin13
joyeux_lapin13

Nombre de messages : 1927
Age : 41
Localisation : Mayotte
Date d'inscription : 21/04/2010

https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

problème de modélisation Empty Re: problème de modélisation

Message par joyeux_lapin13 Mer 18 Aoû 2010 - 19:46

Bref, tu devrais voir du coté des analyses d'Hill & Smith, la procédure est disponible sur ce forum en fouillant un tout petit peu, notemment sur un topic de cette même page tu as la métho, la syntaxe sous R ainsi que deux pdfs expliquant la théo.

PS: désolé pour le double post, c'était au cas où tu aurais déjà lu le premier...
joyeux_lapin13
joyeux_lapin13

Nombre de messages : 1927
Age : 41
Localisation : Mayotte
Date d'inscription : 21/04/2010

https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

problème de modélisation Empty Re: problème de modélisation

Message par statistiques Mer 18 Aoû 2010 - 20:01

je ne sais pas utiliser R, et je n'aurais pas assez de temps pour le faire. Désolé... par contre, je connais Gretl.

je ne comprends pas "le statut des individus" ????

Est-ce que l'on peut définir une fonction polynomiale ? si oui, comment ?

Sinon, j'ai pensé à faire une matrice de variation avec en :
intitulés de colonnes : x1, x2; xi
en première colonne : x1, x2, x3... xi
et dans les cellules, exemples x2/x1 entrer le taux de variation : ((x2-x1)/x1) multiplié par 100.
faire cette matrice pour la variable f
une autre pour g
... on peut alors comparer les produits pour chaque caractéristique.

Qu'en pensez-vous ? merci...

mon but est de pouvoir étudier la variation, car pour la variance, je ne sais pas si cela marche, quant à la factorisation...!!

statistiques

Nombre de messages : 8
Date d'inscription : 17/08/2010

Revenir en haut Aller en bas

problème de modélisation Empty Re: problème de modélisation

Message par joyeux_lapin13 Mer 18 Aoû 2010 - 20:13

J'ai un peu de mal à te suivre en fait... et je me perds un peu dans les notations vue qu'un coup j'ai l'impression que Xi représente une variable et un coup j'ai l'impression que c'est un individu...

Etant donné qu'il ne semble pas y avoir de variable à expliquer mais uniquement des caractéristiques, je pense que le mieux est de s'orienter vers une analyse en composante qui débouchera sur des équations expliquant la variance, dés lors tu auras la contribution de chaque variable sur chaque composantes et tu pourras tirer des conclusions.

L'analyse d'Hill et Smith semble donc interessante étant donné que tu as des variables quantitatives et qualitatives à étudier en même temps.

Eventuellement attends demain dans la journée, tu devrais avoir l'avis d'autre personne participant à ce forum.
joyeux_lapin13
joyeux_lapin13

Nombre de messages : 1927
Age : 41
Localisation : Mayotte
Date d'inscription : 21/04/2010

https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

problème de modélisation Empty Re: problème de modélisation

Message par statistiques Jeu 19 Aoû 2010 - 18:35

salut,

merci. En effet, j'avais aussi pensé à l'analyse en composantes, mais je crois qu'il faut que les données suivent une loi normale, non ?

Ok, pour l'analyse d'Hill & Smith, pourquoi pas ? En effet, ce sont des caractéristiques c'est-à-dire les mesures de leurs substances (chimiques, je suppose).

Avez-vous la méthode sous la main ? sinon, je la rechercherai sur le net. Sinon, pouvez-vous m'en dire un peu plus ?

merci cheers

statistiques

Nombre de messages : 8
Date d'inscription : 17/08/2010

Revenir en haut Aller en bas

problème de modélisation Empty Re: problème de modélisation

Message par joyeux_lapin13 Jeu 19 Aoû 2010 - 18:56

Comme je te l'ai dit, tu trouveras un topic portant ce nom ou tu trouveras la syntaxe R ainsi que deux pdfs rappelant en gros la théorie et permettant l'utilisation sous un autre logiciel dont je ne sais plus le nom.

Pour la lecture des graphes je te conseil de regarder du coté des ACP non normé et leur interprétation, non pas que je ne veuille pas te donner la solution directement mais je pense que ça ne peut t'être que bénéfique d'aller à la pêche aux informations du coté de l'analyse exploratoire statistique.
joyeux_lapin13
joyeux_lapin13

Nombre de messages : 1927
Age : 41
Localisation : Mayotte
Date d'inscription : 21/04/2010

https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

problème de modélisation Empty Re: problème de modélisation

Message par statistiques Jeu 19 Aoû 2010 - 19:44

, non pas que je ne veuille pas te donner la solution directement mais je pense que ça ne peut t'être que bénéfique d'aller à la pêche aux informations du coté de l'analyse exploratoire statistique.

--> En fait, j'aimerais travailler dans la statistique lol! mais pour l'instant, je vais vous avouer que ça fait 3 mois que je traîne le fichier, et bom drunken ...

ok, je donnerais des nouvelles... a +

statistiques

Nombre de messages : 8
Date d'inscription : 17/08/2010

Revenir en haut Aller en bas

problème de modélisation Empty Re: problème de modélisation

Message par statistiques Dim 22 Aoû 2010 - 14:21

Bonjour,

Quelques précisions :
- Xi sont des objets, donc des individus
- a, b, c, d, e sont des variables explicatives ou, je dirai des paramètres
- f, g, h, sont les variables issues des caractéristiques des individus. Donc, des variables réponses, n'est-ce pas ? PRECISION : chaque variable, f par exemple, est déjà une agrégation d'un sous-ensemble de données.
J'aimerais préciser qu'entre le groupe {a, b, c, d, e} et {f, g, h} la relation semble assez "lâche". En s'appuyant sur la nature des données, la dépendance semble être très faible.


merci;

statistiques

Nombre de messages : 8
Date d'inscription : 17/08/2010

Revenir en haut Aller en bas

problème de modélisation Empty Re: problème de modélisation

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum