Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
problème de modélisation
2 participants
Page 1 sur 1
problème de modélisation
Bonjour,
J'ai des données sur lesquelles j'aimerais créer une fonction statistique ou utiliser une méthode pour comparer les données et en faire sortir de l'information agrégée.
Le hic c'est que je trouve que les données ne sont pas manipulables statistiquement (quali ? quanti ? ou alors les deux ??? mais alors quelle méthode ???) et voilà pourquoi j'aimerais un peu d'aide : (d'avance merci )
voici les données avec à chaque fois le type de variable (bon, je déguise certaines variables) :
colonne 1 à 5 : les caractéristiques de mes objets (les objets : x1 x2 ... x20) :
a) famille : nominale (quali)
x = objet
b) marque : nominale et quali
c) largeur : continue et quanti (avec un max et un mim)
d) couleur/sans couleur : nominale et binaire donc quali (0/1)
e) dans une boîte/sans boîte : nominale et binaire donc quali (0/1)
colonne 5 à 10 : que des quantitatives (continues) qui sont les substances constituants les objets, qui sont issues de relevés. on dira f) g) h) i) j) sachant que ces variables ne sont pas exprimées dans la même unité.
Mon objectif est de pouvoir comparer chaque objet avec les autres objets, tout en prenant en compte les caractéristiques qui sont intrinsèques à un produit donné :
-comparer x1/x2, x1/x3..., x2/x1, x2/x3, x3/x4, x3/x5, ... en fonction de a), b)...
-x est obligatoirement une fonction agrégée de (largeur, couleur/sans couleur, dans une boîte/sans boîte).
-x = quantité de f + quantité de g + quantité de h + quantité de i + quantité de j (sachant que ces substances sont liées à la composition de l'objet, donc quelque part indissociables).
Alors, faut-il une matrice de corrélation ? Franchement, si vous avez une idée... A L'AIDE!!!
A première vue, les données ne semblent pas linéaires si on cherche la normalité de la répartition de la quantité pour une substance donnée, c'est-à-dire : pour la substance g, la fonction de fréquence ne montre pas une distribution normale. Or, vu le peu d'objets (20), peut-on conclure ?
Comment tirer de l'information pertinente pour comparer les objets entre eux au sein d'une famille et entre les familles ?
Méthode statistique ? matrice de comparaison ? JE NAGE!! Information : je travaille sous excel, au besoin. merci
J'ai des données sur lesquelles j'aimerais créer une fonction statistique ou utiliser une méthode pour comparer les données et en faire sortir de l'information agrégée.
Le hic c'est que je trouve que les données ne sont pas manipulables statistiquement (quali ? quanti ? ou alors les deux ??? mais alors quelle méthode ???) et voilà pourquoi j'aimerais un peu d'aide : (d'avance merci )
voici les données avec à chaque fois le type de variable (bon, je déguise certaines variables) :
colonne 1 à 5 : les caractéristiques de mes objets (les objets : x1 x2 ... x20) :
a) famille : nominale (quali)
x = objet
b) marque : nominale et quali
c) largeur : continue et quanti (avec un max et un mim)
d) couleur/sans couleur : nominale et binaire donc quali (0/1)
e) dans une boîte/sans boîte : nominale et binaire donc quali (0/1)
colonne 5 à 10 : que des quantitatives (continues) qui sont les substances constituants les objets, qui sont issues de relevés. on dira f) g) h) i) j) sachant que ces variables ne sont pas exprimées dans la même unité.
Mon objectif est de pouvoir comparer chaque objet avec les autres objets, tout en prenant en compte les caractéristiques qui sont intrinsèques à un produit donné :
-comparer x1/x2, x1/x3..., x2/x1, x2/x3, x3/x4, x3/x5, ... en fonction de a), b)...
-x est obligatoirement une fonction agrégée de (largeur, couleur/sans couleur, dans une boîte/sans boîte).
-x = quantité de f + quantité de g + quantité de h + quantité de i + quantité de j (sachant que ces substances sont liées à la composition de l'objet, donc quelque part indissociables).
Alors, faut-il une matrice de corrélation ? Franchement, si vous avez une idée... A L'AIDE!!!
A première vue, les données ne semblent pas linéaires si on cherche la normalité de la répartition de la quantité pour une substance donnée, c'est-à-dire : pour la substance g, la fonction de fréquence ne montre pas une distribution normale. Or, vu le peu d'objets (20), peut-on conclure ?
Comment tirer de l'information pertinente pour comparer les objets entre eux au sein d'une famille et entre les familles ?
Méthode statistique ? matrice de comparaison ? JE NAGE!! Information : je travaille sous excel, au besoin. merci
statistiques- Nombre de messages : 8
Date d'inscription : 17/08/2010
Re: problème de modélisation
Bonjour,
as-tu une variable réponse? je demande au cas où j'aurais mal lu où tu l'aurais oublié.
Si ce n'est pas le cas il te faudra partir sur de la classification non supervisée je pense.
as-tu une variable réponse? je demande au cas où j'aurais mal lu où tu l'aurais oublié.
Si ce n'est pas le cas il te faudra partir sur de la classification non supervisée je pense.
Re: problème de modélisation
Qu'entendez-vous par variable réponse ?
Et pourquoi une classification non supervisée ? J'avais pensé à la classification mais les données ne suivaient pas un aspect linéaire, je ne sais pas comment faire.
merci pour votre réponse, je serais curieux d'entendre la suite.
Et pourquoi une classification non supervisée ? J'avais pensé à la classification mais les données ne suivaient pas un aspect linéaire, je ne sais pas comment faire.
merci pour votre réponse, je serais curieux d'entendre la suite.
statistiques- Nombre de messages : 8
Date d'inscription : 17/08/2010
Re: problème de modélisation
Une variable réponse est la colonne qui te donne le statut de tes individus en fait, c'était celà que je voulais savoir.
Aprés:
- classification supervisée = règle de classification construite à partir d'un jeux de données dont on connait le statut des individus
- classificiation non supervisée = règle de classification construite à partir d'un jeux de données dont on ne connait pas des invidivus
Aprés:
- classification supervisée = règle de classification construite à partir d'un jeux de données dont on connait le statut des individus
- classificiation non supervisée = règle de classification construite à partir d'un jeux de données dont on ne connait pas des invidivus
Re: problème de modélisation
Peut-on faire cela sous excel ? (Je regarde en même temps sur le net)
à propos, super la mascotte!
à propos, super la mascotte!
statistiques- Nombre de messages : 8
Date d'inscription : 17/08/2010
Re: problème de modélisation
J'imagine que tu demandes si on peut construire des règles de classifications sous Excel... je crois savoir qu'on peut y faire de la régression, par contre le logiciel R qui reste l'un des musts pour faire de l'analyse statistique est gratuit et vraiment trés trés bien, si tu as des notions d'algorithmiques tu devrais vite trouver de quoi faire.
Re: problème de modélisation
Bref, tu devrais voir du coté des analyses d'Hill & Smith, la procédure est disponible sur ce forum en fouillant un tout petit peu, notemment sur un topic de cette même page tu as la métho, la syntaxe sous R ainsi que deux pdfs expliquant la théo.
PS: désolé pour le double post, c'était au cas où tu aurais déjà lu le premier...
PS: désolé pour le double post, c'était au cas où tu aurais déjà lu le premier...
Re: problème de modélisation
je ne sais pas utiliser R, et je n'aurais pas assez de temps pour le faire. Désolé... par contre, je connais Gretl.
je ne comprends pas "le statut des individus" ????
Est-ce que l'on peut définir une fonction polynomiale ? si oui, comment ?
Sinon, j'ai pensé à faire une matrice de variation avec en :
intitulés de colonnes : x1, x2; xi
en première colonne : x1, x2, x3... xi
et dans les cellules, exemples x2/x1 entrer le taux de variation : ((x2-x1)/x1) multiplié par 100.
faire cette matrice pour la variable f
une autre pour g
... on peut alors comparer les produits pour chaque caractéristique.
Qu'en pensez-vous ? merci...
mon but est de pouvoir étudier la variation, car pour la variance, je ne sais pas si cela marche, quant à la factorisation...!!
je ne comprends pas "le statut des individus" ????
Est-ce que l'on peut définir une fonction polynomiale ? si oui, comment ?
Sinon, j'ai pensé à faire une matrice de variation avec en :
intitulés de colonnes : x1, x2; xi
en première colonne : x1, x2, x3... xi
et dans les cellules, exemples x2/x1 entrer le taux de variation : ((x2-x1)/x1) multiplié par 100.
faire cette matrice pour la variable f
une autre pour g
... on peut alors comparer les produits pour chaque caractéristique.
Qu'en pensez-vous ? merci...
mon but est de pouvoir étudier la variation, car pour la variance, je ne sais pas si cela marche, quant à la factorisation...!!
statistiques- Nombre de messages : 8
Date d'inscription : 17/08/2010
Re: problème de modélisation
J'ai un peu de mal à te suivre en fait... et je me perds un peu dans les notations vue qu'un coup j'ai l'impression que Xi représente une variable et un coup j'ai l'impression que c'est un individu...
Etant donné qu'il ne semble pas y avoir de variable à expliquer mais uniquement des caractéristiques, je pense que le mieux est de s'orienter vers une analyse en composante qui débouchera sur des équations expliquant la variance, dés lors tu auras la contribution de chaque variable sur chaque composantes et tu pourras tirer des conclusions.
L'analyse d'Hill et Smith semble donc interessante étant donné que tu as des variables quantitatives et qualitatives à étudier en même temps.
Eventuellement attends demain dans la journée, tu devrais avoir l'avis d'autre personne participant à ce forum.
Etant donné qu'il ne semble pas y avoir de variable à expliquer mais uniquement des caractéristiques, je pense que le mieux est de s'orienter vers une analyse en composante qui débouchera sur des équations expliquant la variance, dés lors tu auras la contribution de chaque variable sur chaque composantes et tu pourras tirer des conclusions.
L'analyse d'Hill et Smith semble donc interessante étant donné que tu as des variables quantitatives et qualitatives à étudier en même temps.
Eventuellement attends demain dans la journée, tu devrais avoir l'avis d'autre personne participant à ce forum.
Re: problème de modélisation
salut,
merci. En effet, j'avais aussi pensé à l'analyse en composantes, mais je crois qu'il faut que les données suivent une loi normale, non ?
Ok, pour l'analyse d'Hill & Smith, pourquoi pas ? En effet, ce sont des caractéristiques c'est-à-dire les mesures de leurs substances (chimiques, je suppose).
Avez-vous la méthode sous la main ? sinon, je la rechercherai sur le net. Sinon, pouvez-vous m'en dire un peu plus ?
merci
merci. En effet, j'avais aussi pensé à l'analyse en composantes, mais je crois qu'il faut que les données suivent une loi normale, non ?
Ok, pour l'analyse d'Hill & Smith, pourquoi pas ? En effet, ce sont des caractéristiques c'est-à-dire les mesures de leurs substances (chimiques, je suppose).
Avez-vous la méthode sous la main ? sinon, je la rechercherai sur le net. Sinon, pouvez-vous m'en dire un peu plus ?
merci
statistiques- Nombre de messages : 8
Date d'inscription : 17/08/2010
Re: problème de modélisation
Comme je te l'ai dit, tu trouveras un topic portant ce nom ou tu trouveras la syntaxe R ainsi que deux pdfs rappelant en gros la théorie et permettant l'utilisation sous un autre logiciel dont je ne sais plus le nom.
Pour la lecture des graphes je te conseil de regarder du coté des ACP non normé et leur interprétation, non pas que je ne veuille pas te donner la solution directement mais je pense que ça ne peut t'être que bénéfique d'aller à la pêche aux informations du coté de l'analyse exploratoire statistique.
Pour la lecture des graphes je te conseil de regarder du coté des ACP non normé et leur interprétation, non pas que je ne veuille pas te donner la solution directement mais je pense que ça ne peut t'être que bénéfique d'aller à la pêche aux informations du coté de l'analyse exploratoire statistique.
Re: problème de modélisation
, non pas que je ne veuille pas te donner la solution directement mais je pense que ça ne peut t'être que bénéfique d'aller à la pêche aux informations du coté de l'analyse exploratoire statistique.
--> En fait, j'aimerais travailler dans la statistique mais pour l'instant, je vais vous avouer que ça fait 3 mois que je traîne le fichier, et ...
ok, je donnerais des nouvelles... a +
--> En fait, j'aimerais travailler dans la statistique mais pour l'instant, je vais vous avouer que ça fait 3 mois que je traîne le fichier, et ...
ok, je donnerais des nouvelles... a +
statistiques- Nombre de messages : 8
Date d'inscription : 17/08/2010
Re: problème de modélisation
Bonjour,
Quelques précisions :
- Xi sont des objets, donc des individus
- a, b, c, d, e sont des variables explicatives ou, je dirai des paramètres
- f, g, h, sont les variables issues des caractéristiques des individus. Donc, des variables réponses, n'est-ce pas ? PRECISION : chaque variable, f par exemple, est déjà une agrégation d'un sous-ensemble de données.
J'aimerais préciser qu'entre le groupe {a, b, c, d, e} et {f, g, h} la relation semble assez "lâche". En s'appuyant sur la nature des données, la dépendance semble être très faible.
merci;
Quelques précisions :
- Xi sont des objets, donc des individus
- a, b, c, d, e sont des variables explicatives ou, je dirai des paramètres
- f, g, h, sont les variables issues des caractéristiques des individus. Donc, des variables réponses, n'est-ce pas ? PRECISION : chaque variable, f par exemple, est déjà une agrégation d'un sous-ensemble de données.
J'aimerais préciser qu'entre le groupe {a, b, c, d, e} et {f, g, h} la relation semble assez "lâche". En s'appuyant sur la nature des données, la dépendance semble être très faible.
merci;
statistiques- Nombre de messages : 8
Date d'inscription : 17/08/2010
Sujets similaires
» Modélisation
» Modélisation
» modelisation non linéaire
» modélisation analyses microbiologiques
» Modélisation des variables interdépendantes
» Modélisation
» modelisation non linéaire
» modélisation analyses microbiologiques
» Modélisation des variables interdépendantes
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum