Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Standardisation?
3 participants
Page 1 sur 1
Standardisation?
Bonjour,
je suis nouvelle sur ce forum et après avoir consulté bcp de sujets, je me décide à poster ma question.
Je travaille dans le domaine de l'assurance - marketing.
J'ai 3 segments de clientèle (TPE, PME et Corporates).
Pour chaque segment, j'ai le montant des primes, montant des sinistres, le tx (sinistre/prime), le nombre de clients, le nombre de polices par produit.
Segment TPE:
Primes en € Sinistres en € Txsinistre Nb clients Nb Polices
Produit 1 221 173 78.4% 2'285 2'483
Produit 2 150 110 73.2% 1'715 1'772
Produit 3 83 31 36.9% 3'286 3'696
Produit 4 54 22 41.6% 1'185 1'477
Produit 5 40 25 62.6% 1'304 1'396
Je souhaite savoir s'il existe un segment plus profitable (ie avec un tx de sinistre le + faible) que les autres si on avait le même Business Mix càd la même répartition par produit.
J'avais pensé faire une standardisation..mais ne suis plus très sure. Qu'en pensez-vous?
Et si je standardise, comment faire: utiliser le montant des primes ou bien le nombre de clients?...Quelle population de référence prendre (je pensais prendre toute la population ei la somme des 3 segments).
Merci pour votre aide
je suis nouvelle sur ce forum et après avoir consulté bcp de sujets, je me décide à poster ma question.
Je travaille dans le domaine de l'assurance - marketing.
J'ai 3 segments de clientèle (TPE, PME et Corporates).
Pour chaque segment, j'ai le montant des primes, montant des sinistres, le tx (sinistre/prime), le nombre de clients, le nombre de polices par produit.
Segment TPE:
Primes en € Sinistres en € Txsinistre Nb clients Nb Polices
Produit 1 221 173 78.4% 2'285 2'483
Produit 2 150 110 73.2% 1'715 1'772
Produit 3 83 31 36.9% 3'286 3'696
Produit 4 54 22 41.6% 1'185 1'477
Produit 5 40 25 62.6% 1'304 1'396
Je souhaite savoir s'il existe un segment plus profitable (ie avec un tx de sinistre le + faible) que les autres si on avait le même Business Mix càd la même répartition par produit.
J'avais pensé faire une standardisation..mais ne suis plus très sure. Qu'en pensez-vous?
Et si je standardise, comment faire: utiliser le montant des primes ou bien le nombre de clients?...Quelle population de référence prendre (je pensais prendre toute la population ei la somme des 3 segments).
Merci pour votre aide
all- Nombre de messages : 5
Date d'inscription : 25/08/2010
Re: Standardisation?
Pas de réponse;-)
J'ai effectué une standardisation en utilisant le montant des primes par produit et en prenant comme population de référence la répartition globale (tottal segment).
Question : Les taux standardisés trouvés pour chaque segment sont ils comparables?
J'ai effectué une standardisation en utilisant le montant des primes par produit et en prenant comme population de référence la répartition globale (tottal segment).
Question : Les taux standardisés trouvés pour chaque segment sont ils comparables?
all- Nombre de messages : 5
Date d'inscription : 25/08/2010
Re: Standardisation?
Salut,
tu n'as pas de réponse car ta question est difficile à cerner. Qu'entends tu par standardisation ?? Et pourquoi veux tu standardiser (si on parle bien le même langage) car de toute façon ça ne va répondre à aucune question, la standardisation est au mieux une étape pas une fin en soit ?
Pense bien au fait que c'est un forum de stat, donc notre langage commun à tous ce sont les maths. Oublie ton vocabulaire économique et présente les choses simplement, tu auras alors plus de chance d'obtenir une réponse.
utilise les balises de code pour présenter ton tableau de données.
tu n'as pas de réponse car ta question est difficile à cerner. Qu'entends tu par standardisation ?? Et pourquoi veux tu standardiser (si on parle bien le même langage) car de toute façon ça ne va répondre à aucune question, la standardisation est au mieux une étape pas une fin en soit ?
même répartition de quoi ?Je souhaite savoir s'il existe un segment plus profitable (ie avec un tx de sinistre le + faible) que les autres si on avait le même Business Mix càd la même répartition par produit.
ça ne nous donne aucune indication sur ce que tu as fait.J'ai effectué une standardisation en utilisant le montant des primes par produit et en prenant comme population de référence la répartition globale (tottal segment).
Pense bien au fait que c'est un forum de stat, donc notre langage commun à tous ce sont les maths. Oublie ton vocabulaire économique et présente les choses simplement, tu auras alors plus de chance d'obtenir une réponse.
utilise les balises de code pour présenter ton tableau de données.
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Standardisation?
Je réexplique donc l'analyse que je souhaite faire...
L'objectif de mon étude est de comparer le loss ratio (=Sum(Prime)/Sum(Sinistre)) des 3 populations que j'ai (à savoir TPE, PME et Corporates).
L'objectif est de rendre comparable le loss ratio de ces 3 populations afin de savoir s'il existe une population plus profitable (avec un loss ratio plus faible) que les autres
->j'ai donc pensé à faire une standardisation car on veut comparer le loss ratio de populations où la répartition par produit est différente (la question de savoir, quel critère de répartition utiliser est abordée ci dessous)
Le but est descriptif et aussi dans un but de test ( la diff entre les 3 populations est -elle significative).
A l'origine la standardisation de taux a été utilisée ds des études épidémiologiques pour comparer, par ex, des taux de décés de différentes régions (avec répartition par âge différente):
on a alors pour chaque région, par âge, le nombre d'habitants (nia), le nombre de décés (mia) et le taux (tia).
Tx standardisés de la population a = (sum(tia*ni*))/Nref
Dans ce cas on prend la répartition du nombre d'habitants pour effectuer la standardisation car le taux à standardiser est le taux de décés, par définition définit par rapport au nombre d'habitants.
Mes questions:
-Au départ je pensais également prendre la répartition par client pour standardiser mais il me semble que ca n'a pas de sens car le taux que je souhaite standardiser
est défini par montant sinistre/montant prime (pas en tenant compte de la répartition par client)-> j'ai donc pris la répartition des primes. Est-ce logique?
-Comme population de référence j'ai pris la population globale ie la somme des 3 populations, est-ce que ca a un sens?
-Enfin, puis je comparer les 3 taux standardisés entre eux? Dans mon exemple je trouve TS1=60% TS2= 51% TS3=78%
ou vaut-il mieux calculer les CMF(=TS/Taux brut de la population de reference) et tester s'ils sont égaux à 1 ou non (et ds ce cas, quel test faire?)?
CMF1=99% CMF2=83% CMF3=129%
Je n'ai pas Réussi à intégrer mon fichier excel. Je n'ai réussi que ca :
L'objectif de mon étude est de comparer le loss ratio (=Sum(Prime)/Sum(Sinistre)) des 3 populations que j'ai (à savoir TPE, PME et Corporates).
L'objectif est de rendre comparable le loss ratio de ces 3 populations afin de savoir s'il existe une population plus profitable (avec un loss ratio plus faible) que les autres
->j'ai donc pensé à faire une standardisation car on veut comparer le loss ratio de populations où la répartition par produit est différente (la question de savoir, quel critère de répartition utiliser est abordée ci dessous)
Le but est descriptif et aussi dans un but de test ( la diff entre les 3 populations est -elle significative).
A l'origine la standardisation de taux a été utilisée ds des études épidémiologiques pour comparer, par ex, des taux de décés de différentes régions (avec répartition par âge différente):
on a alors pour chaque région, par âge, le nombre d'habitants (nia), le nombre de décés (mia) et le taux (tia).
Tx standardisés de la population a = (sum(tia*ni*))/Nref
Dans ce cas on prend la répartition du nombre d'habitants pour effectuer la standardisation car le taux à standardiser est le taux de décés, par définition définit par rapport au nombre d'habitants.
Mes questions:
-Au départ je pensais également prendre la répartition par client pour standardiser mais il me semble que ca n'a pas de sens car le taux que je souhaite standardiser
est défini par montant sinistre/montant prime (pas en tenant compte de la répartition par client)-> j'ai donc pris la répartition des primes. Est-ce logique?
-Comme population de référence j'ai pris la population globale ie la somme des 3 populations, est-ce que ca a un sens?
-Enfin, puis je comparer les 3 taux standardisés entre eux? Dans mon exemple je trouve TS1=60% TS2= 51% TS3=78%
ou vaut-il mieux calculer les CMF(=TS/Taux brut de la population de reference) et tester s'ils sont égaux à 1 ou non (et ds ce cas, quel test faire?)?
CMF1=99% CMF2=83% CMF3=129%
Je n'ai pas Réussi à intégrer mon fichier excel. Je n'ai réussi que ca :
- Code:
Population Produit Prime in Mio Sinistre in Mio Loss Ratio Nb de clients Nb de polices Expected Sinistre Taux standardisé CMF
TPE Auto 613 456 74.4% 67'369 185'607 876.8208498 =E2*C14
TPE Maison 307 266 86.7% 16'842 34'266 638.0905093 =E3*C15
TPE Voyage 307 38 12.4% 28'070 65'677 96.29967427 =E4*C16
TPE 1TOTAL 1'227 760 62.0% 112'281 285'550 1611.211033 =summe(I2:I4) 60% =H5/C17 99% =J5/E17
PME Auto 500 320 64.0% 5'269 15'002 753.92
PME Maison 160 125 78.1% 1'027 10'000 575
PME Voyage 100 4 4.0% 1'646 2'008 31.12
PME 1TOTAL 760 449 59.1% 7'942 27'010 1360.04 51% 83%
Corporates Auto 65 68 104.6% 12'456 30'789 1232.369231
Corporates Maison 269 200 74.3% 6'123 16'987 547.2118959
Corporates Voyage 371 157 42.3% 1'786 14'279 329.2345013
Corporates 1TOTAL 705 425 60.3% 20'365 62'055 2108.815628 78% 129%
Total Auto 1'178 844 71.7% 85'094 231'398
Total Maison 736 591 80.3% 23'992 61'253
Total Voyage 778 199 25.6% 31'502 81'964
Total TOTAL 2'692 1'634 60.7% 140'588 374'615
all- Nombre de messages : 5
Date d'inscription : 25/08/2010
Re: Standardisation?
Bonjour,
pas de réponse..au risque de me faire encore "envoyée balader" je me permets de vous relancer ...au moins sur la question concernant le test sur les CMF...
merci
pas de réponse..au risque de me faire encore "envoyée balader" je me permets de vous relancer ...au moins sur la question concernant le test sur les CMF...
merci
all- Nombre de messages : 5
Date d'inscription : 25/08/2010
Re: Standardisation?
Je sais que je suis fatigué mais c'est quand même pas beaucoup plus clair...
Pour la standardisation il faut avant tout réfléchir au sens de la variable obtenu et donc à l'influence de chacune des opérations qui lui sont appliquées. Ceci implique une bonne connaissance des données et donc on ne pourra que difficilement t'aiguiller .
Je ne vois pas bien pourquoi tu standardises mais là c'est sans doute parce que j'ai un peu de mal ce soir. Donc peux tu expliquer clairement ce qui t'amène à standardiser, en gros pourquoi ne pourrais tu pas comparer directement tes taux
Pour la pop de référence, si c'est la même valeur pour tout, pourquoi diviser par cette valeur ?? ça ne change rien, non ?
A priori, je dirai que tu peux comparer tes taux standardisés et ça ressemble à de l'ANCOVA ton affaire. Mais j'ai encore une fois du mal à saisir complètement ton problème.
Je vais pas être très dispo avant la semaine prochaine donc n'attend pas une réponse très rapide
Nik
Mes questions:
-Au départ je pensais également prendre la répartition par client pour standardiser mais il me semble que ca n'a pas de sens car le taux que je souhaite standardiser
est défini par montant sinistre/montant prime (pas en tenant compte de la répartition par client)-> j'ai donc pris la répartition des primes. Est-ce logique?
-Comme population de référence j'ai pris la population globale ie la somme des 3 populations, est-ce que ca a un sens?
-Enfin, puis je comparer les 3 taux standardisés entre eux? Dans mon exemple je trouve TS1=60% TS2= 51% TS3=78%
ou vaut-il mieux calculer les CMF(=TS/Taux brut de la population de référence) et tester s'ils sont égaux à 1 ou non (et ds ce cas, quel test faire?)?
Pour la standardisation il faut avant tout réfléchir au sens de la variable obtenu et donc à l'influence de chacune des opérations qui lui sont appliquées. Ceci implique une bonne connaissance des données et donc on ne pourra que difficilement t'aiguiller .
Je ne vois pas bien pourquoi tu standardises mais là c'est sans doute parce que j'ai un peu de mal ce soir. Donc peux tu expliquer clairement ce qui t'amène à standardiser, en gros pourquoi ne pourrais tu pas comparer directement tes taux
Pour la pop de référence, si c'est la même valeur pour tout, pourquoi diviser par cette valeur ?? ça ne change rien, non ?
A priori, je dirai que tu peux comparer tes taux standardisés et ça ressemble à de l'ANCOVA ton affaire. Mais j'ai encore une fois du mal à saisir complètement ton problème.
Je vais pas être très dispo avant la semaine prochaine donc n'attend pas une réponse très rapide
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Standardisation?
Bonjour,
un peu comme Nik, je trouve difficile de cerner ton problème vue que ça part un peu dans tous les sens, mais c'est tout à ton honneur vue que tu veux résoudre un problème à partir de la littérature, et ça c'est bien.
La première chose que je te conseillerais serait de bien cerner les hypothèses en généralisant la littérature dont tu veux t'inspirer, limite oublier le contexte, ce que sont les variables, juste chercher les hypothèses mathématiques, statistiques et probabilistes.
Surtout qu'aprés tu essayes de faire l'analogie en fonction de la définition de tes variables alors que tu devrais juste te restreindre à leur propriété mathématique et anticiper les projections que tu souhaites faire.
Enfin je te rassure, beaucoup on lu ton topic, mais le mois de septembre est toujours délicat entre les reprises des facs et les mémoires de fin d'étude à finaliser.
un peu comme Nik, je trouve difficile de cerner ton problème vue que ça part un peu dans tous les sens, mais c'est tout à ton honneur vue que tu veux résoudre un problème à partir de la littérature, et ça c'est bien.
La première chose que je te conseillerais serait de bien cerner les hypothèses en généralisant la littérature dont tu veux t'inspirer, limite oublier le contexte, ce que sont les variables, juste chercher les hypothèses mathématiques, statistiques et probabilistes.
Surtout qu'aprés tu essayes de faire l'analogie en fonction de la définition de tes variables alors que tu devrais juste te restreindre à leur propriété mathématique et anticiper les projections que tu souhaites faire.
Enfin je te rassure, beaucoup on lu ton topic, mais le mois de septembre est toujours délicat entre les reprises des facs et les mémoires de fin d'étude à finaliser.
Re: Standardisation?
Merci pour vos réponses...sympa...
J'ai déjà utilisé la standardisation dans des études épidémiologiques.
Pour mon pb actuel, l'idée était de se dire "si on a un univers comparable (même Business Mix dans chaque Segment = en terme + statistiques même répartition par produit dans chaque population) est ce qu'on trouve quand même un loss ratio différent pour chaque segment et du coup on pourra dire que le segment a un impact sur le loss ratio...et en déduire quel segment a le meilleur loss ratio...
Si je fais le paralléle avec des études épidémiologiques: quand on veut comparer le tx de décés dans 2 départements qui n'ont pas la même répartition par âge, on standardise ...en effet si dans un département on a une population bcp plus vieille que dans l'autre, le taux de décés sera automatiquement plus élevé...il y a un lien entre le taux de décés et l'âge de la population...
Dans mon pb actuel, il y a un lien entre le loss ratio et les produits... (si dans un segment/population, on a plus d'assurance auto que dans un autre, cela a un impact direct sur le loss ration du segment/population)
C'est pour cela que j'ai pensé standardiser...
Mais du coup, avec vos remarques, je me demande si je n'aurai pas du utiliser autre chose que la standardisation...
J'ai déjà utilisé la standardisation dans des études épidémiologiques.
Pour mon pb actuel, l'idée était de se dire "si on a un univers comparable (même Business Mix dans chaque Segment = en terme + statistiques même répartition par produit dans chaque population) est ce qu'on trouve quand même un loss ratio différent pour chaque segment et du coup on pourra dire que le segment a un impact sur le loss ratio...et en déduire quel segment a le meilleur loss ratio...
Si je fais le paralléle avec des études épidémiologiques: quand on veut comparer le tx de décés dans 2 départements qui n'ont pas la même répartition par âge, on standardise ...en effet si dans un département on a une population bcp plus vieille que dans l'autre, le taux de décés sera automatiquement plus élevé...il y a un lien entre le taux de décés et l'âge de la population...
Dans mon pb actuel, il y a un lien entre le loss ratio et les produits... (si dans un segment/population, on a plus d'assurance auto que dans un autre, cela a un impact direct sur le loss ration du segment/population)
C'est pour cela que j'ai pensé standardiser...
Mais du coup, avec vos remarques, je me demande si je n'aurai pas du utiliser autre chose que la standardisation...
all- Nombre de messages : 5
Date d'inscription : 25/08/2010
Re: Standardisation?
Non mais énormément d'outils statistiques sont adaptables à une multitude de contexte, les Perceptrons qui sont batis à la base pour la reconnaissance d'image font des classifieurs pour biopuce trés performant, les PLS conçut à la base pour la chimiométrie excelle dans la recherche génomique, bref tu as bien fait en cherchant un problème comparable et l'application de sa solution à ton problème, mais il faut toujours prendre en compte uniquement le contexte mathématique, je pense que si tu fais ça tu sauras toi même si c'est adapté à ton problème ou pas.
Mais tu devrais également attendre l'avis de Nik une fois qu'il aura le temps, et puis même dés la troisième semaine de septembre les gens auront plus le temps pour ce type de question qui demande quand se lance dans le machin.
Mais tu devrais également attendre l'avis de Nik une fois qu'il aura le temps, et puis même dés la troisième semaine de septembre les gens auront plus le temps pour ce type de question qui demande quand se lance dans le machin.
Re: Standardisation?
Salut,
Je crois qu'on a bien compris la philosophie de ton idée et effectivement elle est très classique. J'ajouterai plus loin dans le message mon avis sur la standardisation.
Avant tout il faut que tu répondes à mes question dans mon précédent message car tes réponses (ou questions) m'aideront à t'aiguiller car je ne comprend pas tout sur ce qu'on appelle le plan d'échantillonnage de ton étude. Là si je veux comprendre il faut que je me relise à chaque fois toute la discussion et donc ça devient vite lourd à gérer (je bosse à côté... ).
Donc essaye de bien clarifier le problème (l'analogie à des termes moins économiques aide bien ).
Ce passage :
Pour la pop de ref, tu as fait la somme de quoi et pourquoi ? Du coup la dernière question est vide de sens pour moi n'ayant pas compris les premières étapes.
Réédite ton premier message et utilise les balises de code pour présenter ton tableau qui allait très bien je pense pour comprendre.
Voilà on verra ensuite pour donner des réponses plus précises.
En ce qui concerne la standardisation comme elle est souvent appliquée de partout (une division par un nombre sensé représenter la partie d'un tout), elle a pour but de rendre comparable des objets qui initialement ne le sont pas. En général, le problème vient d'un nombre de valeur plus élevés dans certaines catégories.
Après relecture tu cherches simplement au final à faire une ANOVA en comparant tes trois populations. Donc tu cherches à savoir si en moyenne tes populations sont différentes au regard du loss ratio.
Ta standardisation vise donc à ramener ces moyennes à des variances comparables.
Le nombre de valeur influe non pas sur la moyenne mais aussi et surtout sur la variance de tes données. En gros tu vas mathématiquement fortement rapprocher les valeurs issus de population à fort effectif et faiblement transformer les valeurs de population à faible effectif. Le problème que tu crées est un pb de variance. Une faible population a alors plus de chance d'avoir une grande variance qu'une grande population dont la variance est fortement contrainte par la division par un grand effectif. Il y a alors de fortes chances que tes valeurs ne soient plus comparable au regard de leur variance. Tu va donc déplacer le problème.
Je pourrais être plus clair quand j'aurais bien assimilé ce que tu entends par répartition et comment tu as fait tes calculs
Nik
Je crois qu'on a bien compris la philosophie de ton idée et effectivement elle est très classique. J'ajouterai plus loin dans le message mon avis sur la standardisation.
Avant tout il faut que tu répondes à mes question dans mon précédent message car tes réponses (ou questions) m'aideront à t'aiguiller car je ne comprend pas tout sur ce qu'on appelle le plan d'échantillonnage de ton étude. Là si je veux comprendre il faut que je me relise à chaque fois toute la discussion et donc ça devient vite lourd à gérer (je bosse à côté... ).
Donc essaye de bien clarifier le problème (l'analogie à des termes moins économiques aide bien ).
Ce passage :
n'est pas clair du tout. "répartition par client" ne me dit rien car c'est la répartition de quoi ? "Répartition des primes" n'est pas plus parlant donc je ne peux pas discuter sur la logique.Mes questions:
-Au départ je pensais également prendre la répartition par client pour standardiser mais il me semble que ca n'a pas de sens car le taux que je souhaite standardiser
est défini par montant sinistre/montant prime (pas en tenant compte de la répartition par client)-> j'ai donc pris la répartition des primes. Est-ce logique?
-Comme population de référence j'ai pris la population globale ie la somme des 3 populations, est-ce que ca a un sens?
-Enfin, puis je comparer les 3 taux standardisés entre eux? Dans mon exemple je trouve TS1=60% TS2= 51% TS3=78%
ou vaut-il mieux calculer les CMF(=TS/Taux brut de la population de reference) et tester s'ils sont égaux à 1 ou non (et ds ce cas, quel test faire?)?
CMF1=99% CMF2=83% CMF3=129%
Pour la pop de ref, tu as fait la somme de quoi et pourquoi ? Du coup la dernière question est vide de sens pour moi n'ayant pas compris les premières étapes.
Réédite ton premier message et utilise les balises de code pour présenter ton tableau qui allait très bien je pense pour comprendre.
Voilà on verra ensuite pour donner des réponses plus précises.
En ce qui concerne la standardisation comme elle est souvent appliquée de partout (une division par un nombre sensé représenter la partie d'un tout), elle a pour but de rendre comparable des objets qui initialement ne le sont pas. En général, le problème vient d'un nombre de valeur plus élevés dans certaines catégories.
Après relecture tu cherches simplement au final à faire une ANOVA en comparant tes trois populations. Donc tu cherches à savoir si en moyenne tes populations sont différentes au regard du loss ratio.
Ta standardisation vise donc à ramener ces moyennes à des variances comparables.
Le nombre de valeur influe non pas sur la moyenne mais aussi et surtout sur la variance de tes données. En gros tu vas mathématiquement fortement rapprocher les valeurs issus de population à fort effectif et faiblement transformer les valeurs de population à faible effectif. Le problème que tu crées est un pb de variance. Une faible population a alors plus de chance d'avoir une grande variance qu'une grande population dont la variance est fortement contrainte par la division par un grand effectif. Il y a alors de fortes chances que tes valeurs ne soient plus comparable au regard de leur variance. Tu va donc déplacer le problème.
Je pourrais être plus clair quand j'aurais bien assimilé ce que tu entends par répartition et comment tu as fait tes calculs
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|