Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
statistique et guerre 1418
2 participants
Page 1 sur 1
statistique et guerre 1418
Bonsoir à tous
Je m'appelle Patrice, j'habite la Bretagne et je suis passionné d'histoire et en particulier de la guerre 1418. J'ai besoin de votre aide et de vos lumières.
Il existe un site (http://www.memoiredeshommes.sga.defense.gouv.fr/spip.php?page=base_recherche&_Base=MPF1418&_Action=1) où les sodats décédés durant la grande guerre sont classés par ordre alphabétique; ce site comprend a peu près 1,3 million de fiches d'hommes morts durant cette guerre.
Chaque fiche de soldat donne plusieurs renseignements : date de naissance, lieu de naissance, date de décès, lieu de décès, grade, régiment.
J'ai sélectionné 13398 fiches sur les 1,3 million; cette sélection s'est faite par ordre alphabétique, j'ai pris la fiche 1, la fiche 100, la fiche 200, etc....
J'ai tiré des conclusions que j'ai mis sur un site (http://www.grande-guerre-1418.com/index.php?option=com_content&task=section&id=4&Itemid=27)
La partie du site qui nous concerne va du chapitre "Méthodologie" à "comment meurt le soldat 1418". Je vous imagine déjà en train de sourire en voyant les histogrammes et autres schémas du site.
Mes interrogations sont les suivantes :
Est qu'en sélectionnant (de façon alphabétique) 1% de la totalité des fiches de soldats décédés, mes statistiques sont fiables?
Est-ce que avec cet échantillon, je peux me permettre de dire il y a eu x morts le 25.09.15 où est-il plus prudent de dire il y a eu y morts du 21 Septembre 15 au 25 Septembre 15 ou encore dois je me contenter de dire "il y a eu z morts en Septembre 15" (j'espère que vous me suivez); autrement dit si ces statistiques sont fiables, jusqu'à quel point?
J'espère que j'ai été suffisemment clair
Je vous souhaite une bonne soirée
Patrice
Je m'appelle Patrice, j'habite la Bretagne et je suis passionné d'histoire et en particulier de la guerre 1418. J'ai besoin de votre aide et de vos lumières.
Il existe un site (http://www.memoiredeshommes.sga.defense.gouv.fr/spip.php?page=base_recherche&_Base=MPF1418&_Action=1) où les sodats décédés durant la grande guerre sont classés par ordre alphabétique; ce site comprend a peu près 1,3 million de fiches d'hommes morts durant cette guerre.
Chaque fiche de soldat donne plusieurs renseignements : date de naissance, lieu de naissance, date de décès, lieu de décès, grade, régiment.
J'ai sélectionné 13398 fiches sur les 1,3 million; cette sélection s'est faite par ordre alphabétique, j'ai pris la fiche 1, la fiche 100, la fiche 200, etc....
J'ai tiré des conclusions que j'ai mis sur un site (http://www.grande-guerre-1418.com/index.php?option=com_content&task=section&id=4&Itemid=27)
La partie du site qui nous concerne va du chapitre "Méthodologie" à "comment meurt le soldat 1418". Je vous imagine déjà en train de sourire en voyant les histogrammes et autres schémas du site.
Mes interrogations sont les suivantes :
Est qu'en sélectionnant (de façon alphabétique) 1% de la totalité des fiches de soldats décédés, mes statistiques sont fiables?
Est-ce que avec cet échantillon, je peux me permettre de dire il y a eu x morts le 25.09.15 où est-il plus prudent de dire il y a eu y morts du 21 Septembre 15 au 25 Septembre 15 ou encore dois je me contenter de dire "il y a eu z morts en Septembre 15" (j'espère que vous me suivez); autrement dit si ces statistiques sont fiables, jusqu'à quel point?
J'espère que j'ai été suffisemment clair
Je vous souhaite une bonne soirée
Patrice
pat56- Nombre de messages : 2
Date d'inscription : 22/12/2009
Re: statistique et guerre 1418
Je ne suis probablement pas le plus compétent en stats ici (à la base je suis dans l'aquaculture), mais je peux donner mon avis en espérant que cela peu aider.
Je ne pense pas que la méthode d'éhantillonage induise de biais, mais il existe une méthode plus sure et plus courante: l'échantillonage aléatoire. Quand je dois en faire un , je génère une séquence de X nombres aléatoires issus d'un ensemble Y, le tout sans remplacement. Cette série de nombres correspond aux numéros des individus constituant l'échantillon
C'est très simple à faire avec R , et il y a juste à taper la commande suivante :
NUM_A_ECHANTILLONER<-sample(1:1380000,13398,replace=FALSE)
Où X est 1:1380000 ,qui signifie "toutes les valeurs de 1 à 1380000 soit le nombre total de valeurs
Où Y est 13398 soit la taille de l'échantillon souhaité
Où NUM_A_ECHANTILLONER un vecteur contenant tout les numéros à échantilloner
Pour ce qui est du nombre de morts, je crois qu'il manque des précisions:
Est ce que l'on extrapole le nombre de morts par jours , semaines ou mois à partir de l'échantillon ou bien se base t'on sur le jeu de donné réel?
Si l'on se base sur le jeu de donné réel il est possible de faire des moyennes (" en moyenne il ya eut Q soldats tués par jours durant le mois de sept 1915") où bien de mesuer directement ("selon les donnés disponibles , il ya eut Q soldats tués le 7 sept 1917)
Si l'on extrapole , là il ne sagit plus que d'estimations. Pour estimer le nombre réel de morts à la date Z (jour, mois ,semaines) , il faut multiplier le nombre de morts à la date Z dans l'échantillon par (X/Y).
En résumé il ne faut pas oublier de préciser qu'il s'agit d'estimation ou de moyenne le cas échéant.
J'espère ne pas avoir dit d'énormités et d'avoir été utile.
Je ne pense pas que la méthode d'éhantillonage induise de biais, mais il existe une méthode plus sure et plus courante: l'échantillonage aléatoire. Quand je dois en faire un , je génère une séquence de X nombres aléatoires issus d'un ensemble Y, le tout sans remplacement. Cette série de nombres correspond aux numéros des individus constituant l'échantillon
C'est très simple à faire avec R , et il y a juste à taper la commande suivante :
NUM_A_ECHANTILLONER<-sample(1:1380000,13398,replace=FALSE)
Où X est 1:1380000 ,qui signifie "toutes les valeurs de 1 à 1380000 soit le nombre total de valeurs
Où Y est 13398 soit la taille de l'échantillon souhaité
Où NUM_A_ECHANTILLONER un vecteur contenant tout les numéros à échantilloner
Pour ce qui est du nombre de morts, je crois qu'il manque des précisions:
Est ce que l'on extrapole le nombre de morts par jours , semaines ou mois à partir de l'échantillon ou bien se base t'on sur le jeu de donné réel?
Si l'on se base sur le jeu de donné réel il est possible de faire des moyennes (" en moyenne il ya eut Q soldats tués par jours durant le mois de sept 1915") où bien de mesuer directement ("selon les donnés disponibles , il ya eut Q soldats tués le 7 sept 1917)
Si l'on extrapole , là il ne sagit plus que d'estimations. Pour estimer le nombre réel de morts à la date Z (jour, mois ,semaines) , il faut multiplier le nombre de morts à la date Z dans l'échantillon par (X/Y).
En résumé il ne faut pas oublier de préciser qu'il s'agit d'estimation ou de moyenne le cas échéant.
J'espère ne pas avoir dit d'énormités et d'avoir été utile.
psettamaxima- Nombre de messages : 4
Date d'inscription : 21/06/2007
Re: statistique et guerre 1418
Bonjour Psettamaxima et tous mes voeux pour 2010
Merci pour votre réponse; elle me permet d'éclaicir certains points.
Patrice
Merci pour votre réponse; elle me permet d'éclaicir certains points.
Patrice
pat56- Nombre de messages : 2
Date d'inscription : 22/12/2009
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|