Une histoire des statistiques
Statistiques : Étymologie et définition
Le terme statistique est un emprunt moderne (1771) au latin statisticus "relatif à l'état" (1672).
- Ce terme a d'abord désigné l'étude méthodique des faits sociaux qui définissent un État par des nombres : dénombrement, inventaires chiffrés, recensements, ...
- Puis à la fin du 18ème siècle, le terme prend un sens plus moderne en Angleterre (dès 1792) chez sir J. Sinclair (statistics) ;
- En 1830, le terme statistique désigne "l'ensemble des techniques d'interprétation mathématique appliquées à des phénomènes".
- En 1862, le terme désigne "un ensemble de données numériques concernant une même catégorie de faits".
- Actuellement, le mot « statistique » désigne à la fois un ensemble de données d'observation et l'activité qui consiste dans leur recueil, leur traitement et leur interprétation.
Le traitement de ces données bénéficie des moyens offerts par les ordinateurs et utilise des théorèmes d'algèbre linéaire, de probabilité...
Il convient de souligner au moins la distinction entre les deux définitions suivantes qui sont évidemment liées :
– statistique : activité qui consiste à réunir des données, concernant en particulier la connaissance de la situation des États ou des sociétés humaines (c'est le « budget des choses » de Napoléon) ;
– statistique : méthode de traitement et d'interprétation des observations, de passage de celles-ci aux lois des phénomènes et aux modèles théoriques susceptibles de les représenter (c'est l'« inférence statistique » des statisticiens classiques, qu'on a eu quelque raison d'assimiler à l'induction formalisée).
Histoire de la notion de statistiques
La notion de comptage
La science statistique semble exister dès la naissance des premières structures sociales. D'ailleurs, les premiers textes écrits retrouvés étaient des recensements du bétail, des informations sur son cours et des contrats divers.
Les plus anciennes traces de comptage datent des premières civilisation du Paléolithique (30 000 ans environ av. J.-C.).
Les hommes, qui durent apprendre à conserver les nombres, avaient à leur disposition deux supports privilégiés, les os et le bois.
Pour mémoriser combien il y avait d'éléments dans un ensemble de choses (bêtes, hommes ou objets), les hommes du Paléolithique faisaient une marque (souvent une entaille) sur le support choisi.
Ainsi, des "os numériques" de près de 30 000 ans ont été retrouvé.
Pour assurer cette fonction de mémorisation de la quantité, l'homme, hormis l'os, le bois ou la pierre, a aussi utilisé son propre corps (doigts, orteils, bras, jambes, articulations..).
Les recensements
- En Chine et en Egypte
On a aussi des traces de recensements en Chine au 23e siècle av. J.-C. ou en Égypte au 17e siècle av. J.-C.. - A Rome
Cicéron (106 av. J.-C. et mort en 43 av. J.-C.) insistait sur l'importance des statistiques (avant le mot) :
"Il est nécessaire au sénateur d'avoir une notion complète de l'Etat ; et cela s'étend loin : savoir l'effectif de l'armée, la puissance financière, les alliés, amis et tributaires que possède l'Etat ; [...] connaître les précédents traditionnels des décisions à prendre, l'exemple des ancêtres... Vous voyez enfin tout ce que cela comporte en général de savoir, d'application, de mémoire, et sur quoi un sénateur ne saurait en aucune manière se trouver pris au dépourvu."
Le recensement romain permettait à la fois, de connaître les ressources en hommes mobilisables et en biens, et de classer les citoyens afin de répartir charges et avantages. Le recensement était également une démonstration de puissance, permettant de proclamer publiquement l'ampleur de la domination romaine.
Selon Tacite, l'empereur Auguste aurait été le premier à faire un bilan des richesses de l'empire romain (soldats, navires, ressources privées et publiques). Au IIIe siècle apparaissent à Rome des tables d'estimation des rentes viagères.
A partir du XIIIe siècle, les données deviennent plus nombreuses. Les commerçants de Venise amassent des données sur le commerce extérieur, évaluent les risques maritimes. En Hollande, on étudie les rentes viagères. Au XVIe siècle la tenue des registres des naissances est rendue obligatoire en France, par François Ier, puis, sous Henri III, ceux des mariages et naissances.
- En Europe
Ce système de recueil de données se poursuit jusqu'au 17e siècle. En Europe, le rôle "statisticien" est souvent tenu par des guildes marchandes, puis par les intendants de l'État.
Les premières estimations de population
- John Graunt dans Natural and Political Observations Made upon the Bills of Mortality a estimé la population de Londres en 1662 en s'aidant des registres paroissiaux. Il savait qu'il y avait environ 13 000 enterrements par an à Londres et que trois personnes pour onze familles mouraient par an. Il a estimé à partir des registres paroissiaux que la taille moyenne de la famille était de 8 et a calculé que la population de Londres était d'environ 384 000. Le mathématicien Laplace (1802), utilise une méthode similaire pour estimer la population française.
- A la suite des travaux fondateurs de Graunt (1620-1674) sur les bulletins de décès et les naissances (il découvre ainsi la proportion plus grande de naissances masculines : 107 pour 100 naissances féminines), l'économiste William Petty (1623-1687) systématise et théorise les études démographiques sur les naissances, décès, nombres de personnes par famille...
- Tables de mortalité
- En 1696, l'astronome anglais Edmond Halley (1662 – 1742), en se basant sur cinq ans d'état civil de la ville de Breslau (Pologne), établit une table de mortalité, préfigurant les travaux d'actuariat.
- En Hollande, le calcul des probabilités est appliqué à l'espérance de vie humaine (Christian et Louis Huygens en 1669) et à l'estimation du prix d'achat d'une rente, à l'aide de tables de mortalité (Jan De Witt en 1671).
Statistiques mathématiques
- Le premier écrit sur les statistiques est : "Manuscrit pour Décrypter les messages cryptographiques», du mathématicien arabe Al-Kindi (801-873). Al-Kindi y donne une description détaillée de la façon d'utiliser les statistiques et l'analyse de la fréquence de déchiffrer les messages chiffrés.
- Les diagrammes
- Florence Nightingale (1820-1910), une infirmière anglaise est la première à utiliser les diagrammes circulaires, développés par William Playfair en 1801. Après la Guerre de Crimée, elle se met à utiliser une version améliorée de ces diagrammes (équivalant aux diagrammes circulaires d'aujourd'hui), afin d'illustrer les causes saisonnières de mortalité des patients de l'hôpital militaire qu'elle gère. Par la suite, Nightingale réalise une étude statistique complète du système sanitaire dans les campagnes indiennes .
- En 1786, William Playfair (1759-1823) publie à Londres "The Commercial and Political Atlas" contenant le premier diagramme en barres connu, puis en 1801 "The Statistical Breviary" illustré de diagrammes en secteurs.
- Florence Nightingale (1820-1910), une infirmière anglaise est la première à utiliser les diagrammes circulaires, développés par William Playfair en 1801. Après la Guerre de Crimée, elle se met à utiliser une version améliorée de ces diagrammes (équivalant aux diagrammes circulaires d'aujourd'hui), afin d'illustrer les causes saisonnières de mortalité des patients de l'hôpital militaire qu'elle gère. Par la suite, Nightingale réalise une étude statistique complète du système sanitaire dans les campagnes indiennes .
- La médiane
L'idée de médiane apparait dans un livre d'Edward Wright sur la navigation (Erreurs Certaine en navigation, 1599) dans une section concernant la détermination de sa localisation à la boussole. Wright estime que cette valeur médiane était la plus pertinente dans une série d'observations. - Moyenne, médiane, quartile
En 1906, les mesures avec des moyennes, tout comme les idées de médiane, quartiles, mode, moyenne arithmétique, nombres indices, écart type, etc. faisaient déjà partie du savoir des statisticiens avancés, et ils étaient utilisés couramment dans les statistiques officielles en Grande-Bretagne et aux États-Unis. - La statistique mathématique apparait dans des manuels d'enseignement français dans les années vingt (1920). Les méthodes de la corrélation développées par Bravais (1846), Galton (1888), Edgeworth, Pearson et Yule, étaient déjà généralisées avant l'institutionnalisation de l'enseignement de la statistique mathématique.
- La loi normale
L'établissement, au début du XIXe siècle, de la loi "normale", s'est fait :- dans le cadre de la "théorie des erreurs", avec la méthode des moindres carrés avec Carl Friedrich Gauss (1777-1855) ;
- dans celui des théorèmes limites, avec l'énoncé d'une première version du théorème limite central par Pierre Simon Laplace (1749-1827).
Sources
- [Rey] : Alain REY (Dictionnaire historique de la langue française) - Le Robert -, Paris, 2000.
- Singh, Simon : Histoire des codes secrets. De l'Égypte des pharaons à l'ordinateur quantique, Lattès, Paris, 1999. (ISBN 2709620480), Livre de Poche, 2001. (ISBN 2253150975)
- Encyclopaedia universalis
- Larousse
Articles Connexes