Histoires de Mathématiques. Statistique. La statistique littéraire.
Croire en la loi des grands nombres.
Auteur : Ycart Bernard
Résumé
Le premier article de statistique de l’histoire est aussi le premier article de cryptographie. Il a été écrit par al-Kindi, qui explique le décryptage par analyse de fréquences, et donne des fréquences de lettres en arabe. La croyance en la stabilité des fréquences de lettres, est un exemple d’une l’illusion courante autour de la loi des grands nombres. Les faibles fluctuations de moyennes empiriques n’impliquent pas nécessairement qu’elles tendent vers une valeur théorique. C’est rarement le cas dans le domaine littéraire, mais ce n’est que récemment qu’il en a été pris conscience. Abstract The first paper in statistics is also the first in cryptography. It was written by al-Kindi, who explains decyphering by frequency analysis, and gives letter frequencies in arabic. The belief in the stability of letter frequencies is an example of a common illusion around the law of large numbers. The weak fluctuations of empirical means do not necessarily imply that they tend to a theorical value. This is seldom the case in litterary fields, which has been recognized only recently.
Notes
Depuis le site Histoires de Mathématiques , cette histoire est racontée dans le diaporama vidéo https://www.hist-math.fr/recits/mendenhall.html (durée : 28:17). Le fichier PDF associé permet d’utiliser le contenu des écrans https://www.hist-math.fr/pdf/mendenhall.pdf (13 p.).
Le site Histoires de mathématiques contient 228 récits concernant les mathématiques et leur histoire. Ils sont de format homogène : un diaporama vidéo de 20 à 30 minutes, un fichier PDF contenant le texte et une trentaine de transparents accessibles depuis sa fenêtre de liens.
Cette ressource est en ligne sur le site https://hist-math.fr/
Pistes d’utilisation en classe
Compter les occurrences d’une lettre donnée dans un texte, par exemple à l’aide des outils d’un traitement de texte, est une activité statistique très abordable, dès le cycle 4. Utiliser ces comptes pour décoder un code monoalphabétique est facile et amusant, dès le même cycle. Réaliser un échantillon de comptes dans un même texte parmi des paquets de quelques centaines de lettres consécutives, permettra d’introduire des histogrammes, des intervalles de fluctuation, des intervalles de confiance, et une compréhension intuitive de la loi des grands nombres. Mais on prendra soin, en passant d’un texte à l’autre, de montrer que la valeur théorique qui est apparemment approchée par des moyennes partielles, n’est en fait que la fréquence dans le texte complet. Cette fréquence peut varier sensiblement d’un texte à l’autre, y compris chez un même auteur.
Données de publication
Éditeur Ycart, Bernard Grenoble , 2017 Index Bibliogr. p. 17-17
Public visé élève ou étudiant, enseignant, tout public Niveau 1re, 2de, 3e, 4e, 5e, 6e, collège, école élémentaire, lycée, terminale Âge 10, 11, 12, 13, 14, 15, 16, 17, 8, 9
Type Film, vidéo, monographie, polycopié, vulgarisation, popularisation Langue français Support internet
Classification
Mots-clés