π
<-
Chat plein-écran
[^]

Amusons-nous avec la loi de Benford !

Discussions scientifiques et scolaires

Amusons-nous avec la loi de Benford !

Message non lude Wistaro » 28 Nov 2017, 21:07

Salut !

Il a quelques jours, à la fin d'un cours de modélisation du hasard (cours sur les modèles univariés si je me souviens bien ), le professeur nous a présenté une loi stupéfiante: la loi de Benford.

Cette loi est très simple à comprendre.

Prenez un échantillon de nombres mesurés, de taille suffisante et de grande amplitude (aka la différence entre la valeur min et max de l'échantillon)
Prenez vraiment n'importe quoi. Par exemple, je vous propose le nombre de personnes possédant une calculatrice Texas Instruments par commune sur un département.

A priori, vous pensez que les valeurs sont totalement "aléatoires" et non corrélées.

Et bien, Benford nous dit que si vous prenez le premier chiffre significatif de tous les nombres de votre échantillon, la fréquence d'apparition du chiffre 1 est de 30,1%, celle du chiffre 2 est de 17,6%, et ainsi de suite!
Image

C'est dingue non ?

C'est loi est tellement universelle, qu'elle sert pour détecter de la fraude dans de nombreux domaines faisant intervenir de grandes séries de nombres (domaine scientifique, fiscal..)

Et oui! Il suffit d'effectuer un test statistique (comme le X2, prononcez "Khi2") à 95% (par exemple !) et de vérifier si on s'éloigne ou pas de Benford.
Dans le cas où l'hypothèse H0 serait rejetée (trop loin de Benford), il y a une fraude potentielle!

Mais cette loi fonctionne-t-elle vraiment partout?

Figurez-vous que je me suis aussi posé la question.

Sur mon site, j'ai calculé la fréquence d'apparition du premier chiffre significatif sur plusieurs séries de données (de grande taille, environ 32000 données par échantillon !) provenant de l'INSEE.
Et le résultat est bluffant!

Je vous laisse regarder: https://wistaro.fr/projets/proba/benford/


Maintenant je vous pose une question: que voudriez-vous que je teste comme données? Auriez-vous des séries de nombres à soumettre au redoutable Benford ? :)

N'hésitez pas à donnez votre avis!

Wistaro
Nouveau sur le site, Anonymous ? Avant de poster sur le chat et sur le forum, n'oublie pas de lire les règles. En cas de problème, tu peux m'envoyer un message, je réponds rapidement.

Liens utiles:
Image
Découvre mes programmes et mon site!
Avatar de l’utilisateur
WistaroSuper Modo
Niveau 15: CC (Chevalier des Calculatrices)
Niveau 15: CC (Chevalier des Calculatrices)
Prochain niv.: 87.5%
 
Messages: 3153
Images: 37
Inscription: 25 Fév 2013, 16:21
Localisation: Toulouse
Genre: Homme
Calculatrice(s):
MyCalcs profile
Classe: Ingénieur en électronique
YouTube: Wistaro
Twitter/X: Wistaro
GitHub: Wistaro

Re: Amusons-nous avec la loi de Benford !

Message non lude Zezombye » 28 Nov 2017, 21:15

Je pense que c'est normal, et que si tu fais avec des nombres aléatoires, en choisissant un bon intervalle tu peux retomber sur cette loi.
Par exemple si je fais des nombres aléatoires de 0 à 15, il y a alors 33% de chance (10-15) d'avoir le chiffre 1 en premier chiffre significatif.
Si tu fais une distribution normale (ce que je pense est le cas de tes données de l'INSEE) de 0 à 30 centrée sur 15, on aura de grandes chances d'avoir un 1 (intervalle 10-19) mais aussi un 2 (intervalle 20-29), avec l'intervalle 0-10 qui est uniforme concernant les nombres.

D'ailleurs, il faudrait tester avec une autre base : binaire, octal, hexa, base64... la règle s'applique-t-elle toujours ? :p
Avatar de l’utilisateur
ZezombyePremium
Niveau 10: GR (Guide de Référence)
Niveau 10: GR (Guide de Référence)
Prochain niv.: 47.7%
 
Messages: 85
Inscription: 30 Sep 2016, 15:14
Genre: Non spécifié
Calculatrice(s):
MyCalcs profile

Re: Amusons-nous avec la loi de Benford !

Message non lude Wistaro » 28 Nov 2017, 21:26

Non justement, il ne s'agit pas de données aléatoires. Il s'agit de données issues de mesure, c'est différent.
Cf http://archimede.mat.ulaval.ca/amq/bull ... Genest.pdf

J'ai essayé de tirer des milliers de chiffres aléatoires puis effectué un test du X2. Le résultat est que Benford n'est absolument pas vérifié!

Pour l'instant ce que j'ai dis, c'est effectivement en base 10.
https://wikimedia.org/api/rest_v1/media ... 42a4f73ce0

Pour une base X, il suffit à priori de prendre le logX(1+1/d). Je suppose :)
Nouveau sur le site, Anonymous ? Avant de poster sur le chat et sur le forum, n'oublie pas de lire les règles. En cas de problème, tu peux m'envoyer un message, je réponds rapidement.

Liens utiles:
Image
Découvre mes programmes et mon site!
Avatar de l’utilisateur
WistaroSuper Modo
Niveau 15: CC (Chevalier des Calculatrices)
Niveau 15: CC (Chevalier des Calculatrices)
Prochain niv.: 87.5%
 
Messages: 3153
Images: 37
Inscription: 25 Fév 2013, 16:21
Localisation: Toulouse
Genre: Homme
Calculatrice(s):
MyCalcs profile
Classe: Ingénieur en électronique
YouTube: Wistaro
Twitter/X: Wistaro
GitHub: Wistaro


Retourner vers Maths, physique, informatique et autre...

Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 12 invités

-
Rechercher
-
Social TI-Planet
-
Sujets à la une
Comparaisons des meilleurs prix pour acheter sa calculatrice !
Aidez la communauté à documenter les révisions matérielles en listant vos calculatrices graphiques !
Phi NumWorks jailbreak
123
-
Faire un don / Premium
Pour plus de concours, de lots, de tests, nous aider à payer le serveur et les domaines...
Faire un don
Découvrez les avantages d'un compte donateur !
JoinRejoignez the donors and/or premium!les donateurs et/ou premium !


Partenaires et pub
Notre partenaire Jarrety Calculatrices à acheter chez Calcuso
-
Stats.
1243 utilisateurs:
>1234 invités
>5 membres
>4 robots
Record simultané (sur 6 mois):
6892 utilisateurs (le 07/06/2017)
-
Autres sites intéressants
Texas Instruments Education
Global | France
 (English / Français)
Banque de programmes TI
ticalc.org
 (English)
La communauté TI-82
tout82.free.fr
 (Français)