22 oct. 2007

Mensonges & Statistiques (3)

L’ordre et le hasard

Parfois, le hasard paraît faire trop bien les choses. Ou trop mal. Certains arrangements de choses nous paraissent trop bien (ou trop mal) arrangés pour être le seul fruit du hasard.

Exemple 1 : quand les 36 habitants du village de Wishaw (West Midlands, Royaume-Uni) réalisent que 9 d’entre eux sont malades du cancer, leur sang ne fait qu’un tour. Il doit bien y avoir une explication, une cause. Immédiatement, tous les regards se tournent vers l’émetteur de téléphonie mobile, installé à 50 mètres du village. Peu après, un commando masqué démonte l’émetteur. Depuis, la population fait front commun pour empêcher sa réinstallation.

En réalité, l’infortune collective de Wishaw n’a d’autre cause que le hasard. Pour le comprendre, prenez un sac de riz. Ouvrez-le puis jetez le riz en l’air. Observez la chute des grains, puis étudiez leur distribution aléatoire au sol. Vous verrez que les grains sont disséminés un peu partout dans la pièce, mais, de ci de là, de petits agrégats se sont formés. C’est la même chose avec le cancer. Le taux moyen dans la population sera peut-être de 5 %, mais la dispersion autour de la moyenne est considérable. Dans certains villages, par chance, aucun villageois n’est (encore) atteint ; dans d’autres, comme à Wishaw, on dénombre 25 % de malades. La faute à pas de chance…

Ce type de phénomènes est connu en accidentologie sous le nom de « loi des séries ». En moyenne, on compte un accident d’avion par mois, mais, certains mois, on en comptera 0, et d’autres mois, 4 ou 5. De même, si vous jouez cent coups à pile ou face, vous obtiendrez globalement à peu près 50 fois pile et 50 fois face, mais avec des séries de 4, 5 voire 6 piles et des séries de 4, 5 ou 6 faces.

Exemple 2 : Les radars permettent-ils de réduire le nombre des accidents mortels sur la route ? Si l’on en croit un communiqué de presse du Département des Transport (DfT) daté du 11 février 2003, la réponse est positive : "Le nombre de morts a baissé de 35% sur les routes où les radars ont été installés, a annoncé le secrétaire aux transport, Alistair Darling. Ces chiffres montrent clairement que les radars sont efficaces. Les vitesses sont en baisse et, par voie de conséquences, le nombre des accidents graves et des morts sur la route a baissé lui aussi… Cela signifie que plus de vies peuvent être sauvées et plus d’accidents évités."

Concrètement, la baisse de 35 % de la mortalité correspond à 280 vies épargnées. L’affaire semble donc entendue, et le gouvernement a logiquement décidé qu’il fallait augmenter le nombre des radars sur les routes britanniques. En réalité, les choses ne sont pas si simples. Sur une route donnée, le nombre des accidents varie beaucoup d’une année à l’autre. Or, les premiers radars ont probablement été installés sur les routes où l’on a enregistré un nombre d’accidents en hausse l’année précédente. Le fait est que ce type de problème attire plus facilement l’attention des autorités quand les chiffres sont en hausse. Les médias et l’opinion s’émeuvent, et les autorités se disent qu’il faut faire quelque chose. Donc, on fait quelque chose, et l’année suivante, les chiffres étant meilleurs, i.e. étant revenus au niveau auquel on était habitué, l’autorité peut s’exclamer : « Vous voyez ! C’est grâce à nous ! »

Las ! Si l'on part d’un sommet, il faut s’attendre à descendre. Ce phénomène est connu en statistique sous le nom de « régression vers la moyenne ». Partant d’un point haut de la courbe des décès, il fallait bien s’attendre à comptabiliser moins d’accidents l’année suivante, avec ou sans radars (cf. graph. ci-dessous). De fait, trois ans plus tard, le gouvernement a admis que la baisse de 35 % s’expliquait pour les 3/5ème par l’effet que nous venons d’exposer, et pour 1/5ème par la baisse générale du nombre des accidents – y compris là où l’on n’avait pas mis de radars. L’effet propre des radars aurait donc consisté en une diminution, non plus de 35 %, mais de 7 % seulement de la mortalité… Un taux de 7 %, cela représente malgré tout 56 vies sauvées. Encore faudrait-il s’assurer que, pour la même dépense en temps et en argent, une autre politique n’aurait pas fait mieux…
.


Moralité : quand on cherche à rendre compte d'une régularité statistique, il ne faut pas exclure le hasard.

Source : Michael Blastland et Andrew Dilnot: "The Tiger that Isn't: Seeing Through a World of Numbers", Profile Books, 185 pages, 2007.

nb: certaines combinaisons de loto paraissent aux gens plus hasardeuses que d’autres. Ainsi, quand on leur pose la question suivante : "Votre tonton préféré a rempli deux grilles de loto. Il vous en offre une, au choix. La première avec la combinaison suivante: 3,4,5,6,7,8 et la seconde avec les numéros 9,13,20,26,32,46. Laquelle choisiriez-vous ?", les élèves répondent comme un seul homme qu’ils préfèrent la seconde. La combinaison « 3,4,5,6,7,8 » a l’air trop bien ordonnée, elle correspond moins bien à l'idée que l'on se fait du hasard qu’une combinaison du type « 9,13,20,26,32,46 ». Pourtant, les deux combinaisons ont exactement la même probabilité d’occurrence ! 6x5x4x3x2x1 / 49x48x47x46x45x44 = soit 1 chance sur 14 millions…

Aucun commentaire: