23 oct. 2007

Mensonges & Statistiques (4)


Gare aux moyennes

Quelle est la couleur moyenne de l’arc en ciel.
- En moyenne, blanc, Monsieur !

Comme le bikini, la moyenne suggère certaines choses mais cache l’essentiel.

Exemple 1 : Lucie est enceinte. Nous sommes le 23 octobre et le terme normal est passé depuis deux semaines. Lucie est inquiète. A tort. Le terme dit normal est en fait un terme moyen, observé il y a trois cent ans par un professeur de médecine hollandais, Gustaave Boerhaave. C’est à son propos que Samuel Johnson eut ce mot : « So loudly celebrated, and so universally lamented through the wholed learned world ». En moyenne, il faut 280 jours à une femme pour achever sa grossesse. Mais, comme toute moyenne, ce chiffre masque la grande diversité des situations. Beaucoup de grossesses ne vont pas jusqu’à 280 jours -- certains enfants naissent prématurés. Ce qui fait baisser la moyenne. Dans le même ordre d'idées, il faut se rappeler que l’individu moyen a moins de deux jambes, car les unijambistes font baisser la moyenne !

Le terme des 280 jours n’est donc pas représentatif. Une femme qui voudrait savoir quel est le terme normal ne devrait pas tenir compte de la moyenne. Une étude suédoise portant sur 480 000 femmes montre que la moyenne est de 281 jours, mais la médiane de 282 jours et le mode de 283 jours. Autrement dit, la moitié des femmes accouchent après 282 jours, et le terme le plus fréquent est 283 jours, pas 280 !

Tout ceci ne porterait pas à conséquence si la fixation sur la moyenne était sans conséquences médicales. Las ! Fixés sur la norme des 280 jours, les médecins ont tendance à déclencher l’accouchement en cas de retard de plus de deux semaines. Outre qu'ils font encore baisser la moyenne, les accouchements déclenchés impliquent plus souvent que d’autres le recours à une césarienne, avec les risques et traumatismes que ce type d’opération comporte.

Exemple 2 : En matière de distribution des revenus, 80 % de la population mondiale est en dessous de la moyenne !

En 1971, Jan Pen, un économiste hollandais, publiait son célèbre traité: Income Distribution. Pour représenter la distribution des revenus dans une économie, Jan Pen recourt à une étonnante parabole. Imaginons que l’on fasse défiler tous les habitants de notre monde. Imaginons encore que le défilé dure exactement une heure, et que les marcheurs soient classés par ordre de revenus décroissants. Imaginons enfin que la taille de chacun soit proportionnelle à son revenu: celui qui gagne le revenu moyen sera de taille moyenne, celui qui gagne le double de la moyenne sera deux fois plus grand que la moyenne, et ainsi de suite. Nous, les spectateurs, sommes supposés de taille moyenne. Jan Pen décrit ensuite ce que nous verrions. Le spectacle auquel nous assisterions ressemblerait à un défilé de nains, avec quelques géants incroyables tout à la fin.

Les premiers marcheurs sont si minuscules qu’on les distingue à peine. Il faut attendre 30 minutes avant de voir apparaître des nains de plus de 15 centimètres ! Ce n’est qu’à la quarante huitième minute qu’apparaît le premier individu de taille moyenne, quand près de 80 % des participants ont déjà défilé… Tout à la fin surviennent les géants. Le dernier participant est si grand qu’on ne peut voir que ses pieds. Aujourd’hui, ce serait Bill Gates, haut de plusieurs dizaines de kilomètres !
.
Le graphique ci-dessous décrit la distribution des revenus dans le monde:

Source: Slides du manuel de David Weil, "Economic growth", 2005 -- les données proviennent des Penn World Tables, 2002

Moralité : pour le calcul de la moyenne, un milliardaire pèse à lui-seul autant que plusieurs millions de pauvres diables. Ainsi, quand Bill Gates séjourna dans un village tanzanien, pour les besoins de sa fondation, l'instituteur a pu expliquer à ses élèves : "Hé, nous voilà riches ! Le revenu par habitant du village dépasse à présent le milliard de $".

Exemple 3 : Tungu et Bulugu

Dans son cours "Empirical Evaluation in Informatics", Christopher Oezbek, professeur à l’université libre de Berlin, donne l’exemple suivant : soit deux îles du Pacifique, Tungu et Bulugu. Les deux îles sont identiques, la population de Tungu est de 81 habitants et celle de Bulugu de 80 habitants, mais le revenu par habitant est à Tungu supérieur de 94,3 % à celui de Bulugu. Pourtant, rien dans l’économie des deux îles ne permet d'expliquer un tel écart de développement. A vrai dire, la seule différence est que le docteur Waldner a choisi de venir se retirer à Tungu.


Moralité : si l’on veut se faire une bonne idée de ce que gagne le français moyen, mieux vaut s’intéresser à la médiane qu’à la moyenne. Las ! il faut aussi se méfier de la médiane. Comme le montre l’exemple suivant.

Exemple 4 : pourquoi il faut aussi se méfier de la médiane.

En 1982, le biologiste et anthropologue Stephen Jay-Gould apprend qu’il est atteint d’un mal incurable : un mesothéliome abdominal. L’espérance de vie médiane des malades atteints par ce type de cancer est alors de huit mois. Jay-Gould encaisse le choc, puis se met à réfléchir. Certes, pour 50 % des malades, l’espérance de vie n’excède pas 8 mois. Mais quelle est l’espérance de vie de ceux qui passent le cap des 8 mois ? La dispersion peut être considérable. Autant la distribution est ressérée à gauche de la médiane, autant elle est étirée à droite. C'est là un phénomène assez courant, que les statisticiens ont baptisé « la longue traîne ». Stephen Jay Gould se remit alors à espérer. Tout n'était pas perdu : il pouvait songer ç nouveau à ses deux enfants, se remettre à ses travaux, etc. De fait, il vivra encore vingt ans (et mourra en fait d’une autre maladie, sans rapport avec la précédente).


Source des exemples 1,2,4 : Michael Blastland et Andrew Dilnot: "The Tiger that Isn't: Seeing Through a World of Numbers", Profile Books; 185 pages, 2007.

Aucun commentaire: