RECHERCHE DE VALEURS ABERRANTES

TEST DE DIXON

Il peut arriver, au cours d'une expérimentation qu'un des résultats semble s'écarter notablement des autres. Une attitude classique, que l'on rencontre trop souvent, consiste à éliminer cette valeur en la considérant comme aberrante. Or il peut être dangeureux de procéder ainsi sans vérification préalable. La bonne attitude à avoir est la suivante : si l'on a pu retrouver la cause de la valeur aberrante (erreur de lecture, faute de calcul, etc), il est tout à fait normal de l'éléininer, en revanche, si aucune cause accidentelle n'a pu être détectée, il est dangereux d'éliminer brutalement la valeur incriminée. Dans ce cas, il faut avoir recours à un test statistique permettant de justifier l'élimination de la valeur aberrante avec une probabilité P, choisie à l'avance, de se tromper. Le test de Dixon, que nous allons exposer, permet de réaliser celà.

TEST DE DIXON

Supposons qu'une expérimentation ait conduit à n résultats numériques (n spérieur ou égal à 3). On classe ces résultats par ordre de valeur croissante

x1 < x2 < . . . < xn-1 < xn

Le test permet alors de tester si la première valeur x1 ou la dernière valeur xn est aberrante. Pour ce faire, suivant le nombre d'observations, on calcule les rapports suivants

3 <= n <= 7 r10 = y2 - y1
y----y-
 n    1 r10 = yn-  yn-1
-y----y--
  n    1
8 <= n <= 10 r11 =  y2 - y1
y------y-
 n- 1   1 r11 = yn-  yn-1
-y----y--
  n    2
11 <= n <= 13 r21 = -y3---y1-
y    - y
 n- 1   1 r21 = yn---yn-2
 y  - y
  n    2
14 <= n <= 30 r22 = -y3---y1-
yn- 2- y1 r22 = yn---yn-2
 yn - y3
 

On entre alors dans la table de Dixon qui donne les valeurs critiques de ces rapports au niveau de risque 10 %, 5 % et 1 %. La règle à adopter est la suivante : si la valeur du rapport est inférieure à la valeur critique, on est pas justifié, au risque donné, de d'éliminer l'observation.

Exemple :

Valeurs observées : 148, 151, 152, 153, 160

Nous avons 5 valeurs et la dernière semble anormalement élevée.

on calcule

r10 = 160 - 153
---------
160 - 148 =  7
---
12= 0, 583

Pour n = 5 observations, la valeur critique lue dans la table est, au risque de 5 %, 0,642.

Puisque 0, 583 < 0, 642 il n'est pas justifié, au risque de 5 %, d'éliminer la valeur 160.

Retour