偏離其他幾個測量值較遠的數據稱為可疑數據。可疑數據產生的原因是試驗條件發生了變化,或在實驗中出現了過失誤差,那未由此產生的測量數據就脫離了正常分布群體。剔除可疑數據,會使測量結果更符合客觀實際。然而,正常數據因為偶然誤差也會具有一定的分散性,如果為了能夠得到精密度好的結果而人為地刪去一些誤差較大但并非可疑的測量數據,而由此得到精密度很高的測量結果并不符合客觀實際。因此,可疑數據的取舍必須遵循一定的原則。試驗中一經發現了明顯的系統誤差和近似誤差,就應隨時剔除由此而產生的數據。但有時即使實驗做完仍不能確知哪些數所是可疑的。這時,對這些可疑數據的取舍應采取統計方法判別,對可疑數據的處理要慎重,只有能找到原因的可疑數據才可做為離群數據來處理,否則應按正常數據處理。

  Q檢驗法:從統計學的觀點考慮,確定數據取舍比較嚴格而使用又方便的是Q檢驗法。當測定次數n=3~10時,Q檢驗法是將n次測定的數據從小到大排列為x1,x2,······xi······xn-1,xn。x1為最小可疑數,xn為可疑數,根據統計量進行判斷,確定可疑值的取舍。統計量Q為:

Q檢驗法統計量的計算公式

  Q值越大,說明可疑值離群越遠。將Q計算值與表5-1中列出的Q0.90比較,若Q計算≥Q0.90,則應舍棄可疑值,否則應予保留。

不同測定次數的Q值表

  【例題5-2】測定水平中鈣的含量(mg/L),平行測定5次的數據分別為22.36、22.38、22.35、22.40、22.44。試用Q檢驗法確定22.44是否舍去。

  例題5-2統計量的計算過程