北京普天同创生物科技有限公司
1.离群数据和可疑数据
明显歪曲试验结果的测量数据,既与正常数据不是来自同一分布总体的数据,称为离群数据,包括离群值、离群均值和离群方差。
可能会歪曲试验结果,但尚未经过检验判定其是离群数据的测量数据称为可疑数据。
2.离群数据的产生
一组正常的测量数据应来自具有一定分布的总体。但如果实验条件发生了明显的改变,或在实验过程中出现了过失误差,那么由此产生的测量数据就与正常数据不属于同一分布总体,即出现了离散程度较大的离群数据。
3.离群数据的检验与剔除
剔除了测量数据中的离群数据,会使测量结果更符合客观实际,然而,正常数据总具有一定的分散性,如果为了能得到精密度好的结果而人为地删去一些误差较大并非离群的测量数据,则由此得到的精密度很高的测量结果并不符合客观实际。因此,可疑数据的取舍必须遵循一定的原则。测量中发现明显的系统误差和过失误差,由此产生的数据应随时剔除。而可疑数据的取舍应采用统计方法进行判别,即离群数据的统计检验。检验方法很多,现介绍常用的两种。
(1)狄克逊(Dixon)检验法
此法适用于一组测量值的一致性检验和剔除离群值,本法中对最小可疑值和最大可疑值进行检验的公式因样本的容量(n)不同而异,检验方法如下。
①将一组测量数据从小到大顺序排列为x1+x2.…,xn,x1和xn分别为最小和最大可疑值;
②按表1-13计算式求Q值;
③根据给定的显著性水平(a)和样本容量(n),从表1-14查得临界值(Qa);
④若Q≤Q0.05则可疑值为正常值;若Q0.05<Q≤Q0.0l则可疑值为偏离值;若Q>Q0.01则可疑值为离群值。
(2)格鲁勃斯(Grubbs)检验法
此法适用于检验多组测量值的均值的一致性和剔除多组测量值中的离群均值;也可用于检验一组测量值的一致性和剔除一组测量值中的离群值,方法如下。
①有L组测定值,每组n个测定值的均值分别为x1,x2,…,xi,…,xL,其中最大均值记为xmax,最小均值记为xmin;
②由n个均值计算总均值(x)和标准偏差((Sx):
③可疑均值为最大值((xmax)时,按下式计算统计量(T):
④可疑数值为最小值xmin时,按下式计算(T):
⑤根据测定值组数和给定的显著性水平((a),从表1-15查得临界值(T);
⑥若T≤T0.05,则可疑均值为正常均值;若T0.05<T<T0.01,则可疑均值为偏离均值;若T>T0.01,则可疑均值为离群均值,应予剔除,即剔除含有该均值的一组数据。
通话对您免费,请放心接听
温馨提示:
1.手机直接输入,座机前请加区号 如18601949136,010-58103629
2.我们将根据您提供的电话号码,立即回电,请注意接听
3.因为您是被叫方,通话对您免费,请放心接听
登录后才可以评论