RB∕T 031-2020 能力验证计划的选择与核查及结果利用指南.pdf

RB∕T 031-2020 能力验证计划的选择与核查及结果利用指南.pdf
仅供个人学习
反馈
标准编号:
文件类型:.pdf
资源大小:4.9 M
标准类别:其他标准
资源ID:224819
下载资源

标准规范下载简介

RB∕T 031-2020 能力验证计划的选择与核查及结果利用指南.pdf

表C.4结果表明没有任何一种统计方法对所有情况都是完美的。对正态分布数据,总体均值 偏差虽是最优,但当有离群值时会失效。简易稳健统计如中位值、MADe或nIQR对于正态分布 对而言不是最优,但当有离群值或样本量较少时仍然是有效

C.5适用于参加者较少的能力验证计划统计方法

通常样本估计值与总体参数实际值之间的差异会随样本量减少而增大。如果能力验证计划利用参 加者的公议值评价参加者的能力,参加者数量通常应大于30;当参加者数量小于20时,由于公议值确 定的指定值的不确定度相对较大DBJ61/T 79-2014标准下载,不可忽略,导致能力评定不可靠[5]。例如,当样本数为30时,样本离 散性的估计值与总体标准差的差异,在95%置信水平时高达25%以上,而随着样本数的减少,其差异更 大。所以对于参加者较少的能力验证计划,一般不推荐利用参加者结果分散性的公议值来进行能力评 定,理想情况下可使用独立于参加者的、有明确溯源途径的方法确定指定值,如用配方法或由有证参考 值给出。能力评定标准差也最好基于外部标准,如专家判断或适用性目标。如果使用预先确定的指定 值和评定标准,即使仅有一个参加者,能力验证计划也可进行。此种类型的实验室间比对被称为“一对 一”的能力验证计划或测量审核,在很多情况下非常有用,如校准。 当不能使用独立于参加者的、有明确溯源途径的方法确定指定值时,指定值或/和能力评定标准差 可能需要利用参加者公议值得到。如果参加者数量过少,能力评定可能变得不可靠,需要考虑设定能力 评定中参加者的最少数量

C.5.2识别离群值的方

当参加者数据中有离群值时,宜优先采用稳健统计,但对于数据量较少的情况通常 存使用。 参加者较少(如少于18家)的能力验证计划,宜优先使用经典统计方法,可使用离群值检验,先剔除离群 值,然后计算均值和标准偏差。 不同的数据量可使用不同的离群值检验方法。可用格拉布斯检验对一个离群值和对同一方向的两 个离群值同时进行剔除,格拉布斯检验及其他检验需要预先规定可能的离群值个数,但可能由于有多个 离群值而失效,这对于参加者结果数p10时非常有用(取决于离群值的可能分布)。 注1:对分散性的估计在剔除离群值后需特别谨慎,因为估计值会偏低。当基于99%或以上置信水平进行别除时, 偏倚通常不严重。 注2:大多数指定值和分散性的单因子稳健估计量在力≥12可接受

C.5.3指定值计算方法

作为指定值,当剔除离群值后,对于p(p≤12)家参加者结果,用参加者结果标准偏差作为能力评定标 准差,u(pt)<0.3gpt准则不能满足。当使用中位值作为指定值(效率为64%),参加者结果数p≤18时 该准则不能满足。 其他稳健统计方法,如算法A有中等程度效率,当p>12时有可能满足u(αpt)<0.3op准则。虽然 有时可对更少参加者结果进行能力评定,某些指定值计算方法仍然要求有一定数量的参加者结果。如 果参加者结果较少,很难有高度稳健的统计方法用于计算平均值。典型的数据量下限为力≥15,中位值 最低可应用于力=2(等同于均值),但当3≤力≤5时,中位值没有均值好,除非有高风险离群值。

C.5.4分散性计算方法

定性计划确定指定值的方法通常有:专家判定、利用标准物质/标准样品的参考值、已知物品来源和 利用参加者结果众数或中位值。定量计划确定指定值的方法通常有:配方法、有证参考值、独家定值、专 家公议值和参加者公议值等方法。

能力验证计划通常有一个专家组,它由若干具有适当资格的专家组成。指定值由专家组公议确定, 如果专家组对某个物品的指定值不能达成公议值,则可考虑选用其他的定值方法,如果确实没有合适的 其他方法,则该物品不宜用于能力验证。特殊情况下,也可由一个专家确定指定值。

用标准物质/标准样品的

当利用标准物质/标准样品(RM)作为能力验证样品时,则以相应的参考值作为指定值。但RM作 为能力验证样品成本相对较高,而且RM的信息是公开的,不利于能力验证实施过程中指定值的保 密性。

D.2.3已知物品来源

由已知来源的物质制备的能力验证样 指定值可以依据物品来源确定。例如,鉴定昆虫或微生物 包括病毒)种类的能力验证计划,其样品制备可以用来自标准库或参考实验室经过鉴定的样品。在物 品制备和处理过程中应尽量避免污 影响参加者结果,

D.2.4利用参加者结果众数或中位值

定性检测的指定值也可用参加者结果的统计量,如众数或中位值来确定。以众数作为指定值 类别和定序的结果,但中位值一般只适用于定序标尺的结果。如果利用众数或中位值作为指定值 力验证计划报告中应说明符合指定值的结果数及其所占的比例数

将已知含量(或浓度)的被测物质或含有被测物的样品添加到空白基质中,得到的添加值作为指定 值。当指定值由配方法来确定时,指定值的标准不确定度可根据JF1059.1,用不确定度分量来合成标 不确定度。 当采用配方法确定指定值时需注意: a)基质需不受添加成分的影响,或者添加成分在基质中的比例是精确已知的,

b)必要时,所有成分需混合均匀。 所有显著误差来源是已被识别(例如,人们往往意识不到玻璃可以吸收汞化合物,实际上汞化 合物水溶液的浓度会因容器材质而改变)。 d 添加成分和基质之间没有反应。 e)含有添加物的能力验证样品的性质需与实际测试样品类似。例如,人工配制样品与天然样品 中相比,人工制品中添加成分通常更容易被提取。若人工配制样品与天然样品存在较大差异, 实施机构需确保测试方法对人工配制样品适用。

D.3.2 有证参考值

可直接用有证标准物质/标准样品(CRM)作为能力验证样品,它能提供一个独立于参加者测量结 果的标准值,并能提供相应的溯源再现性。当使用CRM作为能力验证样品时,指定值及其不确定度由 证书中给出。 这种方法的局限性在于: a)为每个参加者都提供一份CRM会比较昂贵; b)为确保长期稳定性,有时需对CRM进行进一步加工处理,这可能会对CRM的特性产生一定 的影响。 c)参加者可能已经了解某种 CRM,因此需隐惑 CRM 的识别标识。

指定值工可由一个实验室使用参考方法(比如基准方法)确定,该参考方法应易于理解并进行充分 描述,包含完整的不确定度声明及计量溯源性,并适用于能力验证计划,该参考方法对参加者使用的所 有测试方法需具有可替换性。利用参考方法确定的指定值是定值研究的平均值,使用多个能力验证样 品或在不同测量条件下,进行多次重复测量得到,指定值的标准不确定度是当使用参考方法并在定值研 究条件下的不确定度。 指定值工pt也可由一个实验室采用合适的测量方法,通过使用高度匹配的CRM实施的校准获得。 该方法假设CRM对于参加者所有测量方法具有互换性。这种定值方式需要利用同一测量方法在重复 性条件下,在同一个实验室对能力验证样品和CRM实施一系列测试,选用同能力验证样品在基质、浓 度和种类等方面具有相似性或可比性的CRM,在重复性条件下将CRM与能力验证样品一起,采用相 同的分析方法,按照随机的顺序进行多次分析测量。对照CRM的参考值可以得到能力验证样品的指 定值和标准不确定度,见式(D.1)和式(D.2)

式中: 工pt 能力验证样品的指定值; ZCRM CRM的参考值; a 能力验证样品测量结果(平均值)和CRM测量结果(平均值)之差的平均值。

u(Tp)=uCRM+u

u(pt) 指定值的标准不确定度; uCRM CRM参考值的不确定度; ua 一d的不确定度。 注:cRM应与&相互独立,除非定值实验室亦制备了该CRM。 如果在能力验证计划开始前样品已经有了参考值,且实施机构利用同一测量方法核查了该参考

可采用标准物质/标准样品定值的方式由专家实验室进行实验室间比对确定指定值,定值方法详见 GB/T15000.3。选取的专家实验室通常具有较高测量水平和较好的测试精度,能对测量条件进行严格 腔制。在分发能力验证样品之前,随机选取一部分能力验证样品,由一组专家实验室按规定的测试方案 进行测试,该测试方案规定能力验证样品数和重复测试次数以及其他相关条件。每个专家实验室提供 的结果应包含标准不确定度。 指定值也可由专家实验室报告结果的稳健平均值得到,具体计算可使用C.3.1.4中的算法A。也可 使用其他计算方法代替算法A,只要该方法有可靠的统计学基础,并在能力验证计划报告中描述所使用 方法即可。 如果专家实验室只报告了结果,且测试方案中并未要求专家实验室报告不确定度,或报告结果的不 确定度不可靠,则通常将专家实验室分组然后计算组内参加者公议值,具体计算方法见D.3.5。如果专 家实验室分别报告了一个以上的结果(例如重复测试),实施机构宜建立具有统计意义的替代方法,以确 定指定值及其不确定度,同时应考虑出现离群值或其他非预期结果的可能性。 如果专家实验室报告了带有不确定度的结果,利用专家公议值计算指定值相对比较复杂,目前有多 种方法,包括加权平均值、非加权平均值,对过度分散(overdispersion)结果进行处理的方法,以及对可 能出现的异常结果或错误结果及不确定度评定进行处理和计算的方法。实施机构应: a)核查所报告不确定度估计值的有效性,比如核查所报告的不确定度是否完全反映结果的离散 程度; b) 使用适用于所报告不确定度的大小与可靠性的加权程序,如果所报告的不确定度相似或可靠 性较差或未知时,可能实施等量加权; c)允许报告的不确定度可能不完全反映观测结果的离散程度(过度分散),比如,通过补充一个不 确定度分量表示过度离散; d)允许报告的结果或其不确定度可能存在意外的离群值; e)确保统计方法有可靠的理论基础; )证明统计方法能够满足能力验证计划目的

D.3.5参加者结果公议值

使用该方法得到的能力验证样品的指定值工p为中心位置估计值(如稳健平均值、中位值或算术平 均值),该估计值由某轮能力验证计划参加者报告的结果计算得出,具体见C.3。 有时实施机构可能会使用通过预先设定的标准(如是否认可或先前的测量水平)来对参加者进行分 组,这种情况可考虑使用参加者公议值。也可使用其他统计方法替代C.3中的稳健统计方法,只要该方 法有可靠的统计学基础并在能力验证计划报告中说明即可。 使用参加者公议值的方法优点在于: a)无须额外测试即可获得指定值; b)该方法适用于标准化、程序化的被测量,因为通常无更可靠的方法获得等效结果。 该方法的局限性在于: a)参加者的一致性可能不够充分; b)公议值可能因参加者普遍使用了 在未知偏倚,而指定值标准不确定度不会包

含该偏倚; c 确定指定值的方法可能存在偏倚而使公议值发生偏倚; 可能难以确定公议值的计量溯源性。当结果溯源至各实验室时,只有在实施机构完全了解与 公议值相关的所有参加者使用的校准标准,并掌握其他相关方法条件的信息时,才可以做出明 确的溯源性声明。 指定值的标准不确定度取决于所使用的统计方法。当利用附录C.3中的稳健统计方法计算指定值 时,指定值工的标准不确定度可按式(D.3)计算:

u()=1.25× Yp

u(工pt)一一稳健平均值的标准不确定度; s*一一参加者结果的稳健估计量; 力 一参加者数。 注1:指定值和稳健标准差由参加者结果获得,可假定指定值的不确定度包含不均匀性、运输和不稳定性对不确定 度的影响。 注2:基于正态分布的大量数据的中位值的标准差,或是中位值作为平均值估计值的效率,确定校正系数为1.25。 高级稳健统计方法的效率远大于中位值效率,因此校正系数小于1.25,之所以选用该系数,是因为能力验证结 果一般不严格服从正态分布,且包含未知比例的源于不同分布的结果(“污染结果”)。考虑到结果可能被污 染,1.25是一个保守(高)估计值,实施机构可依据经验和所使用的稳健方法选择较小的校正系数或不同的 公式。

D.3.6对指定值不确定度的限定

当指定值的标准不确定度u(Tp)与能力评定标准差相比不可忽略时,会存在一种风险,即某些 将会因指定值的不准确而收到行动信号或警戒信号,而不是因为参加者本身的原因。因此需确 值的标准不确定度,并通知参加者。 当满足式(D.4)时,指定值的不确定度可忽略

()<0.30或()<0.18

(0.3gp或u()<0.18 .......................

u()一 指定值的标准不确定度; p能力评定标准差; 8E 一一最大允许测量误差。 注:0.30=0.18g,当1z1≥3.0,将产生行动信号。 当以上准则不满足时,实施机构宜考虑采取以下措施: a)选择另一种指定值确定方法,使其不确定度满足式(D.4)所确定的准则; b)在能力验证结果的解释中考虑不确定度(见z值、值或E,值的描述); c)如果指定值是由参加者结果得出,且较大不确定度是由可识别的各参加者子集间的差异所致 则分别报告各子集(如参加者使用不同测量方法)的指定值和不确定度; d)通知参加者,指定值的不确定度不可忽略。 如果a)~d)均不适用,则应通知参加者,无法确定可靠指定值,也无法进行能力评定

D.3.7指定值和独立参考值的比较

当使用参加者公议值确定指 思立的佰计值(表示为工e) 制备方法或基于参考值,应将公议值工与工比较。

如使用D.3.1~D.3.4中的方法确定指定值,每轮能力验证计划后,应将每轮计划得到的稳健平均 值与指定值比较。差值的计算公式为=(rer一)或('一),差值的标准不确定度由式 (D.5)估计:

uair=u(ret)+u()

u(工ref)一一参考值的不确定度; u(pt)一一指定值的不确定度。 如果该差值大于其标准不确定度的两倍,应查找原因,可能的原因如下: a)参考测量方法存在偏倚; b)参加者结果存在普遍偏倚; C 使用配方法时未意识到测量方法的局限性; d)使用独家定值或专家公议值时,专家实验室的结果存在偏倚; e)独立参考值和指定值不能溯源到同一计量基准。 实施机构应依据查找的原因确定是否对结果进行评估,对于连续能力验证计划可考虑在后续能力 验证计划中是否修正设计方案。若差值大到足以影响能力评定或表明参加者使用的测量方法间存在严 重偏倚,应在能力验证计划的报告说明,如果出现这种情况,在后续设计能力验证计划时,应考虑该 差值。

u(工ref)一一参考值的不确定度; u(pt)一一指定值的不确定度。 如果该差值大于其标准不确定度的两倍,应查找原因,可能的原因如下: a)参考测量方法存在偏倚; b)参加者结果存在普遍偏倚; C 使用配方法时未意识到测量方法的局限性; d)使用独家定值或专家公议值时,专家实验室的结果存在偏倚; e)独立参考值和指定值不能溯源到同一计量基准。 实施机构应依据查找的原因确定是否对结果进行评估,对于连续能力验证计划可考虑在后续能力 检证计划中是否修正设计方案。若差值大到足以影响能力评定或表明参加者使用的测量方法间存在严 重偏倚,应在能力验证计划的报告说明,如果出现这种情况,在后续设计能力验证计划时,应考虑该 差值。

附录E (资料性附录) 能力评定标准差的确定

运作能力验证计划应根据能力验证计划的目的和相关规定(如管理部门的要求)确定合适的能力评 定标准差(ot)。确定能力评定标准差通常有五种方法:规定值、经验值、一般模型、测量方法精密度和 由参加者结果确定。

可根据管理部门、认可机构或实施机构认为参加者可实现的合理能力水平确定最大充许误差(e) 或能力评定标准差,将最大允许误差除以确定不满意结果(行动信号)时使用的。的倍数,即可获得能 力评定标准差。同理,也可将。转化为最大允许误差(8e)。 如果为满足管理要求或适用性目标而给出标准差,则可直接将该标准差用于能力评定标准差 (αpt),如果该要求或目标给出的是最大允许误差(8g),则将e除以行动限(3.0)可得到能力评定标准差 (αm)。所规定的最大允许误差(8e)可用于计算偏差或百分相对差(D或D%)

能力评定标准差可设定为符合实验室能力水平的经验值,它是实施机构和实验室利益相关方希望 实验室可达到的预期值。 可利用从先前轮次能力验证计划中获得的经验,确定能力评定标准差(αp)和最大允许误差(e)。 当前轮次应与先前轮次具有相同被测量且特性值相当,同时参加者使用了相似的测量程序,在对适用性 目标未达成一致意见时,该方法有用。该方法的优点在于: a) 依据合理能力预期开展能力评定; b)评定标准不会因各轮次参加者的随机变化或参加者群体变化而改变; c)当存在两个或多个实施机构时,评定标准不会因实施机构的不同而变化。 评估先前开展的能力验证计划时,应考虑有能力的参加者可达到的水平。该水平不会受新参加者 或参加者数量较少或某特定轮次计划特有因素导致的随机变化的影响。可通过核查先前开展的能力验 证计划确认其一致性,或依据平均值或适用于被测量值的回归模型确定,回归方程可能为直线,也可能 为曲线。应考虑标准差和相对标准差,分析这两个统计量在被测量水平的适当范围内的适用性,选择适 用性较好的一个,也可通过这种方式获得最大允许误差,

现性标推差作为能力 示准差。该方法的优点在以实际经验为基础且对于被测量可保持客观和一致性。依据所使用的 该方法可视为能力评定标准差确定方法中使用适用性目标的特例。通过一般模型选择的预期标 应具有合理性。如果大多数或极少数参加者为不满意或有疑问,实施机构应确保这种情况满足能

验证计划的目的。 对于一般模型方法,通常优先考虑测量特性问题。因此,在使用一般模型前,宜先尝试使用专家经 验、先前能力验证计划的经验和测量方法精密度等方法确定能力评定标准差。 能力评定标准差可由检测方法再现性的一般模型得出。例如,Horwitz公式给出了化学分析方法 再现性标准差的一般模型,这个方法可得到式(E.1)的再现性标准差的表达式

再现性标准差; 一一以百分数表示的待测化学成分的浓度(质量分数)。 注:Horwitz公式是经验公式,基于长时间内对多个参数的协作实验。当协作实验未出现明显问题时,o#值是 室间变异的预期上限,在某些能力验证计划中可能不适合作为能力评定标准差。

E.5由测量方法精密度确定

当能力验证计划中使用标准化的测 能力评定标准差按式(E.2)计算:

E.6由参加者结果确定

能力评定标准差。由同一轮能力验证计划参加者的结果计算得出,使用该方法计算能力统计量 时,适宜使用值,通常使用稳健统计方法(见C.3)计算所有参加者报告结果的稳健标准差(opt)。 使用参加者结果得到的公议值可能不适宜作为能力评定标准差,原因如下: a)如果稳健标准差极小,实施机构应给所使用的设定一个最低限,选定的最低限应满足在测 量误差符合极端预期用途的情况下2<3.0。 示例:在纺织行业,每厘米的线程数小于4线程/cm的误差被认为不显著。在某些轮次的织物能力验证计划中稳 键标准差很小,比如小于1线程/cm。当能力验证稳健标准差不小于1.3线程/cm时,实施机构将稳健标准差用作o。 而当稳健标准差小于1线程/cm时,采用t一1.3,此时3gp为3.9接近4。 b)如果稳健标准差极大,实施机构应给使用的pt设定一个最高限,或对认为满意测量结果设定 一个最高限。最高限为不满足适用性目标的结果将收到行动信号。如果对称区间包含不满 足能力验证适用性目标的结果,实施机构可对被认为满意结果(无警戒信号或行动信号)的区 间设定上限或下限。 示例:某非饮用水能力验证计划,法规规定结果须在参加者结果的稳健平均值的3范围内,但由于有时满意结果 的范围可能包括0μg/L,任何低于配制值10%的结果视为不满意结果。某能力验证样品中的限制物质配制含量为 4.0μg/L,参加者稳健均值为3.2μg/L,为1.1μg/L,因此,如果参加者结果为0.0μg/L,仍在3g范围内;但由于低于 配制值10%的结果视为不满意,所以任何低干0.4m/L的结果将被认为是不满意结果,

该方法的主要优点在于简单和实用,可用于很多场合,且可能是唯一可行的方法。 该方法的缺点在于: a 由于值可能在每轮计划都会有显著的变化,因而对于参加者而言,利用z值寻找多轮次计 划中可能的趋势时会有一定的困难。 b 当能力验证计划中参加者数量较少或者参加者采用多种不同测量方法,标准差可能不可靠, 例如:如果力=20,正态分布的标准差与其真值的偏离在不同轮次的能力验证计划中可能会有 约士30%的波动。 c)将产生近似恒定比例的满意结果。通常较差的测量结果不能通过能力评分值体现,而优秀参 加者的较好测量结果却可能得到比较差的能力评分值。 d) 由于该方法是基于统计假设,无法对结果应用的适用性提供有效说明,因此对结果分析解释 需结合专业判断。

附录F (资料性附录) 能力统计量的计算

和与其他确定的目标进行比较。能力 统计量通常有:偏差(D)、百分相对 值和E,值等

F.2偏差(测量误差)

用3;表示一轮能力验证计划中参加者i的测量结果(或重复测试结果的平均值),则可用简单白 计算参加者结果;和指定值间的差值来评定参加者的结果。计算公式见式(F.1):

D:一第i个测量结果的偏差。 如果指定值(pt)视作约定值或参考值,则D:可视为报告结果的测量误差。D:可与指定值的单位 相同,也可以用式(F.2)计算偏差百分比:

D.%=100(z;)/z%

D,%一一第i个测量结果的偏差百分比。 D或者D%通常与最大允许误差(8e)进行比较,ε可基于适用性目标或从前一轮能力验证计划获 得的经验得出。如果一≤D≤8,则表示结果满意,否则为不满意;当一8e/%≤D,%≤/% 时,表示结果满意,否则为不满意。 e与用于z值计算的能力评定标准差(opt)紧密相关,e和能力评定标准的关系由值的评定标 准确定,如果z≥3.0时为不满意,则=3ot,或相当于p=e/3。e常用于医学领域的能力验证计 划以及测量方法和产品的性能规范。 用D和8e进行能力评定的优势在于:这些统计量与测量误差直接相关,且常用作确定适用性目标 的标准,因而参加者能直观地理解这些统计量。 用百分相对差(D%)的优势在于:D%是对被测量水平的标准化度量,且与产生误差的常见原因相 关(如校准错误或稀释偏倚),因而参加者能直观理解该统计量。不足之处在于:在很多国家或测量领域 并不常用这些统计量;且在多个被分析物或不同水平的被测量拥有不同能力评定标准差的能力验证计 划中,D没有标准化,不能实现简单判断以给出行动信号。 使用D和D%时,通常假设参加者结果是对称分布,可接受范围为一≤D≤8e。 由于适用目标可能不同,为对不同被测量水平进行比较,或比较不同轮次和被测量,可将D和D% 转化为“允差百分比”(P)。计算公式见式(F.3)

PA:=(D:/8e)X100%

PAi一第i个测量结果的允差百分比。 如果PAi≥100%或PAi≤一100%,则表示结果不满意,否则为满意。 注1:可比较不同被测量水平和不同轮次能力验证计划的PA值,或在图形中标示PA值。PA值的使用和解释

值相同(如之≤ 23.0时 主2.偏差(测量误差)的各种形式,常应用于能力验证计划额率高、被分析物量大的医学领域。

能力验证结果工:的值的计算公式见式(F.4):

能力验证结果;的z值的计算公式见式(F.4):

式中: 工p指定值; 之值的解释如下: 当1z|<2.0,满意结果(无行动或警戒信号): 当2.0<|z<3.0,有疑问结果(警戒信号); 当|z≥3.0,不满意结果(行动信号)。

式中: 工一一指定值; 之值的解释如下: 当|~≤2.0,满意结果(无行动或警戒信号); 当2.02.0视为不满意结果。 注2:通常应选择符合上述评价准则的。#,该准则广泛应用于能力评定,与控制图的控制限十分接近。 注3:将z值的限值确定为2.0和3.0有如下理由。假设正确操作的测定得到结果服从均值为工p,标准差为α的 正态分布(必要时经过变换),那么之值将服从均值为0,标准差为1.0的正态分布。此时,预期只有大约0.3% 的值超出一3.0≤z≤3.0的范围,只有大约5%的值超出一2.0≤z≤2.0的范围。因为z值超出士3.0的概率非 常低,如果没有真正的间题行动信号不太可能偶然出现,所以若出现了行动信号,很可能存在引发异常的可识 别原因。 注4:本评价准则所基于的假设仅适用于合格实验室的分布假设,而不适用关于观测结果的任何假设。对于观测结 果本身,无须进行任何假设。 注5:如果真实的实验室间波动性小于のp,则错误评价的概率会降低。 注6:当能力评定标准差由专家经验或一般模型方法确定时,它可能与结果(稳健)标准差差异很大,此时结果落在 ±2.0和±3.0范围外的比率很可能不是5%和0.3%。 实施机构应基于结果的有效数字位数,确定适用于所报告的之值、指定值和能力评定标准差的适 当修约规则。在向参加者提供的信息中应包括修约规则。对于值,一般保留小数点后两位数字。 当参加者数量很大且参加者结果的标准差用作。p时,实施机构可能希望使用实际结果或z值检验 分布的正态性。在只有少数参加者的极端情况下,可能不会给出行动信号。在这种情况下,使用结合了 多轮计划能力评定的图示法,可比单轮次能力验证计划更有效地显示参加者的能力。

如果考虑指定值的不确定度u(p),比如当u()>0.3op时,应在能力统计量计算公式的分 母增加不确定度分量。该统计量值称为2值,计算公式见式(F.5)

工 能力验证结果; 6pt 一 一能力评定标准差。 注:当利用参加者结果计算工和/或时,由于各参加者的结果可能会影响稳健均值和标准差,这时能力评定值 各个参加者的结果相关。能力评定值与各参加者结果的相关性取决于该参加者的结果在组合统计中的权

RB/T031—2020

因此,分母含指定值不确定度,不考虑相关性的能力评定值,低于分母考虑协方差时的能力评定值。例如,如果 分母增加指定值不确定分量且u(工)=0.3g时,则z值会减小约10%。因此,由参加者结果确定和/或αp 时,可用式(F.5)来计算。 根据能力验证计划设计,2值可与值有相同的解释,并有相同的临界值(2.0和3.0)。 利用D和D%评价能力时,若考虑指定值的不确定度,可按式(F.6)进行修正,

............F.

...........F.

U(pt)一利用包含因子k(k=2)计算得出的指定值pt的扩展不确定度。 当e为修正后最大允许测量误差时,则ID|<"被认为是满意的结果;用相对误差表示地下车库设计:停车位与柱网分析,76页PDF下载.pdf,即 D%<8/%为满意结果

当核查参加者结果与指定值的差值是否在其所声称的不确定度范围内时,可使用值。可按 式F.7计算值:

u"(r:)+u()

u(工:)一参加者结果工:的标准不确定度; u(工p)一指定值工p的标准不确定度。 注1:当用参加者的公议值计算指定值(工)时,工与各参加者的结果相关。指定值与各参加者结果的相关性取决 于该参加者的结果在指定值(甚至在指定值不确定度)中的权重。因此,包括指定值的不确定度、不包括相关 性的修正值的能力评定统计量表示包括协方差时将会导致的能力评定统计量值的低估。如果指定值的不确 定度较小,则考虑相关性与不考虑相关性计算的值差异不大;使用稳健统计方法时,对于结果与指定值偏离 最大的参加者,该差异最小,因而可将式(F.7)和公议值计算方法一起使用,无须因为相关性进行调整。 注2:值与E。值[见式(F.8)]的差别在于用标准不确定度u(α;)和u(z)代替扩展不确定度U(z;)和U(工t),当 存在方法系统偏倚或参加者对测量不确度估计不可靠时,可能导致值大于2或小于一2,因此,值表示对 参加者提交的结果的严格评估。 使用值时,无论实验室是否能报告准确的结果,可直接对其结果进行评估,即在测量不确定度范围之内参加 者结果是否与工一致(通常适用于校准实验室)。值解释可采用与z值相同的临界值(2.0和3.0),或乘以 估计扩展不确定度时使用的包含因子,但是超出临界值范围的值可能表示工:与工的差异较大和(或)参加 者对不确定度的估计值偏小。 注3:值可以与z值联合使用,作为提升实验室能力的一种辅助手段。若某参加者所得z值多次超出临界值3.0, 则有必要逐一检查测量过程,并识别测量过程中最大的不确定度来源以寻找改进空间。若值反复超出临界 值3.0,则表明不确定度评估未包含重要的不确定度分量(例如,遗漏了某些重要因素)。相反,如果某参加者 z≥3.0但<2.0,则表明该参加者可能准确评估了结果的不确定度,但结果并不符合该能力验证计划中的预 期能力。可能存在这种情况,如某参加者在测量程序中使用初筛法,而其他参加者使用准确定量法时会有这 种情况发生。如参加者认为结果的不确定度能满足应用,则无须采取任何行动。 单独使用值时,值仅可解释为评价参加者的不确定度是否符合测试偏差,而不可作为对特定参加者结果 的适用性目标的表示。适用性目标可由参加者或认可机构通过评估偏差(工一工t)来确定,或将合成不确定度 与目标不确定度进行比较来确定。

常用于校准能力验证计划,也可用于其他类型的能力验证计划。

DB45/T 2105-2019 电波暗室接收信号同轴电缆线损测量方法(E.); F U()+U())

E.7参加者结果不确定度评估

校准能力验证计划已要求参加者报告不确定度,这在检测能力验证计划中开不常用。 即使能力评定时未使用不确定度,参加者报告能力验证结果的不确定度仍然有用。收集该信息的 自的如下: a)认可机构可确定参加者报告的不确定度是否在认可范围内(通常适用于校准实验室); b)参加者可核查自身和其他参加者报告的不确定度,从而评估其一致性,确定评估不确定度时 是否未考虑所有相关因素、或是否考虑了过多因素; c)能力验证计划可用来证实所声称的不确定度,在报告结果时报告不确定度是最简便的办法。 当利用配方法、有证参考值、独家定值和专家公议值方法确定指定值(见D.3.1~D.3.4中所述方 法),且u(pt)满足u(pt)<0.3oμ条件时,参加者结果的标准不确定度不可能小于u(pt),因此可将u (工pt)用作筛选下限,称为umin。如果用参加者结果公议值确定指定值(见D.3.5),则实施机构应确定 umin的实际限值。如果u(工pt)包含不均匀性或不稳定性造成的变异,则参加者的u(工;)可能小于umin。 参加者报告的标准不确定度不应大于所有参加者稳健标准差(s*)的1.5倍,因此稳健标准偏差的 1.5倍可用作核查报告的不确定度的实际上限,称为umx 注:基于F分布的百分位数值的平方根,系数1.5是对10个或10个以上结果的标准差的预期变异的上限,当核查 参加者报告的不确定度时实施机构可使用不同系数。 如果利用umin或umx或其他标准识别异常不确定度,实施机构应向参加者说明,并说明即使u(:) 小于umin或大于umx,该u(工:)可能仍然有效,如果出现这种情况,参加者和利益相关方应检查结果或 不确定度估计值。同样,如果报告的不确定度大于umin且小于umx,该不确定度可能仍然无效。umin和 umx仅提供指示信息。

©版权声明
相关文章