不确定性分析中几个基本词汇的辨识

如题所述

第1个回答  2022-07-01
不确定性分析中,经常会遇到一些字面意思比较接近的词,比如正确性、准确性和精确性,完整性和完备性等,由于这些词均出自英语,所以准确的辨识它们,需要从它们的语文单词的词义中去进行区分。

一、正确性,准确性和精度

         正确性(Correctness) ,表示对象属性的正确描述与否。比如两次测量一个人的身高,结果分别是160cm和160m,显然通常情况下我们会认为前一个结果是正确的,而后一个结果是不正确的,不符合常理。判断正确与否与使用对象的场景有关,所以正确性是相对的。针对计算而言,判断在既定规则下结果是否正确,比如1+1=3是错误的;针对属性数据而言,表示在既定认知或者规则下,对属性判断是否正确,比如性别的判断,牲畜的区分,指鹿为马就是错误的;针对测量而言,如果发生非常明显的偏离或较大误差时,也可以说测量是错误的,不正确的,测量过程或手段是失败的,比如GPS测量时,得到的结果明显偏离正常范围。

         准确性(Accuracy) ,表示正确描述对象属性的前提下,还要在可接受的范围内,也就是判断偏离既定标准值或期望值的程度。比如用GPS仪器测量跑道的长度,假设跑道长度是100米,而测量结果是100.5米,那这个结果具有较高的准确性,如果测量结果是95米,那这个测量准确性偏低。再比如,测量一个正常成年人的身高,100-300cm范围内都是正确的结果,但准确的结果可能就在更小的范围内,比如160-200cm。准确性可以用一个范围来度量,是可以量化度量的。

         精确性(Precision) ,表示对象属性的描述接近真值的程度,或者多次测量结果的相似程度。继续测量这个成年人的身高,希望得到他的真实结果,但是多次测量的结果可能都会有点不同,但只要我们认真的使用了测量工具,这些结果的差别应该非常小。换句话说,如果每次测量的结果都非常相近,那么得到的平均身高应该非常接近他的真实身高,也就是精确性高,或者精度高;反之,精确性低或精度低。精度是必须量化的,标准差是最常用的精度统计量。如果比较不同的测量时,比如,甲乙两人分别测量未知跑道的长度,每人重复三次,甲的结果是100,101和99,乙的结果是102,98和100。甲的平均值是100,方差是2;乙的平均值是100,方差是8。说明甲的测量稳定,精度高于乙。重复测量结果如果具有非常高的精度,通常也认为该测量手段精确性高。同样的可以用来判断模型的估计精度或准确性。

二、完备性,准确性,可信度,时效性,一致性和完整性

        这6个名词是关于数据质量测度的,其中完备性和完整性容易混淆,具体定义和理解如下。

         完备性(Completeness) :所需数据中包含的属性项是否完整。数据不需要100%完整。

         准确性(Accuracy) :表示数据与真实情况的吻合程度。

         可信度(Credibility) :数据被认为可信和真实的程度,与数据来源关系密切。

         时效性(Timeliness) :数据是否得到充分更新,并且满足当前需求的程度。

         一致性(Consistency) :各数据集之间关联数据的匹配程度,也包括属性项或记录缺失导致整体信息不完整的情况。

         完整性(Integrity) :指各种数据集之间的关联关系是否有效和准确。