计分度量是人类非常古老的行为,从科学度量的角度划分,分为基数和序数度量,二者的区别是序数无法做四则运算。在自然科学和工程学中,基数度量运用广泛且效果显著,如压力、速度、强度等都可以用基数度量;但在社会科学领域,总量往往无法准确度量甚至无法度量,序数度量就被大量使用。
比如,国民生产总值(GDP)的总量理论上是基数,但实际上因为过于复杂而无法准确计算,更有意义的使用是序数比较,如中国的GDP是否超过了美国,增长率是多少;中国和美国的营商环境也无法用基数度量,比如一个100另一个80,但我们可以通过观察判断谁的经营环境更好从而比较高低,这也是序数度量。
序数度量也是科学的度量,准确的排序在大多数情况下已经足够。但是序数计量的限制也非常明显,那就是不可以进行四则运算,而记分卡的问题恰恰在于将序数加总。
在记分卡的各级指标中,无论是直接使用指标本身,还是对指标进行转换分值处理,其计分实质都是序数排列。将各项计分加总或用权重缩放后加总,实际上已经违反了数学的逻辑,得出的总分没有明确的度量含义。正因为度量不再科学且含义不清,选美总分或信用评分不准确的争议才由之而起。实际上,凡是对序数进行概率统计的模型都有这种特征。
既然打分卡违反了科学和数学的逻辑,为何我们还广泛使用呢?——在人力资源上我们使用KPI,在企业管理上使用平衡记分卡,大学对于学术论文也采用计分——原因在于严格遵循科学规范的成本往往太高,而记分卡成本够低且在一定概率内能满足使用。
所以,评分的这种逻辑特征,比较适合大批量、分散、低价值的使用场景,保证结果大致正确且即便犯错也不致命。但是,若评价对象的价值较高,评分或统计模型的不足一面就会暴露出来,著名的长期资本公司(LTCM)在短时间内倒闭正是因为统计模型的不适用而导致致命亏损;而若评价对象价值很高且很集中,如单一公司的投资或评级,评分或统计模型这种思维方式的局限就非常之大,需要我们非常小心,另寻它法。