• 精选
  • 会员

第七章 数据筛选:策略与结果有关系吗

2020年9月10日  来源:实力、运气与成功 作者:(美)莫布森 提供人:jiaoqiao57......

在2010年春天召开的一次会议上,一个电子游戏开发公司的总裁谈到了公司内部的改革计划。他讲到了降低成本、聚焦最炙手可热的产品项目这两点,而这两点也在我的意料之中。然而,他重点强调的一点——提高产品质量、提升产品品质,却完全在我意料之外。该公司打算推出15款最新开发的游戏。Metacritic(一个汇集电影、游戏、电视、音乐等评论的专业评分网站)对这些游戏的评价很高——评分都在80及以上(满分为100分)。此外,该公司准备把这些评分作为评定公司高管们奖金额度的一个基准。

生产高品质的产品当然是件好事——顾客是上帝,大家都想让自己的顾客开心。问题是,没有证据证明Metacirtic的评分是可靠、权威的。更何况,这些评分与该公司老总希望创造“长远股东价值”的目标到底有多大关系,目前也没有定论。如果生产的产品质量低劣,公司会缺乏竞争力;同样,如果生产的产品质量太好,也会拖垮公司。质量与价值之间到底是什么关系,尚未可知。

就拿华力士公司来说吧,它是一家管道及阀门的经销商。1990年,该公司获得了美国国家质量奖,两年后却申请了破产保护。当时,华力士公司提高了产品按时交付率,并获得了不错的市场份额,然而该产品研发项目的开销却也随之转嫁到了用户身上,用户当然不乐意了。后来,公司的一名总监收购了华力士公司。他说:“如果为了拿这个大奖,你花费很大的心血,而且在整个艰辛的研发过程中,公司运作成本随之提高,一连串的麻烦也纷至沓来,那么拿这个奖就真的有点得不偿失了。”[1]

这一章我们要讲的是如何筛选有用的统计数据。很少有人愿意花时间来分析一下哪些数据对我们真正有用,哪些一点用处也没有。如果想知道统计数据的价值,那么了解运气和实力在大多程度上左右我们的行动结果就显得十分关键。

有用的统计数据具备两个特征。第一,这些数据具有稳定性,这也就是说当前发生的情况与过去发生的情况有相似性。假如你从事的主要是实力型工作,那么按常理你应该可以毫不费力地完成同类事情。如果检测一个训练有素的短跑运动员在连续两天里的表现,你会发现,他在两天里的成绩不相上下。在统计学中,这种稳定性被称为信度。如果在某件事上,事情能否成功完全要看运气好坏,那么可以确信,它的信度很低。在测试信度或者说稳定性的时候,一般可以通过统计不同时期里出现同一情况的频率来实现。[2]

可靠的统计数据一般可以预测出你所追求的目标能够实现的概率。比如说,我们需要记录一名选手在篮球比赛中的投篮命中率,并且很清楚团队在比赛中的目标是在与对手交锋时尽可能地斩获更多的分数。我们发现,在其他条件基本一致的情况下,一个选手的投球命中率越高,他为团队赢得的分数也会越高。统计学家把这种情况称为有效性。他们会告诉你,选手的投篮命中率越高,那么该选手获得的分数也会越高。当然,上述情况是一个显而易见的事实,但是并不是所有的因果关系都这么简单明了。测试预测价值需要比较两个测验数据:在刚提到的案例中,我们需要知道一名选手的投篮的命中率和个人的总得分。

统计学家在评估稳定性及预测价值时,一般都会分析相关系数。相关系数是衡量一组概率分布图中两个随机变量之间的线性相关程度的指标。相关系数(r)的取值范围为[-1,1],r>0表示正相关,r<0表示负相关,|r|表示了变量之间相关程度的高低。r=1称为完全正相关,r=-1称为完全负相关,r=0称为零相关。更具体来讲,在r=1时,两个概率分布图中的每个点都刚好落在一条直线上;两个概率分布图中的值不一定要完全对应,而两个分布图中各个点之间的差异完全相同。而相应的,在r=-1时,两个概率分布图呈现逆相关的状态——一个随机变量变大了,另一个随机变量必然会变小。[3]我们在这一章中提到的相关关系基本上都是正相关,即r>0。

这里来解释下什么是r。假定一个大联盟球队在比赛中的总得分和比赛获胜次数的概率之间的关联性很高(r=0.75),那么这也就意味着,如果一个球队的总得分偏离球队平均得分的程度为1,那么该球队获胜的次数偏离该球队平均获胜次数的程度为0.75。因此,相关系数为理清比赛得分和胜出比赛次数之间的关系提供了有效的信息。[4]

要知道哪些数据对你有用,你得先清楚自己的目标:你想用这些统计数据来做什么?在体育比赛中,我们的目标是在比赛中胜出。在投资领域,我们的目标是赚钱,换句话说,就是让自己能更全面地考察到市场内部各个因素对投资的影响,从而获得风险调整后的相应收益,并且从长远角度考虑,这个收益相对于一些基准而言要高许多。明确自己的目标十分关键,因为如果没有明确的目标,你就不可能有清晰的努力方向。同时,你还得考虑哪些因素会帮助你实现自己的既定目标。为此,你必须把那些抽象的因果关系转化成一个个你可以进行观察和测量的量。这样一来,你就能知道实力(以高稳定性来测量)是如何帮助你实现自己的既定目标(以高预测价值来测量)的。[5]

现在我们很容易理解为什么股东对公司总裁重视高品质的想法有所顾虑了。你可以对一款电子游戏的不同因素和属性进行分析,然后评估它的潜在价值。也就是说,如果你只是隔三差五地测一测产品的性能,那你得出的数据可能不太准确。更关键的是,你很难确定高质量的产品与你的既定目标(“创造长期的股东价值”)之间是否存在必然的因果联系。华力士公司的经历告诉我们,产品质量太高或太次都会对一个公司的财政状况造成不利的影响,并最终影响企业的长远目标——创造长期的股东价值。

现在我要给大家讲一讲体育、商业及投资这三个领域的一些情况,并且给大家看一看在这几个领域里,人们经常使用到的一些统计数据。我这么做的目的是让大家看一看统计数据在这些领域中不同的稳定性及可预测性。因为实力雄厚往往代表着高稳定性及高可预测性,因此我们可以根据相关关系来推断出许多有关给定活动本质属性的信息。

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000