测而有“信”——用国际视野看信度

发布时间:2019-04-12 文章来源:Haneo 作者:里岔

理想情况下,如果一个测评工具能够提供重测信度,那自然是最好的。而实际上,重测信度由于被调查者容易受到各种外界因素的影响,心态、状态可能产生……

  4月临近尾声,很快又要到了HR小哥哥小姐姐们做测评工具review的时候了。信度呀效度呀这些硬指标又要被拎出来好生折腾一番。那么到底多少的信效度才算高?什么样的测评工具才值得被认可?今日小编就带大家一起聊一聊测评中的信度。


1_副本.jpg


  什么是信度(reliability)?


  信度(reliability)是指一个测量工具多次测量结果的一致性,它直观地体现了工具的“可靠”程度。举一个例子,如果我们用一个测评工具来测量一个未知的动物,反反复复测了10次,10次结果都说是兔子,那么说明这个工具的信度是比较高的;而如果测出来3次是兔子,4次是老鼠,3次是松鼠,那么它测评结果的一致性就不咋地,信度也就偏低了。


  怎么看信度指标


  目前主流的信度指标有三种,重测信度(test-retestreliability)、复本信度(Parallel-formsReliability)以及内部一致性系数。它们分别代表了测评工具可靠性的一个方面。


  重测信度:是对同一组被调查人员采用相同的测评方式,在不同的时间点先后测评两次,两次调查结果之间的差异程度。这是最为贴近信度定义的指标。


  复本信度:是对同一组被调查人员运用两份内容等价但题目不同的问卷进行调查,然后比较两组数据的相关程度。


  内部一致性系数:主要反映的是测验内部题目之间的关系,考察测验的各个题目是否测量了相同的内容或特质。这是目前最为常见的信度指标。


  可以看得出,上面三个指标其实在描述的是测评工具信度的不同方面。其中重测信度是最为贴近信度定义的指标,因此最有说服力。


  理想情况下,如果一个测评工具能够提供重测信度,那自然是最好的。而实际上,重测信度由于被调查者容易受到各种外界因素的影响,心态、状态可能产生不可预测的变化,获取可靠测量结果的难度也就很大。很多测评厂商就会模棱两可,拿另外两个测评指标来混淆视听。


2_副本.jpg


  所以各位HR小哥哥小姐姐在审查信度数据的时候,一定要弄清楚测评工具的信度指标是哪一个。这样才能避免鱼目混珠,选到合心的测评工具哦。


  信度好坏的评价标准


  那么究竟信度要达到多少才算合格呢?其实我们只需要了解一些权威机构给出的标准即可,比如BPS(BritishPsychologistSociety,英国心理学家学会),APA(AmericanPsychologicalAssociation,美国心理学家协会)。


  根据BPS的规定:测评工具的信度的可接受范围是r(相关性系数)>=0.6,如果r在0.7和0.8之间,信度为好(good);如果r大于0.8,信度则为优秀(excellent)。


3_副本.jpg


  GBA(Game-based测评工具)的信度


  GBA是一个具有革新性质的测评工具。它不再通过问卷的方式来搜集数据,而通过观测被测人的应激行为来做判断。因为主观选择是很容易受外界事物影响的,而无意识行为却特别诚实可靠。这也是为什么多个国际500强企业选择测评人的“行为”,而非“想法”。


  GBA在信度方面的表现整体优于传统的问卷测评方式。Haneo的研发团队组织了大量的实践调研,GBA的整体重测信度为r=0.9,单个维度的重测信度r均为0.7以上,p值均小于.01。因此各位HR小哥哥小姐姐可以放心拿来用啦。