人才测评“新玩法”酷炫当道?其实测得准才是王道

发布时间:2021-01-08 文章来源:GBA游戏化测评 作者:李临风

新玩法的本质,并不是替代传统玩法,而是在原有基础上进行迭代升级,使功能更丰富化。

人才测评行业是一个极其细分的领域,属于人力资源行业下的小分支。自上世纪六七十年代起,各类商业化人才测评机构开始出现,其商业用途聚焦在企业重点人才评估为主(如人才招聘、内部人才晋升等)。


从第一家商业化测评机构成立到今天已经有近50年,市场上也出现了形形色色的人才测评机构。目前就中国地区而言,整个人才测评行业市值预估也达20亿元以上。相对传统测评玩法(问卷法),近几年也出现了不少人才测评新玩法(如AI面试、游戏测评)。



图片
目前主流的人才测评玩法
图片



1. 问卷法

方法论:心理测量学


理论依据_副本.png


该类属于传统人才测评最经典的方式,其中以性格问卷为主。说到主流的性格理论,一般分为类型论和特质论。类型论(如常见的DISC、九型人格等)很好理解,就是输出的测评结果会告诉你属于哪个类型,但不会告诉你这个类型的具体程度分数,相当于定性测评,很多人喜欢的星座测验也属于这种(当然,星座测验肯定不建议用于人才选拔,原因不过多解释)。而特质论顾名思义,输出的测评结果会告诉你该特质上的程度得分是多少(如你的“亲和力”很好,那这个所谓的很好到底是5分还是7分,特质论的测评都会体现出来),相当于定量测评。相比类型论,特质论更多用于人才招聘和人才选拔上,最主要的原因就是特质论的测评数据以客观、量化为主,这样是比较有利于做人才决策的。


不论是类型论还是特质论,作答方式都以自陈式为主,即根据题目内容“我认为或我倾向做哪样的行为”从而判断作答者的性格特征。这样的方式属于一种预测,从“自我感知”到性格特质的预测,如设计理论扎实的话确实有一定的精准度。不过,随着问卷法的测评方式普及,我们也听到企业方的一些声音,即有些候选人在应聘前做测评会选择“我应该”而不是“实际”的特征(尤其是对于职场老手更是如此),这样给面试官带来了所谓测评报告“不准”的感受。要解决这类问题,我们通常的手段是增加其它测评方式,如现场面试或其它测评工具再次加以验证。


2. AI面试

方法论:AI自然语言理解+BEI行为事件访谈


AI面试_副本.jpg


AI面试在近几年开始火起来。随着人工智能的概念提出,各行业都想蹭下这个热点,体现出“AI+”的特色。如果说传统问卷法测量的是冰山下的特征(性格、动机及价值观等),那AI面试测的就是冰山上显性可见的行为。简单来说,AI面试就是把线下一对一面试搬到了线上。题目内容以开放题的形式(如要考核“沟通能力”,那题目就是“请描述下过去半年内,你通过沟通影响成功完成一件任务的经历”),根据候选人对于过去行为事件的描述,后台系统会进行机器学习和判断,最终得出候选人在该维度上的分数和行为描述。目前,AI面试最直接的应用就是提升了HR的初面工作效率,同时,候选人对于这样新颖的面试方式也受到一定喜爱。


不过,AI面试目前还不能实现追问功能,最终结果可能也会受到候选人所描述行为内容的丰富性和作答态度来影响。相信在后续的迭代上,这些问题可以解决。


3. 游戏测评

方法论:实验心理学+脑神经科学+AI


目前市场上提出游戏测评概念的有很多,主要分为Gamification(游戏化)、Gamified(游戏式)、Game-Based(基于游戏的)三种。第一种就是纯游戏(如某宝上的小游戏),侧重激励为主,基本脱离人才测评本质。第二种在传统测评的基础上包装了游戏的外衣,本质上还是自陈式作答。市场上认可度比较高的是第三种,Game-Based(基于游戏的)测评。


Game-Based(基于游戏的)测评主要以实验心理学为基础,相比问卷心理学,实验心理学的特色会带入更多沉浸式体验。原理是通过候选人在情境中所表现出的“行为”来预测人格特质和认知能力,这样的测量方式会更直接。就像我们要评估销售的“抗压性”。传统的方法是直接通过问卷让候选人在“我是一位抗压性较高的人”这样的问题上打分(如1-5分)。而游戏化的沉浸式测评会直接把候选人放置到一个有压力刺激的情境中,通过候选人的实际反应来直接得出“抗压性”的程度得分。以实验心理学为基础的游戏化测评彷佛对传统测评在说,“我不要你觉得,我就要真实的行为”。


通过人的实际行为来直接预测该人的行为特征,会比传统测评所谓“我觉得”、“我认为”这样的感知来预测行为特征来得更真实,这似乎是游戏化测评对传统测评的“宣战”。



图片
 “新玩法”的核心
图片



既然目前已经这么多新玩法,那老玩法是不是会慢慢被淘汰?答案:肯定不会。


所谓新玩法的本质,并不是替代传统玩法,而是在原有基础上进行迭代升级,使功能更丰富化。就像手机一样,从之前的2G、3G发展到了5G,功能虽丰富了很多但原来2G、3G下有的电话、短信功能目前依然有,且同样是核心。只是现在的短信功能升级为了微信,电话功能升级为了视频通话等。因此,新玩法的本质不是替代老玩法。


那么,为什么需要迭代升级?那一定是老玩法(即传统测评)上的几个局限需要改善。


(一) 传统测评的局限


1. 易伪装

传统测评的作答以自陈式作答为主,问题通常以“我应该”或“我觉得”来预测实际行为。对于多次作答测评的“老手”而言,往往很容易把“应该”的行为等同于实际行为,这样的结果往往跟实际情况不符,目前该类问题也是传统玩法难以解决的,这样也是直接导致了传统测评的精准度有限。


u=2724387437,1026958359&fm=15&gp=0_副本.jpg


2. 作答枯燥

对于很多招聘工作者而言,其实很“害怕”给候选人安排测评,因为确实存在不少候选人因为测评作答过程中枯燥或繁琐而放弃了面试机会。尤其是现在的95后和00后,体验感是放在首位的。因此,测评对于很多HR反而成了一把双刃剑。


3. 过于通用

这个对于大多数测评机构而言,主流趋势就是做通用测评项目,很多测评报告几乎是通用全员。当然,也可以提供定制服务。不过该服务通常耗时长并且成本高,一个定制化模型下来差不多就1-2个月,这个时候项目可能已经启动很久了。如何在“通用-定制”之间做到一个平衡点,也是传统测评玩法的局限之一。


那么,新玩法的本质是什么?答案一定是围绕如何改善传统测评的局限来达成。


(二) “新玩法”代表——GBA游戏化行为测评浅探


1. 科学依据

GBA游戏化行为测评全称是Game-based Behavioral Assessment,其代表公司为英国arctic shores及其大中华区合作伙伴haneo嗨优GBA的核心还是以经典大五人格心理学、脑神经科学为基础的Assessment(非游戏),Behavioral是评判依据(非感觉或直觉),Game-based是形式(目的不是好玩,而是以沉浸式体验让结果更真实)。


2. GBA理论基础——风险偏好为例

GBA人格测评采用了生物学的方法,人格被认为是我们大脑结构和功能的产物(DeYoung,2010)。Helfinstein等(2014)使用FMRI测量的大脑活动模式来预测某人是选择冒险还是安全,结果表明预测的正确率为72%。


气球_副本.png


以上图关卡“冲气球”为例,该关卡左边按“充气”后,中间气球会变大,气球越大可兑换的钱越多,当达到一定数量时按右边的“存钱”,即成功完成金钱存入。该游戏的提示语是在给予一定气球数量范围内,存钱越多越好。但是,如果“充气”按键过多,气球会爆炸,这样一分钱也存入不了。如果“充气”按键少,那存入钱可能不能完成“任务”(测量了“风险偏好、损失敏感性”)。



图片
测评新玩法应有的特色
图片



1. 精准度提升

这是“确定一定以及肯定”的,精准度是一切测评手段的底层核心,如果连精准性改善都没有,所谓新玩法就没有任何意义。传统心理测评的效度一般在0.3-0.45之间,如果能在这样的基础上提升,那新玩法的存在也就有了价值。


以传统测评为例,一个刺激一般对应1-3个数据点。而GBA是沉浸式作答,是根据作答者行为反应来判断人格特征,一个刺激就可对应N个数据点。


GBA的最大特色就是可以通过作答者的行为不断反复验证同一维度。这个有点类似于AC评价中心,如我想验证一个人的领导力,是通过在线测评一种方式来验证,还是通过在线测评+线下行为访谈+情景模拟+角色扮演等多种方式来验证会来得更精准呢?(两种方式所花的时间精力是相同的情况下,那一定是后者)


2. 灵活的定制化

就像上面说的,大多数测评报告都是通用全员的。而对于很多中国企业而言,每家企业都会认为自家是特殊的,需要独一无二的专属。而在一些成熟的企业里,本身就有关键岗位的胜任力模型,这个如何如果还花费大量时间做定性+定量的分析,确实有点浪费时间。如果建模的自主权交给企业方,实现轻量化的敏捷建模,相信很多企业应该会愿意为此一试。既然要敏捷建模,通常讲究“三定”原则,即定维度、定分数区间、定权重。


一、定维度。这个好理解,即确定好和目标岗位相关的胜任力(或特质),一般数量在6-8个之间。


二、定分数区间。即选择合适的胜任力(或特质)的分数区间,有些特质分数很高反而就是有风险的(如“灵活性”达10分最高分,那风险就是“守规性”极弱);有些特质分数很低可能就越好(如“情绪波动性”分数越多,说明情绪越稳定);当然,还有些特质分数在中间越好(如“利他性”,该特质极端高或极端低,不太利于工作的顺利达成,反而分数处于中间的话说明可以平衡好他人和自己的需求,这样达成绩优的结果会更高)。因此,每个特质会有不同的适配区间段,这样比起传统测评,分数颗粒度就细致很多。


三、定权重。即每个特质维度的百分比,也可以自主由企业来搭配。随着岗位差异性,可设置不同的维度权重百分比,从而适应企业对于岗位模型配置的各种灵活性需求。


3. 业务赋能

很多人对于测评的态度就是“just a tool”。我用肉眼看人也挺准的,为什么还要借助测评工具?一个工具能给业务带来多大的影响?用了测评所招聘的业务员能让明年销售额能翻倍吗?这是企业方对测评的“期待”。不过老实说,如果一个测评工具能达到这样的效果,我想市场上所有测评公司都已经发财了(可现实并不是)。因此,测评的业务赋能并不是直接给业绩带来单一影响。


测评给企业的赋能影响一定是全方面。这个像判断某人的身高,如果就是陌生人见面大致评估一下,那用肉眼简单预估也无妨。但如果是体检评估作为有资格能否成为宇航员的备选人,那就得借助下尺子这样的工具了,而且这把尺子不仅颗粒度得细(保证效度),还得反复测量几次才能“安心”(保证信度)。


因此,测评的价值其实取决于“情境”。对于大规模招聘初筛场景中,测评节约了人工时间,起到降本增效作用;对于人才选拔或晋升场景,测评起到了精准和科学决策的依据,大大降低了企业的用人风险。我相信,能选择出一个对的人才所创造出的价值是一定远远高于一个测评工具的成本;对于数字化转型的企业,测评可结合人力资本数据,让员工成为企业的“资产”并量化出来,为战略调整和组织变革提供关键的数据支撑。就像火箭成功发射升空,内在组件虽小,但也足以影响成败。这是一种多方面的业务赋能。



图片
人才测评发展趋势
图片


趋势_副本.png



目前纯测评项目在市场上已经非常少见,更多的是“测评+应用场景”,这也是符合测评业务赋能的全面性体现。常见的“测评+”通常体现在以下方面:


1. 人才项目领域(测评+服务)

一类是人才招聘项目上,具体服务含在线工具、线下面试题本、面试技巧培训等,以重工具为主。另一类是人才发展项目上,具体服务含360问卷评估、AC评价中心、团队报告及群体反馈等,以重赋能为主。


2. SAAS系统领域(测评+系统)

该领域目前是个“香饽饽”,尤其是今年疫情导致很多SAAS公司业务量大涨。主要功能模块含人才画像、在线人才盘点、人才管理、在线学习于发展平台、继任者管理等,以重平台为主。


3. 组织诊断领域(测评+咨询)

该领域的操作门槛相对较高(以管理咨询公司为主),一般是“从上到下”来影响,主要项目模块涉及组织诊断、战略解码、数字化转型等,以重顾问+平台为主。


以上是市场上主流的几个“测评+”的应用领域,当然,随着测评全面性特色的发展,未来一定会呈现多元化的领域趋势。最近有一位做管理咨询的朋友接到一个项目需求,客户希望通过分析购买他们产品的客户的人格画像,来制定不同的产品的销售策略,这是一个很具备“测评+”特色的例子。再比如跨行业,我们跳出人力资源圈,测评能否进入投资领域(如通过人格分析来选择合适的合伙人)、公共安全领域(如通过人格大数据分析出抑郁、自杀倾向、反社会人格的特质,并自动向公安部门预警)、教育领域(如通过人格分析得出适合的专业及潜能定位等)?


目前“测评+”也踏入了数字化转型的浪潮中,这块市场确实很聚焦,但也拥有无限延申的可能。拥抱变化,迎接风浪与挑战。