大数据技术应用于人力资源管理
政府大数据分析海归专家黄秋钧2016年6月17日在“大数据人力资源宏观管理应用技术创新研讨会”的讲话
各位领导,各位专家:
大家下午好!
我是一直从事大数据技术,在实际的商业和工业领域应用的一些工作,所以今天主要从技术应用方面谈一下在人力资源管理方面的技术应用,这过程中主要是王院长指导人力资源方面的理论方法。
从我的感觉,我的经验上,大数据技术的形成实际上主要是一开始解决实际问题,我们数据量特别大了之后,大家会有一些新的问题出来,所以是先实践,后有理论的,而大数据的到来不是突然从天上掉下来的,他是有一个科学发展的过程,他是类似于历史的车轮往前走,从到这一步了,之后大家会有一个新的理论化的定义框架。
从计算机发展历程来看最开始是软件时代,比如说系统软件,像windows,之前有windows95、98,有XP之类的,之后我们会有互联网时代,就是我们的网站,互联网2.0时代,我们的一些社交,比如说国内之间的人人网,还有腾讯空间之类的。因为数据量极大丰富了之后,大数据时代就到来了。而且这种发展是不可逆的,我们现在大数据时代也有一些新的,比如说像人工智能,像阿尔法狗和人下围棋,还有比如说机器人代替人类做各种工作,比如说智能化的汽车之类的。
未来大数据时代发展到什么方向,其实现在有的方面还有待研究,这是未知的。大数据的产生是源于问题,在IT行业有一句话来描述这个历史的发展历程,“计算机承诺给我们智慧的清泉,带来的却是数据的洪流”。因为计算机发展,软件发展,互联网发展了之后数据量越来越大,就产生了很多问题,这就像古代有一个大禹治水的故事,当数据量越来越大了之后,大禹的父亲采取的是筑大坝,把水堵起来,之后失败了,大禹采用的方法是疏通渠道,把这些洪水引到海里面去。我觉得我们现在可能对于大数据时代的正确方法也是要正确的用我们的一些工具方法和理论去利用大数据,让数据为各个领域的产生活和管理服务。
大数据的效用,我理解主要体现在三个方面,一个是降低成本,还有一个是提高效率,另外一个是控制风险。成本的降低不只是一个经济学的概念,可能是有管理成本,或者社会成本。而风险和效率也都是一个更广义的,比如说像安全方面的,像公共安全之类的,还有反恐都是一些风险。
我之前工作中的实际案例,美国的交通数据里面的对于驾照的数据进行管理的案例,在美国,他的驾照是一个非常强的ID,因为美国人有护照,但是他没有身份证,他可以把驾照当成自己的身份证用,美国联邦法律规定一个人只能同时合法用一个州的驾照,但是这一个政策在很长时间内都没有得到有效的执行,就是因为管理起来成本太高了,联邦只制定了法律。事实上的美国驾照的发放申请,还有管理都是在州政府,州政府有权利做这一系列的工作,比如大家可以看到这个上面的图片,每个州都有自己的驾照,他设计的风格,包括上面的数据,还有防伪标识都是五花八门的,举个例子,比如有横版的、竖版的,像竖版的,加利福尼亚州的,他的防伪模式就是上面有两个照片,有防伪码,其他州没有。夏威夷的有条形码,直接可以扫录。
这就造成了一个问题,他们之间的数据是孤岛,是不打通的,而且很难避免一个人有多个驾照,像美国有的人会人为的申请多个驾照,在一个州的驾驶,比如说他的驾驶违规了之后,他就到相邻的州再注册一个新的驾照,导致政府的管理成本非常高,而且数据库里面的数据是相当混乱的。
有这样的问题之后,他们就用大数据的方法解决这样的问题,受到他们也是从政策层面进行论证,应该怎么解决问题,找某些州进行试点,试点成功之后推广,从技术层面上他们怎么做的,首先需要把不同的州的数据,原数据模型要进行统一的标准化,未来所有的州数据库是以这种模式的,把数据库连通,连通了之后把里面疑似可能是属于同一个人的驾照进行识别和匹配,其中比如说像里面有的人可能人为的要模糊这些信息,如果有个美国人叫约翰·史密斯,他可能在加利福尼亚州叫这个名字,他跑到马里兰州,注册一个驾照叫杰·史密斯。会有其他的方式来识别这个人,我们可以看到所有驾照上面有这个人的照片,他会把这个照片扫描到计算机里面去,用人脸识别技术,即使他这个人可能其他信息上已经模糊,他有一套算法确保,他会有一个指数,看这个人上面所有驾照是不是匹配属于同一个人的。
有了这套系统之后逐渐的就把很多冗余的驾照合并了,这样的好处一个是降低了整个管理成本,另外也规范了这些人的驾驶的习惯。而且进一步的预防他的犯罪,因为驾照可以作为一个ID在社会上使用。这是当时美国政府做的大数据对于交通管理的案例。
大数据技术在这个过程中是如何工作的,他有政府的一整套政策设计方面,另外有了政策设计之后会有技术平台和算法,像刚才说的怎么能识别不同的驾照属于同一个人,这个东西需要怎么落地,这里面需要一些核心的因素,我感觉需要一些核心的因素,一个是首先肯定要有数据,这个数据来源可能是政府的、科研的、商业的或者互联网的。而且对于这些数据的处理、收集,还有分析、清洗各方面需要一些工具,现在就是比较主流的是Hadoop,或者更高的往前的Spark和Storm,这些技术已经非常成熟了,而且没过半年或者一年就有新的平台出现,比如我们在工具上没有任何的问题,另外有了工具需要算法,比如说像人脸识别的算法,怎么样识别不同的照片是不是同一个人,比如五官的比例,比如眼睛的间距,这些算法也是其中核心的一部分。另外把他的结果进行可视化的展示,然后形成报告,对于决策进行支持,这是展示。
左下角这个图,现在行业里面每一年都会有清根性的一些平台和工具出来,所以大数据技术本身是在一个高速发展的过程中。其中有一个问号,这个问号是什么呢?数据也好,工具也好,算法也好,展示也好,他都需要大数据技术方面的专业人才来做,这个可能就是未来大数据发展中的一个瓶颈,大数据因为发展特别快,现在大数据方面的人才是非常稀缺的。
我们如果把前面的过程再抽象一点,其实本质上是我们所说的大数据应用,不管在任何领域,他做的事情是把数据转化成为知识,我们在大数据时代,数据本身是非常丰富的,但是信息是非常频繁的,类似于大家每天用手机,会受到很多推送的消息,这些消息很多未必你是真正关心感兴趣的,而把数据转化成信息,再转化成知识,本质上是大数据知识在做一个核心的功能,数据在英文,源于拉丁文,数据在拉丁文中的意思是事实,是发生过的一些事情。
用我们中国人的理解就是其实这个过程如果打一个形象的比喻,中国人对于另外一个词更有感觉,就是历史,中国人对于历史的爱好基本上是胜过世界上任何一个民族,比如说我们从古到今,有《尚书》、《史记》、《资治通鉴》,也是把发生的事情进行记录,记录之后,我们要进行分析,比如说像司马迁,或者司马光经常做一些批注,说太史公曰,把这些发生的事情里面有什么样的意义要抽象出来,而这些意义和历史背景会形成信息,这些信息得到积累之后抽象出一种知识,比如像三国演义前面就说天下合久必分,分久必合,这是知识层面的,他不只是数据层面的了。对知识的应用是需要人类的智慧,我们怎么去用这种知识。大数据技术主要完成的就是把数据转化成信息,把信息转化成知识,这些知识是帮助我们进行决策的,就是我们说的,比如说现在的商业智能,或者决策知识体系,都是把知识提供给决策者,决策者运用自己的智慧进行决策。
对于大数据技术在人力资源的管理,我感觉这中间可能有一个双向的流动,左边这个图我感觉是一个数据流,因为在人力资源管理方面有不同的层次,比如像宏观的,像国家的、社会的这种层次,非常宏观的一个层次。还有国家下面有不同的行业,比如有医生、律师或者IT行业,每个行业里面有自己的公司,对于数据流,举个例子,就像水一样,公司里面有自己的小数据,行业里面数据可能会变成一个大数据,一直到宏观层面一定是一个非常大的数据,类似于小溪里面的水流到江河里面去,江河里面的水又流到大海里面。国家级的大数据平台一定会把这些更末端的数据收集起来,国家的平台又包括了不同公司的,不同行业的,他是一个集成,国家的宏观平台有这些数据之后,国家可以做很多行业和公司不能做的事情,因为国家类就似于一个森林的,行业可能是其中的一棵树,而公司可能只是树上的一片树叶,如果森林的功效,他的生态系统破坏了,树会死掉,树叶会枯掉,国家应该对于比如说整个数据平台里面进行科学研究,发现其中的规律,对不同的行业制定规则,像刚才尧川说的,要制定政策性的东西,对行业进行规范,这是国家拿到数据之后应该从宏观层面进行推动了,行业层面做一部分,公司层面没有办法做这样的事情。所以这是两个方向的,数据方向应该从小的往大的方向聚集,而另外政策方向是应该由国家做一个顶层设计,推动行业,一直到公司的终端。
对于微观层面的人力资源的应用,对于这些小数据,当时我向王院长请教,最核心的就是进、管、出这三点,我们如果先从微观角度把小数据进行分析和整理好了之后就可以往上走,往行业,或者往国家平台走。这里面据个例子,比如像人才识别和评测,像现在很多公司其实已经可以做这件事情了,比如像大的一些招聘企业,还有一些互联网公司,还有比如大的公司,他对人才识别,他可以自己完成这部分功能,为什么这里举人才识别和评测呢?因为像进、管、出也好,这是人的一个动态流动过程,而人的动态流动过程,其实本身人是变化的,中国有句古话叫做阔别三日当刮目相看,这个人本身在时间上有可能是增长的,我们要对这个人进行不断的测试,就像物理实验和科学实验一样,我们要对这个人不断的进行评测,而评测就需要一个模型。比如我们可以把模型有不同的维度,比如工作产出方面,工作的效率、质量,还有知识技能方面,还有个人能力素质上面,还有活动力和贡献方面,当然这个模型现在维度可以根据公司的实际情况进行丰富,但是行业会对这些进行规范。
对于公司层面,这个应用我这还有另外一个例子,这有一张图,我把这个图里面的单位隐藏起来了,大家可以猜这张图在做什么,可以心里有个答案。这张图其实是在公司层面把人的不同维度的数据放在一起进行分析,对于公司的整个风险控制和成本管理。这张图的纵坐标,比如从3K一直到30K,这是公司里面的薪资,横坐标是薪资,纵坐标是绩效指数,绩效指数可以有很多方面,比如说KPI、考勤之类的。
我们会发现上面主要分为四个区域,左上角这个区域是的红色的,右下角的区域是黄色的,剩下两个区域是绿色的。红色的区域意味着这些员工,每个点都是一个员工,这些员工拿的工资很低,但是他的绩效是比较高的,这会给公司带来风险,为什么?如果这个人工资很低,能力很强,绩效很高,这个人很容易跳槽,在行业里面这样的人工资拿的比其他人低,绩效很好,这个人会跳槽,跳槽对公司本身也是一种风险,比如说你一直在招聘,对公司有其他的损失。黄色的点意味着这些人在公司里面他的薪资相对来说比较高,但是绩效比较低,这可能需要公司对他们进行成本控制,一方面进行培训,或者要进行辅导之类的。绿色对于他的绩效工资匹配是整个正常的范围内。这个例子就说明了大数据在人力资源管理应用方面未来会呈现精准化和智能化,未来可能人力资源管理总监不需要再去找一些核心的东西,谈话,其他的方式,他是以一种数据驱动的方式进行决策。
公司层面的数据到了行业之后,行业会做很多公司层面做不了事情,比如说其中非常重要的一点就是行业信息与研究,就像刚才前面几位专家提到的,他会形成一些指数,有的行业,比如说IT行业的平均薪酬指数,或者说他的需求指数各个方面的,这是行业层面需要做的,因为公司,除非是专门在人力资源特别大的一些互联网公司可以做的事情,大部分公司都没有办法以公司的角色和能够做这样的事情。
行业研究还有一个,面向宏观的,对于国家进行支持的,右边这个图是美国的咨询公司做的,2015年的十大人力资本的趋势,其中他们研究发现2015年全球范围内企业面临的最大问题是雇佣和留人的问题,为什么?是因为大数据和人工智能崛起之后,很多低端层次的工作被智能的替代,所以低端层次的劳动力会供大于求,而高端层次的劳动力是供不应求。人才未来的趋势如果没有政府或者行业的扶持和干预,可能未来过几年会发生问题。这是行业领域做的工作,面向宏观。因为国家可能比如说人社部是管很多行业的,或者政府管很多行业的,每个行业做自己的事情,很多行业有自己的专家。另外的行业是对面向公司的,比如举个例子,IT行业的平均薪酬指数,这种薪酬指数对于IT行业的人力资源总监是非常有用的,他可以比较自己公司里面的薪酬,比如一个核心的架构师和一个行业之间的薪酬是不差别特别大,如果差距很大的话,比如低于行业标准,他可能会跳槽,就会增加公司的风险,另外一个是行业的规范与标准,这个也是需要和宏观层面进行结合,包括行业管理也是。
对于宏观层面,国家层面的人力资源管理,可能像王院长说的,一个是数据收集非常重要,需要从终端,从公司也好,行业也好,需要有国家级的平台把这个数据收集起来,另外进行人才供应的平衡,供需的匹配,还有发现规律和趋势预判。就像刚才说的,研究报告进行研究之后他可能会发现未来的人才发展趋势,可能某些人力资源供应可能是过量的,有些方面是不足的,这可能就会给国家的经济发展造成一定的干扰。而且对于国家层面的很大的数据进行创新研究,这种创新和研究通常来说需要消耗大量的人力物力,比如说需要特定的专家,有特定的课题来进行完成,甚至有的行业没有这种资源进行完成,这种研究之后对于国家的宏观战略提供支持。
另外一个是实时人才舆情,像每年的大学生就业,还有每个行业的人才储备变化,举个领子,我感受比较深的,像大数据行业里面,因为大数据的技术更新非常快,每年都会有新的平台,一年前的数据其实对今年已经没有什么指导意义了,可能需要每个月的,每个月甚至都是模糊的,他需要一种实时的数据才知道这个行业里面人才的储备量是多少,未来需求量是多少。像刚才说的,现在对于大数据人才,我感觉是这个行业里面最大的一个瓶颈,因为对于工具也好,还有算法也好,这些都需要人才来做,而现在真正在大数据技术领域方面竞争的主要就是中国和美国之间,中国的优势,中国的人口是美国的4倍,因为互联网+、双创,有很多的企业有非常多的数据,这么多的数据出来有非常大的需求,比如像滴滴打车肯定需要大数据的平台,需要大数据的算法。还有各种互联网+,比如洗车、家政,未来都需要数据化的人才,这些人才未来供应,如果跟不上的话,会对企业发展形成一定的影响。
前段时间我和田教授聊天,现在全世界最好的数据算法的人才通常就集中在研究所里面,另外一个是在金融,或者银行行业里面。他告诉我像他们研究所毕业的学生大部分是去了银行里面,而且每年毕业的人数是非常有限的,这种人才在行业里面是供不应求的。美国现在有了这个问题之后,很多大学研究生院有一些学科,我有一个朋友,秋季会去纽约大学,他们开设一个学科叫做Data Science,是一个研究生院的,叫做数据科学,他把计算机的统计的,还有数学物理的算法的,和他实际的应用结合在一起,这种人才培养出来之后直接送到华尔街。我感觉可能现在在整个大数据应用里的瓶颈,未来在人才方面会有比较稀缺的问题。
这是我对这方面的一点浅见,谢谢大家。