大数据背景下的人力资源管理
海淀区政府大数据平台开发专家徐起2016年6月17日在“大数据人力资源宏观管理应用技术创新研讨会”上的讲话:
各位领导,各位专家:大家好!
我先给大家介绍一下,我叫徐起,是一直做政府的项目的。但是我们是做信息化项目,在这里面其实我们做了很多和大数据相关的,王院长之前提了姚景源说的关于农村统计,其实那个系统我们就在做。我们现在是两种模式,一种是现在已经开始采用,北京有一个北京小卫星,他已经开始采集这种数据了,因为现在技术也发展了,原来各个地方报纸质的,但是我们要求他们拿着手机或者Ipad,由农户自己上报,每一层我们都能做到逐级的监管。所以现在的数据其实相比原来的时候可能稍微要好一些,这是我们对这个,政府开始做,因为我们做了很多项目之后,我们可能发现政府有很多,在大数据的时代有一个数据使用的功能,应用数据的时候有很多难处,因为他也要采集很多量的数据。包括我们现在做的全国的关于人均的收入和支出的情况,其实统计局是在全国布了30多万人,开始每人用手机开始记账,来最后得出一个数据,就是人均的可支配收入,数据量从大数据角度来说谈不上大数据,但是从现实的手段和方法,现在我们也是给他提供,现在用手机移动的方式做,这也是我们比原来用纸质的手段要稍微好一点了。政府也会有一些新的手段和方法。
因为我们在研究大数据的时候,这个可以看到,我们是给海淀区从2010年,他们开始决定用数据做决策,他们在用数据做决策的时候主要是因为,现在可以看到阿里巴巴也好,或者是很多公司也好,到他们的大数据网站上,像阿里巴巴今年刚推出一个郡县图志平台,给县长级,或者区域的管理人员提供一个类似于像阿里巴巴“双11”作战大屏一样的全景图,让各个县长或者是区长等等,他们看到自己全区现在的现实发展情况。其实我们在2010年已经在海淀区落实和做了这样的工作。我今天讲的内容在后面讲为什么我们后来做了人力资源方面的东西,其实我们在2010年开始做政府决策、数据决策的时候就发现了很多数据方面的一些问题,先讲一讲我们在做这个工作的时候的背景。
一个政府在运行的时候需要有各种各样的数据,因为以前都是领导采用了这种基于全面的理论,什么样的领导上台,或者什么样的领导在位的时候会采取什么样的处理方式,其实这都不是基于数据得来的决策方式,后来我们采用城市的体征的方式,包括税收,包括政府投资,包括科技创新等等。各方面,我们从各个角度出这种数据,来帮助政府领导做数据决策。
我们为什么做这样的事呢?其实是来自于高根的大数据与行业的分析图,你可以看到,其实政府的契合度是在所有大数据行业当中契合度最高的,但是相对来说确实有比较难的地方,不像互联网、电子商务、电信局或者是企业流通这些领域,他们可能相对来说用起大数据是比较简单的,但是政府应该要用大数据,但是他的难度相对来说是比较难的。
各个地方,因为我们要做这个东西,我们也会研究一下包括国外的大数据,是不是国外的好,一会儿我再讲,因为我们在做的时候发现确实不一定是国外的月亮一定比中国的圆。包括我们研究美国、英国、澳大利亚和日本,像美国的大数据平台叫DATA.GOV,大家很多都举这个例子,但是实际这个大数据平台从2004年开始立项,一直到2009年正式成立之后,但是在前两年由于运行不下去的时候就已经宣告结束了,但是这个平台是一间民营的机构在运营他。美国也会开放这些数据的一些基础的平台,我们把这些平台开放了,数据也开放了,我提供给一些民营的机构,或者是一些有意向要去做政府数据分析的专家们做一些分析,这是我们在做一些政府数据应用的时候,我们一些可以参考的东西,包括英国,英国是参考了美国大数据的内容,他们也是DATA.GOV.UK,这是他们的平台,包括韩国。
其实我们做国内的大数据的时候,其实和国外有一点不一样,而且这个并不是说我们刚才看到花花绿绿的图觉得特别好,是不是当下的情况就是这样的,我们可以看到这个调查,他们认为42%的可能性是现在的这些数据是有问题的,59%这些数据是没有办法获得的,还有47%认为这些数据都是不可靠的。现在这些数据质量的问题是非常大的,其实我们在做很多政府的数据的时候,我们也发现了很多问题,虽然刚才提到我们有一些修改,或者是修正等等,帮助政府把数据质量变得更好一些。但是确实现在还有一些问题,所以我们也想了一些解决办法。刚才尧川院长在说的这个,其实制度保障,电商有电商的方式,政府在做大数据的时候其实也应该要有一套自己的体制机制,建制度才能保障这种数据收集的全面性。而且要建一种管道,我们数据采能够统一聚集,其实不是我们的应用方式,也不是我们的应用方法,刚才也提到了很多数据怎么使用,用什么样的科学手段等等,其实很多我们是没有数据管道的,数据上不来,分散在各地,即使数据上来了,都是一些非技术人员怎么用,他也不知道怎么用,我们也没有一个像公开的开放性的平台,所有数据上来之后我们都可以用。
这个例子我们就可以看到,这也是2010年做的,给海淀区统计局做的,通过我们把地税的数据收集上来之后就可以看到纳税大户在哪个行业,未来怎么做产业规划。其实有这种平台,有这种数据,这种分析,我们就能做得出来,并不是技术手段的问题。但是这种平台并很多普通的大众都接触不到,而且数据他们也拿不到,所以我们认为也要建这种平台,才能保证数据创新的利用。只有建这种平台,像美国就会做包括把枪支和犯罪,把两种数据搭在一起,做枪支和犯罪的关联性的关系,他们是不是有关系。像美国政府在做决策的时候,认为枪支多的要进枪,但是两个叠加在一起的时候才发现枪支多的时候不代表他的犯罪率会上升,他的犯罪率可能还是下降的,虽然不知道是什么原因,但是从数据的观点上来看这种叠加型的就可以看出来这种是没有任何关联的,所以政策在后期的制定也会给他提供一个方式和方法。但是这种方式,这是一个中学生,他把数据和平台拿出来做的分析,反而给政府提供了一个有效的提示,我们也要搭建这样一个数据平台来保证数据的创新利用。
我们再往后看,我们在做数据的时候,国际上是什么做法,我们归纳了一下,应该是四个聚,我们要聚集、聚焦、聚合、聚变,只有聚集了这些数据,我们聚焦了一些领域,我们聚合我们的一些服务才能实现这种数据的聚变。
这是我们对大数据我们现在的一种探索的思路。但是在政府里面这种庞杂的数据,不关联的数据,怎么能把它梳理出来,把它给串成一条线,能把它建立一种数据,一种新的秩序是我们研究的一个课题的重点,包括对人力资源宏观管理来说,什么样的数据能为人力资源管理提供有效的支撑,是人社部的数据吗?或者是教育部的数据,教育部是为了人下一步发展能提供一些数据,还是民政局,后面我们会介绍到,其实民政的数据也有用,各种各样的政府机关相关的数据,包括商业的数据等等,其实我们要把整个数据的秩序建立起来才能构建起人力资源的宏观数据应用,这是我们一直以来的一种做法。
我们认为这个是要建立这种数据的新秩序,我后面讲的偏具体的一些应用的内容,这个内容是之前我们做的一些应用的图谱,应用的一些图谱,因为是我们实际做的,所以我就拿出来,因为我们也是在讨论这个应用。这里面我们具体的包括我们在做决策服务平台的时候,实际上要涉及到经济数据的整合,包括数据分析的服务平台,包括可扩展的数据中心,把这些数据能给合起来的数据中心,这些数据中心数据又是怎么来的,包括交换体系,包括目录体系,目录体系是方便我们说的把制秩序的查找方式,还有我们未来应用的拓展等等,只有很多这样一些体系构建在一起才能实现政府类的宏观决策的数据决策。这是我们一个建设内容的思路。
现在有一个智库,叫做智库模式,这种智库模式一层一层的,包括数据的采集到我们形成不同分析层面的智囊,到资源池,再到驾驶舱来做这种分析,这是有一个层面的内容,现在阿里巴巴在做这种“郡县图志”就是给领导做了一个完整的驾驶舱,数据来自于商业数据,包括一部分可以开放给他的政府数据,在2010年的时候其实我们已经做了这样的工作。
后面我简单的做一个展示,说起来可能时间会比较长,因为每个业务系统,像这种是属于文字结构的数据采集服务,可以看到我们是从各个机构来交换这种数据,交换频次的监控,这是我们对所有这种数据,我们通过一个大的目录导航看这个数据到底分布在什么地方。其实在美国DATA.GOV,上去的第一条,最重要的一点就是做数据的导航,我们做的其实并不落后,咱们也是做很久,之前开始做目录体系,其实从2006年,咱们已经开始做这个事。这是一个数据的展示平台,到数据的分析平台。
我们做数据挖掘,也是把很多的经济指标进行合并,我们来预测经济指标是前置的经济指标,还是后置的经济指标,这是我们当时提供了一堆分析模型,最后我们给领导提供这样一个图谱,这样的一个预测模型。这是我们提供很多的模型参考,最后提供一些仪表盘,我们当时做了很多,包括经济运行,我们从宏观层面、中观层面来做支撑,包括税源就可以做到宏观,也可以中观,甚至可以做到微观。做了大量的数据分析和数据主题的关联关系的一些分析。我们从面子上认为我们已经做到了大数据,包括我们给一般的业务人员、专家、研究人员或者领导提供决策的工具,可以追踪这种指标,可以看到这种指标实时的情况,来分析这个指标,甚至督察一些指标,业务人员来维护这些指标,这是我们的一些内容。
大家可能看到这个的时候觉得还不错,说可能现在阿里巴巴也在做这个事,我们那么早就在做这个事,大家认为做的是不是还挺好的,大数据时代我们认为其实到这个层面不难,但是在这个数据采集的过程,数据是什么样的其实才是最难的,说这些数据怎么能把他给打通,技术手段其实并不难。
接下来讲讲政府人力资源大数据,为什么要这么去阐述我的观点,刚才是最上层的,决策层的,甚至我们怎么去利用,但是最下面是这些数据怎么来,这些数据怎么才能被利用,这就是我们开始做一个一个独立的系统,这些独立的系统就是为我们决策后面的这些数据决策,数据运用提供最基础保障的东西。我们可以看到,刚才咱们一直在讨论人力资源的宏观管理,我们可以看到政府人力资源大数据里面关于人力资源其实就是两个点,一个是企业,第二个是人才。通常我们简单认为人力资源就是招聘,企业招人识人,但是人力资源是一个非常庞大的系统工程,而且政府也一直在做这方面的努力,社会的稳定需要稳定的就业,社会的发展需要的是优秀的企业,而优秀的企业需要更好的人才,如果能让这些数据,让他们能协同发展,能互相补充,这就是我们政府在解决人力资源宏观问题的一个最重要的课题。做这个课题,我们要对所有的方面,包括企业人才等等有所了解,才能有的放矢。在这个框架体系的最顶端其实就是我们的政府。
今天因为我们也请了海淀区信息中心主任,我们在海淀区人社的时候,我们都把这个信息化,我们认为他都不是一蹴而就的,也不是一把工程,是需要长期时间的工程,所以我们从2014年、2015年、2016年,甚至规划到2017年,我们在做政府决策,大家可以看到最下方,最右侧的这个图,才是数据的聚合服务,才是数据服务环境,才是大数据服务环境的搭建,我们是按照四年的规划体系才能搭建这个平台。前面说我们2010年已经做了这么一个东西,为什么还要分四年做这个东西,我们刚才说一定把数据做实了,才能去做数据决策和数据分析和这种服务。
以人社局为例,我们包括互联网的应用,包括开放的公共服务的应用,包括现在政务服务的一些应用,包括办公服务的应用,包括我们对接的数据平台的数据服务,把他给集成在一起,整个中间这块都是整个数据服务体系。这些内容是我们把整个人社2014年的规划来做的这样一个大的结构。
具体到每个应用我简单的阐述一下,我们在做的人才网,我们要做人才管理,我们怎么办?我们要搭建一个像51JOB这样一个服务网站,但是我们也要说我们怎样优于他们,要有我们的一些好的东西,但是我们也要提供和他们一样的服务,包括招聘求职、人才引进,从我们的角度来说,我们有我们的抓手,包括有我们的服务,通过我们的服务把这些人才能抓上来,其实我们提供了很多的现在已经很流行的应用,包括APP、微信等等,包括我们把企业招聘会通过这种服务方式拉道路网上,在招聘、求职的时候我们把身边的企业推送给每一个服务人员,其实大数据的理念已经贯穿了我们在搭建整个应用的内容,这些虽然是细枝末节,但也确实是我们关注的重点。包括我们做视频面试的时候,企业和人才之间的对接,非传统意义的人和人之间的沟通,也可以通过互联网的企业和人才的视频面试的方式。
最后我们把这些数据收集上来,其实我们不是为了商业化和利益体系上的,我们更多的是说我们要把这些人才留在海淀,要把人才聚集起来,我们要知道让人才怎么来为我们的政策决策或者是工作做服务,所以我们把人才的数据做了一个管理平台。可以看到这是我们管理的一个部分。其他的我们还做过一些,比如像企业劳动关系,这时候我们开始关注企业和人之间的关系,企业有一些投诉建议,这样留存下来的又是另外的一部分信息数据,包括一些执法内容,我们可以查这个企业在哪,我们会发片去知道这些企业,我们能不能找到这些企业,我们具体去执法的那些内容。包括职业介绍部分,职介里面涉及的面更广,包括失业的内容其实也是人力资源,不光是就业,其实还有失业人员的一些管理,职介,我们很多时候关注一些高技术企业的,还有一些普通的人员怎么办,他也是要放进去的。包括人社,包括就业指导,包括供求关系,这些信息都上来之后,我们认为他才会对数据决策有所作用。其实职业智能鉴定也是,这也是我们做的信息化的一些案例。我们把所有的数据放在了一起,我们把它叫人力资源数据的中心。
最后一图是我们做的,在人才网的基础上搭建的数据服务,这个图里面有很多的数据,不光是来自于人才服务网的,还有我们调查的教育方面的数据内容,因为只有这样把所有的数据搭在一起,我们才能把他混合为人力资源大数据服务。我替政府说句话,我们政府现在大数据服务做的还不错,包括人才数据,其实我们一直也耕耘了很长时间,给包括区里面也做了很多的应用等等,为我们大数据与人力资源有一个基础的参考。
今天我讲的这些内容就这么多,大家如果觉得有什么问题可以来批评和指正。