中国大数据产业发展研究从产业规模、产业形态、区域分布、产业竞争格局、产业政策和交易市场等6个方面来全面分析我国大数据产业发展的现状,并进一步从数据产权、政府数据、数据价值、数据安全和保护、大数据企业、大数据人才和大数据技术7个方面深入分析我国大数据产业发展面临的主要问题。
以问题为导向,针对性的提出了加快我国大数据产业健康有序发展的对策建议。
标签:大数据;大数据产业;数据产权;政府数据开放共享在信息化社会,大数据已成为与自然资源、人力资源一样重要的战略资源,正在改变各国综合国力,重塑未来国际战略格局。
近年来,发达国家把大数据产业作为强国之基、兴国之本,纷纷加快布局大数据产业。
由美国率先推动引领,欧盟、日本等发达国家紧随其后,纷纷出台国家层面的大数据发展战略规划和促进大数据产业发展的相关政策,先后拉开了大数据战略的大幕,有力地推动了大数据产业化、市场化的进程。
从全球看,美国始终保持着大数据产业的领先地位,不仅大数据产业发展步入大规模商用阶段,而且大数据已广泛渗透到经济、政治、教育、安全和社会管理等众多领域。
相形之下,我国大数据产业还处于起步发展阶段,但自2014年3月《政府工作报告》中首次出现“大数据”字眼以来,国务院于2015年8月31日颁发了《促进大数据发展行动纲要》,《中共中央关于制定国民经济和社会发展第十三个五年规划的建议》中又明确提出:“实施国家大数据战略,推进数据资源共享”,2017年1月17日,工信部还发布了《大数据产业发展规划(2016—2020年)》。
随着党中央、国务院密集推出一系列促进大数据发展的顶层设计与战略部署,我国大数据产业出现良好的发展势头,迎来了快速发展的黄金时期。
但是由于我国大数据产业发展起步较晚,加之大数据的关键核心技术发展比较滞后和与之配套的相关工作准备不足,大数据产业发展中面临许多亟待解决的问题,其主要表现在数据产权确权难;政府数据开放度低;数据收集和共享困难,商业价值不高;数据安全、隐私保护及管理体系不完善;大数据企业规模小,领军企业缺乏;大数据人才供求失衡,合格人才匮乏;大数据技术创新不足,关键技术研发应用比较落后等问题。
我们直面大数据产业发展中存在的这些问题,在系统分析我国大数据产业发展现状及其面临主要问题的基础上,针对性地提出了加快我国大数据产业健康有序发展的对策思路,为加快推进我国大数据产业发展建言献策。
一、我国大数据产业发展现状分析1.大数据产业发展态势良好我国大数据产业展现出良好的发展态势,从2014年以来,我国大数据产业规模不断扩大,2014年大数据产业规模为1038亿元,预计到2020年我郑婷婷,女,北京邮电大学经济管理学院博士生(北京100876)。
国大数据产业规模将达到13626亿元,增加10倍以上,增长幅度巨大,详见图1。
图1 2014—2020年中国大数据产业规模变化数据来源:贵阳大数据交易所《2016年中国大数据交易白皮书》第26页,其中2017—2020年数据为预测数据。
随着我国大数据快速发展,大数据所形成的价值也得到快速提升,我国大数据市场规模在全球大数据市场规模中的比重将越来越大,并最终与全球增速保持同步。
预计到2020年中国大数据产业规模占全球大数据产业规模的比重将达到20%以上,占美国大数据产业规模的50%以上,超过欧洲大数据产业规模。
2.大数据产业形态基本形成目前,我国大数据产业基本形成了以数据资源、产品技术和应用服务等三大部分为主的产业形态。
数据资源方面,我国在数据资源量和丰富程度上具有优势。
中国拥有全球第一的人口基数、互联网用户数和移动互联网用户数,网络化、智能化、平台化的采购、生产、营销等开始受到越来越多的中国企业关注,中国已成为名副其实的“世界数据中心”。
截至2017年6月,中国网民规模达到7.51亿,互联网普及率达到54.3%①,涌现出阿里巴巴、腾讯、百度、京东等一批拥有巨大数据储量和先进数据管理能力的互联网企业。
随着“互联网+”和“中国制造2025”的不断推进,产业互联网和物联网有望快速发展,机器对机器(M2M)的通信将会带来大幅的数据增量。
IDC的数据显示,我国数据将会呈现出爆发式增长,占全球的比重将会大幅提高,预计2020年中国数据总量将会达到8060EB,约占全球的18%②。
产品技术方面,全球大数据技术以开源为主,中国以跟随为主。
全球大数据技术格局目前可以分为三个阵营。
一是原创理论输出。
代表公司是谷歌,其相关成果为大数据存储、处理和分析奠定理论基础。
二是技术制高点。
以雅虎、脸书、阿帕奇等美国公司为代表,主要提供开源的大数据分析架构服务。
三是产业先锋队。
以IBM、微软、甲骨文、EMC等传统IT巨头为主,主要针对行业用户提供基于Hadoop和Spark的商用产品和解决方案。
国内产品技术集中于应用层,相关企业大部分处于第三阵营,且处于跟随者地位,与国外同阵营企业实力差距较大,仅有少数企业(如阿里巴巴、华为等)可以进入第二阵营。
数据应用方面,我国政府和企业都高度重视大数据应用,并在政务服务、互联网、智能制造等方面取得成效。
政务方面,多个地方已经根據实际情况展开大数据云平台建设,贵州借助“云上贵州”系统平台上线“7+N”朵云、河南省上线“中原云”、云南省政府上线“云上云”等;互联网方面,百度的“中国大脑”战略、阿里的“从IT到DT”、腾讯的“大数据连接的未来”等都围绕数据驱动进行布局。
在智能制造领域,以三一重工为例,其已形成了5000多个维度、每天2亿条、超过40TB的大数据资源,并通过大数据分析,达到实时监测设备作业情况、关键零件磨损、油耗以及承压情况等,确保在问题出现之前就能发出预警,从而实现对成本的精准控制,并大幅提高用户服务质量。
3.大数据产业呈现区域聚集分布状态我国大数据产业聚集发展效应开始显现,从东部沿海地区到中西部内陆地区,大数据产业发展区域分布呈现出聚集发展的良好局面,合作协同发展将成为大数据产业的常态。
目前已形成了以贵安新区为核心的综合试验区,以北京为核心的京津冀大数据聚集区,以深圳、广州为核心的珠三角大数据聚集区,以上海、江苏、浙江为核心的长三角地区大数据聚集区。
此外,重庆、武汉、西安、成都、郑州等地也在积极发展大数据产业,并取得一定成绩。
中关村大数据产业园(北京)、仙桃数据谷(重庆)、大数据科技产业园(成都)、白沙大数据产业园(河南)、江苏省大数据特色产业园(江苏)等一大批大数据产业园区纷纷落地。
4.初步形成互联网巨头引领的产业竞争格局我国国内互联网企业巨头百度、阿里巴巴、腾讯及京东等凭借自身在网络信息方面的优势,率先获取了大量的用户数据,在我国大数据发展中抢占先机,用以支撑自身的电子商务、定向广告和影视娱乐等业务,走在国内大数据应用的前列。
同时,在互联网产业O2O的趋势下,互联网企业逐渐将业务延伸到金融、保险、旅游、健康、教育、交通服务等多个行业领域,这极大地丰富了互联网企业的数据来源,促进了其数据分析技术的发展,进一步奠定了我国大型互联网企业在大数据领域的地位,同时也扩展了大数据分析在诸多行业的应用。
5.大数据产业政策不断完善为了促进大数据产业的发展,我国从中央到地方陆续出台一系列大数据产业政策措施助推大数据产业发展。
截至2016年中旬,中共中央和国务院出台了14个关于大数据产业的政策,各部委也出台了13个与大数据产业密切相关的政策,上海、贵州、重庆、天津等23个省(市区)出台了76个与大数据相关的政策和规划,呈现出中央高度重视、地方积极推动的良好局面。
实践证明,从中央到地方政府出台的一系列政策举措,对促进我国大数据产业发展发挥着重要的推进作用:中央层面颁布的战略能够对大数据产业的发展起到统筹规划的作用;而地方层面的政策则能够帮助地方利用政府部门强大的资源整合能力,为大数据产业的发展提供各种财政、资金、资源等的保障,推动我国大数据产业更加健康有序的发展。
6.数据交易市场发展迅速数据交易是指对数据的一系列权益(如所有权、使用权、收益权等)进行价值评估和交换的过程。
目前,我国数据交易市场发展迅速,截至2016年7月,我国已经成立的大数据交易所、交易中心和平台达到15家。
其中,中关村数海大数据交易平台成立于2014年2月,是我国首个大数据交易平台。
这些数据交易平台的诞生和运作为企业、政府、科研乃至个人提供了数据交易和应用的场所,对于其盘活手中沉积的海量“数据资产”,打破“数据孤岛”起到了极大的助力作用。
二、我国大数据产业发展面临的主要问题我国大数据产业还处于起步阶段,尽管取得了一定的成果,但作为新的产业业态,其在发展中依旧面临着许多问题,主要表现如下:1.数据产权确权难数据产权确权问题是我国大数据发展所面临的难题。
产权制度是市场经济的基本制度。
由于数据具有可复制、易更改等特性,且权属鉴定复杂,数据产权界定是当前大数据产业发展亟须解决的疑难问题。
实践证明,由于目前数据产权确权问题依旧悬而未决,导致基于原始的用户数据,在去除个人身份属性之后的数据归属问题不明确,数据拥有方不愿或不敢把数据拿出来交易,直接制约了数据交易的发展步伐,进而严重制约了大数据产业的发展。
即便是目前有不少的数据交易平台、交易所和交易中心,但是脱离了明确的数据产权界定这一基础,数据交易只能是摸着石头过河式的一种尝试,势必会引发数据交易市场中一系列纠纷,增加大数据产业发展风险。
2.政府数据开放度低目前,虽然北京、上海、贵州等一些地方政府已经尝试建立了省市一级的数据开放门户,但我国尚未建立全国统一的数据开放门户,政府数据开放程度比较低,主要表现在以下方面:第一,政府部门对数据开放的认识还不到位,已开放共享的数据时效性低、机器可读性差。
一些地方政府片面地认为数据开放就是把数据公开出来。
实际上,数据开放是一项系统性工程,涉及数据的机器可读、数据格式、数据许可、数据接口等问题。
第二,政府数据开放动力不足。
究其原因,主要根源于两个方面,一是一些政府数据的质量并不高,部门间的数据不一致情况突出,数据一旦开放出来,可能造成负面影响而由此不敢为。
二是一些政府重在眼前“政绩”考虑,虽然政府数据开发共享蕴藏着巨大的经济和社会价值,但在短期内很难凸显“政绩”,由此就不积极作为。
3.数据收集和共享困难大数据产业发展的动力首先来自于数据流动,尤其是跨行业、跨部门,甚至跨地域的数据流动与共享。
但是我国存在比较严重的“数据割据”“数据孤岛”和“碎片化”现象,有价值的公共资源和商业数据基本处于死锁状态,无法顺畅流动。
具体表现在以下方面:第一,我国数据标准化程度低,数据收集困难。
由于我国数据标准体系建设的基础工作薄弱,早期信息化建设缺乏顶层设计,自主构建大型信息系统的能力不足,且大量的企业没有意识到信息化建设的重要性,导致目前依靠这些信息系统收集到的数据普遍存在兼容性不足、数据质量参差不齐、数据标准化程度较低等问题,直接制约了数据的流动。