TMFOX VENTURE PARTNERS大数据行业研究报告大数据行业的创新方向和投资重点项目融资辅导营2014/1/24报告用途本研究报告为商弈投资的被投资客户、项目融资辅导营被孵化的客户提供行业分析并帮助他们进行产品创新。
同时为商弈投资(TMFOX VENTURE PARTNERS)合作的投资机构、科研机构和政府机构提供行业研究和投资参考。
研究方法本研究报告收集大量可靠的具权威性的资料及数据,仔细分析对比得出相关结论,并通过对项目融资辅导营企业进行调研,进一步获取更全面的信息,且与本行业专家进行了深入探讨研究。
版权声明本研究报告是基于我们认为可靠且已公开的信息,我们力求但不保证这些信息的准确性和完整性,也不保证文中观点或陈述不会发生任何变更。
本报告版权仅为商弈投资(TMFOX VENTURE PARTNERS)所有,未经授权,任何机构和个人不得以任何形式翻版、复制、发表或引用。
欢迎使用二维码扫描并关注项目融资辅导营,我们将竭诚为您服务,给你带来更多相关信息目录一、洞察 (1)二、大数据概览 (2)2.1 源与流 (2)2.2 大数据产业结构 (3)三、行业存在的问题与发展趋势 (4)3.1行业存在的主要问题 (4)3.2行业发展趋势 (5)四、典型企业介绍 (6)4.1上市公司 (6)4.2项目融资辅导营平台企业 (7)五、展望 (8)关于商弈投资 (i)关于项目融资辅导营 ................................................................................................................ i i一、洞察大数据以“降低信息不对称和提高决策有效性”为目标,可广泛作用于几乎所有行业,必然将掀起一场新的革命。
目前,大数据已经迎来高速发展的黄金成长期,我们看好其发展趋势,推荐投资者提高对其中蕴含机会的关注度。
从源到流看,大数据涵盖数据入口、数据融合处理、数据应用三个过程;按照物理分层,大数据又可以分为硬件、基础软件、应用软件和信息服务四个维度。
每一个细分领域都正在不断演进,存在不少问题也孕育着巨大的机会,万千创业者不断地寻找着新的突破口。
目前制约大数据更好更快发展的主要问题有以下几点:一是数据的归属权不清晰,各家数据资产型企业私密占有平台数据,制约着大数据的融合及发展;二是数据有效性将直接影响到大数据的应用水平,从数据源到分析样本的采集过程需要大量人工干预;三是配套软硬件成熟度不够,适宜处理海量数据的数据库软件尚未成熟,私有云的普及程度也不高;四是数据尚未获得真正意义上的定价和产业化。
基于对大数据的研究,我们判断,未来3-5年大数据发展趋势为新数据入口不断更新并增强、数据融合程度提高、数据处理难度降低和应用水平深化。
新的入口,推荐关注新型人机交互模式的可穿戴设备、准入门槛低且找到了硬需求的智能家居、基于食药品生产追溯的物联网等相关企业;新的模式,推荐关注针对新入口的底层统计公司、“以免费服务获授权数据”和“有偿返还数据给用户”三种可能的创新;数据融合方面,推荐关注征信创业和数据产业化;数据处理方面,推荐关注新型数据库软件的出现,私有云与行业云的普及化;商业智能部分,推荐关注对细分行业有深刻理解的大数据应用软件及SaaS云服务提供商。
综合标的数量、确定性、所需投入和价值等因素,重点推荐针对细分行业的大数据应用软件和SaaS云服务提供商,追踪关注新入口的出现,并发掘相应的底层统计公司(类似针对移动应用的友盟)。
二、大数据概览2.1 源与流大数据从源到流到汇聚应用,包含数据入口、数据融合处理、数据应用三个维度和过程。
从前到后看,这三个维度分别对应于数据资产类领域、数据融合与处理相关领域、数据应用相关领域。
图2:大数据链示意图1)数据资产领域“数据正在成为一种(战略)资产”已经是行业的共识。
不同的公司把握着各个数据入口,而把握数据资产的企业也必然成为大数据的首批和直接受益者。
从公司业务模式上,数据资产公司可以区分为纯数据资产公司和兼数据资产公司;从数据类型上,数据可以区分为交易数据(含询价等)和交互数据。
典型的纯数据资产公司有友盟和个信互动等,两者都具有占据基础性控制节点、后端整合了整类兼数据资产公司等特征,分别针对移动应用统计分析(已为超过18万应用开发者服务)和移动应用的信息推送(已接入超过6.8亿用户)。
而兼数据资产公司数量更多,按交易数据与交互数据分类:交易数据类包含万得(金融)、阿里巴巴(电商)、美团(O2O)、拉卡拉(第三方支付)、顺丰(物流)、中国移动和沃尔玛(其他)等;交互数据类包含新浪微博(SNS)、远望谷(物联网)、百度(搜索引擎)、盛大游戏和优酷视屏(其他)等。
2)数据融合与处理相关领域在数据融合与处理相关的领域,主要解决包含两个方面的问题:一是数据标准化与有效性整理;二是面向过程(具体目的)的数据处理与粗提取。
类似的较成熟机构包括彭博、万得、同花顺等,但目前局限于金融行业,可以预见在未来可能形成不同细分领域下的数据融合处理公司。
另外,在大数据的融合与处理相关领域,两个绕不开的点为基础软件(数据库软件)和云计算,我们将在后文中讨论。
3)数据应用相关领域如上文所述,掌握数据资产的企业群是大数据的首批和直接受益者,因为他们会自然、方便的对大数据进行把玩、加工、消化、利用。
而随着应用价值的逐步体现及大数据产业的发展,应用将必然扩张到生产生活的方方面面,广泛影响各行各业。
大数据的应用将使得金融保险、信息技术、公共管理、贸易物流等领域获得极大的价值提升。
2.2 大数据产业结构我们按照从硬件-基础软件-应用软件-信息服务和数据生成-存储-处理-应用两条线各4个维度来划分大数据的产业结构,涉及11大类主要的产品和服务:采集设备、存储设备、服务器、数据库软件、采集监测软件、智能搜索与分析软件、系统集成、IT基础设施服务、咨询实施服务、信息安全以及云计算。
图3:大数据产业结构示意图其中基础软件(数据库软件和分布式文件系统)、应用软件是大数据产业价值转化变现的最关键部分,云计算对大数据的广泛应用有着举足轻重的意义,其他7种在某种意义上则是在原有基础上持续更新并与大数据发展配套的过程。
在软硬件和信息服务领域的垂直划分中,我们认为商业智能带动的应用软件、云计算和信息安全是国内大数据发展的三家马车,也是更可能有所作为的地方。
三、行业存在的问题与发展趋势3.1行业存在的主要问题1)数据的归属权不清晰,各家数据资产型企业私密占有平台数据,制约着大数据的融合及发展。
一般认为,原始数据沉淀在平台上,平台实际占有并可以使用,但在未获授权的情况下不能提供给第三方,用户对原始数据的占有获取权及公开程度基本取决于用户与平台达成的协议(多为安装平台软件前的“用户须知”部分,用户除用脚投票外并无实际协议制定权)与接口提供,而平台对原始数据经过统计提炼获得的其他信息属于平台企业。
参考国外立法,数据是属于个人的,平台企业可以解除、使用数据不代表个人放弃对数据的所有权。
从国际国内立法趋势上看,信息主体的权利正在强化。
2)数据有效性将直接影响到大数据的应用水平。
●数据的质量良好的数据质量是挖掘价值的基本保障。
我们认为,数据质量主要涵盖两个大方面:一是基本质量,包含准确性、一致性、容量和更新率4个要点;二是可应用性,包含易识别性、易处理性、获取及时性、远程访问性和智能性5个要点。
●洗数据的难度洗数据就是把大量包含无效数据、分布杂乱无章的原始数据进行归并聚合,通过建立数据标准并执行来取得我们需要的分析样本的过程。
如果希望提高数据可应用的程度,那么必然需要花大量人力通过编写程序和手动挑选来淘洗数据。
而随着投入的边际效用递减,数据有效性的要求越高,则需要投入的成本就成倍甚至指数级增长。
3)适宜海量数据处理的软硬件成熟度不够,成本太高,普及率低下。
●市场上缺乏兼具业务场景普适性和海量数据处理能力的数据库软件●私有云和云服务普及程度太低4)数据尚未获得真正意义上的定价和产业化。
数据的公开性与归属权不清晰直接导致了数据融合工作被割裂到一个个的独立的数据资产型平台内部。
目前的大数据应用更多是针对公开数据和自有数据的价值挖掘,数据尚未获得真正意义上的定价和产品化。
3.2行业发展趋势需求所向、问题所在,就是行业演进的方向。
我们认为,未来大数据演进方向主要包含数据源更新与更多、数据融合处理难度降低、数据应用程度加深(专业化与细分化)。
1)数据源更新与增加●新入口新的入口主要包括可穿戴设备、智能家居与物联网三方面。
可穿戴设备的发展重点在能否开创新人机交互模式或者找到与智能手机的完美融合(非替代性增强),推荐关注模式识别与人机交互核心技术企业;家居的智能化融合能创造一个全新的交互中心,其发展重点在于一能否跨家电品牌整合、二较低的介入成本、三是硬需求式的切入点;物联网的突破点应该在安全生产、(食药品)质量控制、物流运输及车联网等。
●新的模式新的模式可能包括以下三种:新“友盟”模式,针对新入口具体需求的底层统计服务提供商;“免费服务交换数据”,即可能出现以免费服务交换个人数据(双方以契约互相授权)的公司,使数据获得真正意义上的定价而成为资产;“数据有偿返还用户”,即原有数据资产类平台企业可能将引入第三方公证机构(公信力)和保险公司(兜底责任),有偿地反向出售其掌握的信息给用户自己。
2)数据融合处理难度降低●征信业与数据产业化大征信和数据产业化将深度发展,首先是目前未纳入人行征信体系的其他金融行为数据整合成第二征信数据池,后期还会逐步扩展到零售、物流等行业,形成产业化的行业数据库。
●数据库软件目前,各种新型数据库软件各有千秋,不能普适不同的应用需求,相信普遍适用于海量数据处理的新型数据库将逐渐浮出水面。
●云计算私有云和行业云的普及势在必行,推荐关注降低成本的云硬件制造商;针对具体行业需求面向小微企业以数据分析处理为导向的SaaS云服务商将兴起。
3)数据应用深化商业智能将按照各行业信息化程度高低及信息与人贴近程度高低次序依次铺开,首先受益的是零售、物流、金融、电信、政府几个板块。
同时,在BI应用先行行业(特别是零售和物流),每个细分领域都将出现专门的领先型行业解决方案提供商,然后通过扩张兼并,每个大行业将再创造几家上市公司。
四、典型企业介绍4.1上市公司1)拓尔思(300229)公司主要从事以非结构化信息处理为核心的软件研发、销售和技术服务,核心软件产品包括企业搜索、内容管理和文本挖掘等相关平台和应用软件;从事相关行业的信息化工程咨询、开发、实施和维护服务;提供基于非结构化信息智能处理技术的在线软件运营和信息服务。