您的位置:网站首页 > 波士顿景点 > 正文

陈新河:万亿元大数据产业新生态》——央视网大数据名人讲堂之大数据产业系列

类别:波士顿景点 日期:2016-11-29 8:17:50 人气: 来源:

  TalkingDataUniversityHeadmaster

  在IT领域近20年研究、观察和思考,同样的数据,不同的观点。参加《促进大数据发展行动纲要》【国发〔2015〕50号】编制,主持国家发改委“十三五”规划前期研究重大课题:《“十三五”信息经济发展研究》,国家社科基金特别委托项目《大数据治国战略研究》课题组核心成员。

  筹建、并运营中关村大数据产业联盟,发起、组织,并主持近300场“大数据100分”活动。运营微信公众号:软件定义世界(SDX),累计订阅用户近10万,累计阅读量近1000万,已成大数据思想的策源地。已编辑/出版《大数据领导干部读本》、《中国大数据技术与产业发展报告(2014)》、《中国软件和信息服务业发展报告2013》等。

  目前致力于大数据生态体系建设,专注于大数据专业教育培训。

  各位好,非常高兴有机会在央视网大数据名人讲堂与大家探讨大数据话题,今天给大家分享的主题是《万亿元大数据产业新生态》,内容涵盖什么是大数据、大数据在各行各业的应用、中国大数据产业生态、大数据产业发展展望等四个方面。2025年中国大数据产业将达1万亿元。

  人类利用数据征服自然、改造社会、服务生活古今有之

  1850年代,英国医生约翰·斯诺利用空间统计学(如果一个家庭有两个霍乱患者,在这个家庭所在地图上画两横;三个画三横),发现水是霍乱的传染源,打破了人们怀疑空气传染霍乱的看法,这一发现对城市环境管理也有积极的推动作用。

  自古以来,中国东南地狭人稠、西北地广人稀似乎早成事实,但没有人对这种模糊的认识加以有力的佐证。1930年代,中国地理学家胡焕庸以1个点表示1万人,根据掌握的实际情况将2万多个点画到地图上,再以等值线画出人口密度图,以瑷珲—腾冲线分全国为东南和西北两半壁,被称为“胡焕庸线”,对中国经济布局、民政建设、交通发展具有重要参考价值,大家可以看下中国高铁的分布,基本在“胡焕庸线”以东。80年后,我们用QQ同时在线的人的地理分布这个大数据工具,同样完美印证了“胡焕庸线”的存在,其实,利用大数据工具,还会有更多的“智能手机胡焕庸线”、“微信胡焕庸线”、“App胡焕庸线”,这些基本与基于人口统计的“胡焕庸线”等效。

  数据洞察世界古今有之(点击图片看高清大图)

  大数据就在我们身边。我们天天出门用的优步、滴滴等专车时刻根据周边在候车辆和待乘人员的数量进行动态定价,2016年6月7日早上,我家周围平时总有10多台在候车辆和不加价的情况被下雨天气打破,因需求量多、供应不足,需要平时价格的1.5倍才能叫来专车。我们在淘宝、京东、当当等电子商务网站买书的时候,时时刻刻有个大数据推荐引擎在提供周到的服务,如同我们在王府井百货遇到的美女导购,美女导购凭借顾客的穿着和她的经验来引导顾客、推荐商品,经常有看走眼的时候,而电子商务大数据推荐引擎几乎是百发百中,对于淘宝、京东、当当而言,大数据推荐引擎是他们的核心竞争力,能够增加12%左右的商品购买。

  目录

  IT持续创新催生大数据时代。存储成本的不断下降,30年下降近20万倍;计算成本的急速降低,半个世纪下降20亿倍,按此下降速度,一架几十年前的波音客机到现在也就是一瓶可乐的价格;带宽成本13年以来也下降240倍,2000年的家庭带宽也就是几十Kbps,目前基本是10Mbps,100Mbps甚至1000Mbps正在进入家庭。

  持续创新催生大数据时代

  很多人提到大数据时特别重视大,似乎数据量没有PB级容量或100万条就不是大数据。数据大只是表象,数据内容、结构、工具的变化才更具意义。数据从结构化数据扩展到网页、文档、视频等非结构化数据,数据工具从数据库演变到数据仓库,继而是分布式数据管理系统,数据管理内容从企业生产资源管理、财务管理扩展到客户行为、产品状态、社交数据等等,无不体现数据的变革。

  数据大只是表象

  大数据的概念是相对小数据而言的。我们到招商银行办理信用卡的时候,招商银行会让您提供一段时间的工资单,这个工资单就是小数据,银行凭借工资单来对用户的信用进行评价。现在有了所谓大数据的方式来评价客户信用,比如您敲击键盘的速度、录入单词的正确率,如果速度过慢、频繁出错,您的信用价值会降低,银行的大数据信用评价系统认为IT不熟练的人士社会竞争力弱,信用价值理所当然低些;如果发现您经常玩游戏连续超过2个小时,您的信用价值也会低,您会被银行的大数据信用评价系统评价为玩物丧志者……大数据信用评价会有数万个维度来评价一个人的信用,您的一言一行,只要在网上都会被记录下来,作为您信用评价的一个维度;相对工资条的评价方式,不可谓不大。我们重视大数据评价一个人的信用价值时,千万不可忽视小数据;任何一条数据都是您行为画像的侧写,只有把大数据和小数据完美的结合,才能形成一副层次丰富、色彩饱满的全息版数字油画,否则因为缺乏工资这一条关键数据,本来画蒙娜丽莎,结果却画成了憨豆先生。

  小数据与大数据的对比

  大数据是数据在这个时代的标签。所谓的4V【数量大(Volume)、种类多(Variety)、速度快(Velocity)、真实性高(Veracity)】或6V,并不是大数据的必要条件,4V可能在某些领域如精准营销,才有用武之地,很多商业案例既不要那么大,也不要那么快。大数据是一个相对的概念,七十年代、八十年代、九十年代都有大数据的概念,七十年代的大数据也就是几兆而已,再过10年、20年,我们现在所谓的PB级也就自然而然的变成小数据了。

  大数据是数据在这个时代的标签

  我们现在讨论的大数据与之前谈论的大数据有何不同呢?有很大不同,简单概括是“还原真相”;还原每个人的所思所想所为,还原机械设备的运行状态。当您在工商银行柜台取完钱后,除非柜员与您发生激烈冲突,即使柜员的服务不是那么令您满意,碍于情面,一般您还是给她很满意的评价,这就是典型的小数据调研过程中很难避免的口是心非问题,也典型反映了数据在结构化过程中,信息的失真。用大数据的方式就能够避免这种口是心非结果的出现,类似新西兰航空等很多航空公司,通过收集Twitter、Facebook、微博等社交平台的旅客评论,来客观评价服务质量。我们出差乘坐的飞机、高铁是高度数字化的产品,一架波音787一个航程会产生几个TB的数据,从飞机位置、姿态,到温度、压力等上千个维度的数据分分秒秒都在产生;空客A380产生的更多,30分钟高达10TB,这些大数据时时刻刻反映飞机的运行工况。

  真相来自真实语言的表达、物理世界的反馈

  数据是物理世界在网络世界的客观映射,数据是物理世界的DNA。当然二元世界不是割裂的,是相互渗透、相互融合的。2000年热议的鼠标+水泥和当前大家谈论O2O,都是指融合的二元世界。当下流行的手机游戏《口袋妖怪Go(PokemonGo)》把物理世界与网络世界有机的融合起来,创建一个亦真亦幻的增强现实游戏空间。大家可翻看下手机,看一下手机通讯录和微信群之间的差异,通讯录更多反映物理世界的亲戚、同学和朋友,微信群更多反映网络世界的朋友。以前我们的生活多是从线下到线上,从物理世界向网络世界映射、迁徙,如电子地图、餐饮评价等;随着网络应用的深化,从网络空间向物理空间的逆映射也在不断出现。以前人们买房,基于经济条件、工作地方、学校等因素,所以即使门对门,也没有多少交往—因为之间没有交集。现在很多创业者首先在微信群相识,但网络空间交流不够充分,于是转移到类似WeWork、YOU+国际青年社区等创业社区,创业活力得到极大激发,可能在等电梯的2分钟就会完成一个创业话题的讨论,以后这种从线上映射到线下的项目和内容会越来越多,可能会出现钓鱼社区、骑行社区等等,人类的创新活力将得到极大的释放。

  过去10多年,大数据的应用主要集中在数据营销领域。我们搜索、点击、浏览、阅读、购买、收藏等一切网络行为都被记录下来,搜索引擎、门户网站、电子游戏企业、电子商务企业根据这些数据,然后打上标签,给每个用户进行数字画像,在合适时间、合适场合把广告商的广告推送到网络用户面前(当您在百度搜索关键词“手机”关键词后,很快您会发现无论您浏览哪个网站,“手机”广告总是如影随形出现在您正在浏览的页面上),网络用户点击,广告厂商付钱,形成数据商业价值闭环,目前全球已形成近千亿美元的产业。在美国网络上点击一次“CheapCarInsurance”广告,保险公司会向谷歌支付33.97美元;Google最贵的关键词一次点击的价格高达670.44美元,点击一次等于送谷歌CEO桑达尔·皮查伊(SundarPichai)一台iPhone6!在国内点击一条医疗广告也高达上百元。

  精准营销商业价值实现

  当有网络用户在新浪汽车频道浏览汽车,新浪网会根据用户行为模型判断他是学车、买车,还是换车,如果一个用户总是浏览8~12万的德系车,浏览指数从一般无任何指示状态的8~12,跃升到60~80,那么未来半年向他推销捷达很可能奏效。

  互联网大数据:满足您的所想、所思、所求

  3.2金融、地产、制造、政府等行业为大数据提供了更为宽广的腹地

  2015年,全国媒体收入为3840亿元(其中互联网广告市场,为2096.7亿元,广电报刊四大传统媒体行业的广告之和为1743.5亿元,数据来源于《新媒体蓝皮书:中国新媒体发展报告No.7(2016)》),相对于4.13万亿元的房地产业(GDP值,下同;收入为8.9万亿元)、5.75万亿元的金融业(GDP值)、6.6万亿元的批发和零售业、22.90万亿元的工业而言相差一个数量级,如果这些行业的核心业务从拍脑袋式经验决策转变为数据驱动的决策,给大数据带来的市场空间显而易见。以房地产为例,项目调研、土地评估和决策、产品推广和销售、物业服务和社区运营等全流程四大核心环节均可以由大数据来驱动(详见后图),每个环节都会有数百亿元的潜在市场规模。

  互联网金融的兴起逐步打开普惠金融的大门。中小微企业从未被满足过资金需求,该市场是传统金融企业不能、也不愿涉足的领域。中国人民银行征信中心有信贷记录的自然人为3.5亿人,也就是说我国有近10亿人得不到传统金融机构的眷恋。只要获得这近10亿人的上网、APP安装、使用、社交行为、用水、用电、用车等数据,利用大数据的模型和算法,转化为金融征信评分,传统金融机构不愿做的事立马变为金矿,而这些数据在大数据时代获取并不困难,我们每个人一天近6个小时在网络空间游荡积累大量的数据,只是这些数据被不同主体的企业拥有而已。

  传统银行机构平均贷款规模为179万元,每笔贷款尽调成本等为5.2万元,贷款发放周期为2周~1个月;基于店铺基本信息、店铺日常经营活动、客户评价信息和行业基准信息等大数据,蚂蚁微贷的平均贷款规模仅为3.6万元,每笔贷款尽调成本等为1600元,贷款发放周期仅需要3分钟;最重要的贷款违约率大幅下降,从传统金融机构的2~3%的不良贷款率下降到不足1%。金融行业的壁垒也正在被大数据所打破,有数据的企业纷纷进入金融行业,电子商务企业阿里、京东,卖电器的国美、苏宁,卖房的万达、卖二手房的链家等企业蜂拥进入金融领域,未来还将有更多企业进入金融领域。硅谷也涌现一批互联网金融企业,凭借数据挑战富国银行等传统的金融巨头。

  金融大数据:重构金融生态

  大数据推动保险从千人一面转向千人千面。通过汽车上的数据记录装置可以时时刻刻记录驾驶人员的操作状态,基于急刹车、急踩油门、急转弯等三急数据,再加上驾驶者平均用车时段、驾驶者行车速度比值、是否定期保养等多维度的数据保险公司可以彻底改变过去基于事故概率的统一定价机制,基于数据,保险定价可以做到千人千面。

  保险大数据:千人一面转向千人千面

  亿海蓝通过监测10多万艘100吨以上的国际航行船舶,累计8年的历史轨迹、上亿个位置数据,为国际货轮提供全方位的加油、补充供给等服务,并基于数据开发金融服务,同时亦能洞察全球经济脉搏为基金、证券服务。

  图16航运大数据:洞察全球经济脉搏

  医疗卫生因为数据而变。类似智能手表、智能手镯等可穿戴设备正在逐步进入大众市场,通过心率、脉搏等传感器,您的生理状态数据无时无刻不在产生、记录,有了连续的多维度生理状态数据记录,通过您的手机App,即使没有医生,根据曲线变化情况,您自己就会有一个初步身体状态的判断,如果这些数据被保险公司、医疗保健企业、药店获得,他们将会为您提供更为周到的服务,当然是要在隐私不被侵犯的前提下。

  医卫大数据:数据诊断一切

  房地产行业正在被大数据重塑。以商铺选址为例,过去调研公司在一个红绿灯路口派8个人,点过往人头,根据最低人流量来决定是否在该街角开家麦当劳。这种传统的调研方式正在成为过去时,利用TalkingData覆盖超过10万款移动应用、累计36亿台独立智能设备、每天处理数十亿次会话请求数据,不但知道过去一个季度某个商业网点经过多少人、还知道多少外地人、更知道这些人过去一段时间去过多少次快餐店,比传统的调研方式更快、更准确的做出商业决策。

  大数据重塑房地产

  利用WIFI探针、指纹技术更深入、更精确地洞察用户线下行为。相对于移动运营商宏基站的公里级定位精度、微蜂窝的百米级定位精度,GPS室内定位无能为力等其他定位方式,WIFI为室内定位提供了新的制导武器。利用WIFI可探测到客户到过案场的次数、精确到米级的位置,并且定位精度可调节,如果一个用户一个月到过楼盘销售点3次、在三居沙盘件停留20分钟以上,同时又到过财务间10分钟以上(可能询问支付购房款细节),基本可以判断该客户买房的概率很大。有了到店来访数据用户群体的精准画像,根据这些人群标签特点,基于Talkingdata公司36亿独立智能设备,使用Lookalike技术,与全国范围内的智能手机用户标签进行比对,发现更多潜在客户。

  更深入洞察用户线下行为

  2006年,花样年集团提出了“零物业管理费”,当时掀起轩然大波。花样年物业管理公司通过为业主提供“购买充值卡”、“送桶装水”、“订送牛奶”等100多项“增值服务”,沉淀下大量用户交易、行为数据,利用这些数据来对社区居民及家庭进行画像,对接需求,从而获取佣金来补贴物业管理费。基于社区大数据,可以构建社区金融信用评价体系,为社区家庭提供小贷服务、理财服务。到2020年花样年服务的社区将超过10亿平方米,超过4000万人口,假设每人每月社区消费是2000元,一年就是2.4万元,4000万人的一年将消费上万亿元。如果按1%的佣金计算,收益就是100亿;拿到2%,就是200亿;按天猫模式收3%~5%的佣金计算,就是300亿至500亿元。“零物业管理费”模式的核心逻辑是通过数据实现羊毛出在猪身上的付费转移。

  物业大数据:零物业费成为可能

  艾漫数据通过持续抓取覆盖全网3200家新闻站点,包括700家纸媒、300家电视台等新闻数据,微博、论坛、社区等社交类网站热议数据,售票软件卖出电影票的数量、视频网站中同类型影片的点击率、电视节目的收视率等用户行为数据,院线的票房、上升率和排片率等行业数据,然后通过行业经验和大数据技术,从影片体裁、编剧、导演、演员、发行时间、发行区域等维度进行分析判断,从而进行演员筛选、广告投放和票房预测。《小时代》从男主角的替换,到重点城市的广告投放,到海报内容的设计,再到排片时间的选择,都是基于《小时代》系列的82%的关注者都是90后,女性观众更是接近80%等数据来做的科学决策。例如小时代3海报中有位肌肉发达裸着膀子的男士,是为了吸引女性观众的关注。

  一家大数据创业企业利用社交媒体数据发现喜欢赵本山电影的人75%集中东北三省,毫无疑问,赵本山电影发行、广告投放时,75%以上的资源也应集中的这些省市,常规的北上广重点投放被这个事实数据打破。

  大数据重塑影视业

  在F1赛车、篮球赛、足球赛、射击等体育比赛中均可见到大数据的身影。NBA为每座球馆都装上了摄像机来跟踪、记录每个球员的每个动作。追踪系统可以记录得分、篮板、助攻、盖帽,甚至球员跑动范围、触球点、投篮点等详细的数据,这些数据对于双方教练和球员来说,是非常重要的情报信息和弥补短板的事实依据。

  我们来看一个倒数第二的篮球队如何利用大数据逆袭的案例。6年前,由硅谷风险投资家领衔的一批高管花费了创纪录的4.5亿美元,买下了美国职业篮球联赛(NBA)中表现倒数第二的一支加州球队(勇士队)。在大数据的驱动下下,新管理层得出的重要观点是,目前的篮球打法是错误的。数十年来,球员跳得比篮筐还高然后把球塞进篮网的所谓“扣篮”,一直是这项运动的标志性投篮动作,但它只值两分。

  勇士队的高管重新设计了球队,要求他们更多地从距离篮筐约24英尺(约7.3米)的三分线外远投,因为从那里投进一球能得3分。2015年6月,勇士队夺得了该队40年来的首个NBA总冠军,但真正引起全美球迷关注的是它本赛季的战绩。勇士队已经打破一项纪录,本赛季投中超过1000个三分球,成为NBA历史上单赛季命中三分球最多的球队。速得尔科技(北京)有限公司利用不可见光装置分析射击运动员的轨迹特征来筛选、培养优秀射击选手。

  大数据助体育一臂之力

  大北农集团农信互联有限公司利用摄像头、传感器、手机App等设备和软件知晓全国1500多万头生猪的生长发育信息,根据仔猪数量、重量和生长发育时间就能够推断明年豆粕、玉米等饲料需求、猪肉可能的价格区间,期货交易所根据这些数据来指导大宗农产品期货价格。一家期货交易所愿意用10元的价格,购买一头猪的基本信息,用作饲料期货交易的参考。

  猪联网的独特价值

  通过对气候、土壤和空气质量、作物成熟度,甚至是设备和劳动力的成本及可用性方面的实时数据收集,预测分析可以用来做出更明智的决策。在精准农业中,控制中心实时收集并处理数据,来帮助农民在播种、施肥和收割作物等方面做出最明智的决策。遍布田间的传感器用于测量土壤和周围空气的温度与湿度。此外,卫星图像和无人机会被用来拍摄田地的照片;随着时间的推移,图像会显示作物成熟,加上对未来48小时的精准天气预测模型,就可以建立模型并进行模拟,从而预测未来的情况,并帮助农民做出前瞻性的决策。约翰迪尔是家美国拖拉机制造企业,他通过在拖拉机、农耕机具上加装各种传感器,能够分析土壤样本、田间作物颜色、生长速率、营养水平、农作物品种等信息,帮助农场主生产经营农产品,同时提供农产品销售服务、供应链金融服务。

  大数据使农业焕发生机

  百度拥有数十万台服务器和数万台交换机,200多万块硬盘。硬盘的年报错率为4%~7%,月均硬盘故障超过1万起,占全部硬件故障的80%以上。通过对9亿条实例进行采集处理,选取15万个训练样本,监控240个特征实时变化,构建预测模型,可以提前一天预测出硬盘故障,并及时迁移数据。可节约70%带宽,85%计算资源,节省服务器运营消耗10%,每年节省1万多块硬盘。

  石家庄天远科技通过监测分布全国20多万台工程机械的运行数据,能够及时、准确提供备件,如果工程机械出现异常问题,远程监控系统能实时向机手发送短信告知潜在的危险,避免严重事故发生。同时还能优化油耗管理、二手车残值管理、产品设计优化等。对于货车超载监控,他们也研发出新的解决方案,根据动力输出与加速度之间的关系,用算法和模型可以计算出货车装载量,省去大量人力、物力去围追堵截超载车辆。

  大数据重塑工业体系

  大数据助力旅游。旅游者出发去某景点旅游前,总会搜索交通、餐饮、住宿、特产等相关信息,根据这些信息可以创建旅游预警指数,从而进行有效的疏导和引导,避免类似华山2012年事故的发生。

  搜胜于言,行胜于搜,买胜于行,线下行为数据要比线上数据更有价值。

  2007年,北京地铁中出现大量河南焦作云台山的广告,也是大数据决策的结果,根据电信信令数据发现,云台山景点60%的游客来自于北京,20%来自于山东,剩余20%来自山西、河南省内及其他省市,所以当地旅游部门把广告资源重点投向了北京。

  旅游大数据:您的行踪我知道

  克强指数是基于耗电量、铁路货运量和银行贷款发放量等三个经济指标判断经济形势,从某种程度来说克强指数是基于大数据思想的经济指数。近几年出现更多类似克强指数的大数据经济指数,例如根据百度平台上的广告投放来创建的百度行业消费经济指数。基于工商总局新增企业同比变化情况,企业增资同比变化情况来确定的经济发展指数。华尔街利用日本小松分布在全球200万台工程机械的位置和每斗挖掘的重量来分析各国经济的走势,用以指导货币交易。三一重工利用分布全国的20多万台工程机械工作状态来分析国内基础建设形势,为国家投资政策制定提供参考依据。

  基于大数据的经济发展指数

  正像人们身体出现感冒症状,会利用搜索引擎寻求帮助,从而可以利用这些搜索关键词来构建流感指数一样,框定艾滋病嫌疑人喜欢用的搜索关键词,如“治疗艾滋病那种抗生素好”、“治疗艾滋病哪家医院好”等,可以创建“艾滋病指数”,卫生部门可以提前数周获知艾滋病流行情况。还可以利用电信信令、手机App、微信和QQ同时在线数来监测热点景区、活动区人流密度情况,从而进行及时疏导、动态警力配置,避免类似上海踩踏事故的发生。2015年广州亚运会期间,就是利用微信和QQ同时在线数来动态布置警力的。

  利用大数据加强公共事件预警

  大数据在反恐领域也大有作为。暴恐是社会的毒瘤,但只要暴恐分子上网,总会留下蛛丝马迹。波士顿马拉松爆炸发生后美国联邦调查局根据摄像头、Facebook、Twitter等社交媒体数据24小时内锁定嫌疑分子。

  利用大数据进行反恐

  国民经济各行各业无不由数据驱动,但仍有更多商业领域需要由大数据来挖掘潜在的商业价值,正如下图中的电影院一样,通过热力图发现,左下角的几个座位,通常认为应该没人去坐;实际情况是场场不空,处于热恋中的青年更喜欢这里,适当改造做成半包结构,每个座位每场加50元,仍是供不应求。未来,类似电影院左下角座位的案例将在不同行业频繁出现。

  目录

  目前各咨询机构对国内大数据产业规模的统计和预测差异很大,有几十亿元规模的,也有数百亿元的,还有超过千亿元的。探讨大数据产业规模的数字之前,首选要界定大数据产业的范围,通常业界认为使用了大数据基础工具所产生的商品化业务收入才能算作大数据产业,大数据产业收入的两个必要条件,其一是使用大数据基础工具,如Hadoop、Hive、Storm、Spark、Kafka等;其二是商品化业务收入,如果京东的大数据仅为其电子商务业务进行推荐服务,产生的再多也不能算大数据产业,如果京东单独设立一个征信公司,利用京东的大数据为招商银行、工商银行提供征信服务,这部分收入才可以被划为大数据产业,就像农民自产自销的土豆不是商品,拿到市场上销售才是商品一样。如果按照这个概念计算,2015年中国大数据产业也就是6亿美元左右,这也是我们通常说的狭义大数据产业。2015年,中国广义大数据产业在超过1000亿元,比如百度2015年收入超过600亿元,大多数是大数据带来的业务收入,腾讯的广点通大数据广告营销系统也带来80亿元的收入,阿里的平台收入主要也是靠云计算平台和大数据平台来支撑的。

  Beta1.0

  据DT大数据产业创新研究院(DTiii)统计,截止到2016年5月,国内统计到的大数据创新创业企业大约有662家,企业速度增长很快,2014年底,中关村大数据产业联盟统计到的企业为300家左右,2015年底迅速增长到500家,DT大数据产业创新研究院(DTiii)将在2016年9月份发布一个涵盖1200家的中国大数据产业地图,以后计划每半年更新一次。如果贵单位是大数据创新创业企业,尚未被DTiii版大数据产业地图收录,请把贵单位的基本情况发邮件至。

  国内大数据企业是太少而不是太多。以近10多年最为活跃的数据营销行业为例,根据RTBChina统计,截至到2016年5月12日,中国网络广告新生态系统涵盖182家企业左右,而美国营销技术类公司从2011年的150家,快速增长至2016年的3874家,所以中国大数据企业数量还有很大的增长空间。

  亿元

  各国政府高度重视大数据产业的发展,把大数据视为未来提升国家核心竞争力的创新引擎,纷纷出台大数据国家战略。如果把美国上个世纪80年代的信息高速公路称为以信息基础设施建设为核心的信息化1.0,类似我们的高铁、高速公路建设;那么这一波大数据就是买汽车、去旅游,以信息化应用为核心的信息化2.0。

  世界各国纷纷出台大数据国家战略

  各级政府高度重视大数据产业的发展,相继出台促进大数据发展的规划、战略和促进政策。2015年8月,国务院出台《促进大数据发展的行动纲要》,本人有幸参与该文件的编制,该文件通过一年的课题研究、调研、座谈和征求意见,几易其稿。党的十八届五中全会决定实施国家大数据战略,进一步明确了我国大数据的方针和政策。

  《促进大数据发展的行动纲要》编制时间轴

  《促进大数据发展的行动纲要》核心内容可归纳为:一个核心、五大目标、三项任务、十大工程、七大措施。核心是建立数据强国,这与习近平总书记所提的网络强国一脉相承。过去半个多世纪,我们在工业强国的追赶道路上好艰辛,在工业经济的成熟道路上赶超英美日德只能是梦想。工业能力的沉淀、积累不足,难以对抗先行者的技术、产品和市场优势。信息经济为全球各国提供了新的赛道,数据既是新的生产要素,又是新的生产力。我国人口多这个在工业经济时代的劣势正在转变为信息经济时代的优势。我们近10亿互联网、移动互联网用户每天都在产生数据,到2020年中国的数据总量将占全球数据总量20%,届时中国将成为世界第一数据资源大国,这一数据的逻辑基础是我国人口占全球人口总量的18.6%。

  《促进大数据发展的行动纲要》核心内容

  大数据产业的快速发展很大比重是依赖于一批具有创新活力的企业,但政府推动产业的力量也不容忽视,除了产业促进政策之外,政府还有丰富的数据资源,相对于企业数据资源的私有特性,政府的数据是纳税人付过钱的,具有天然开放的属性,如果政府数据资源能够开放出来,将极大激发社会创新的活力。

  先看一个国外政府开放数据推动创新的案例。每个十字路口都是有交通事故记录的,有创业团队根据这些开放的数据开发一个手机App,当输入家和学校地址的时候,他能够自动优化出一条事故率最低的路径,非常受小学生家长的喜欢。

  再看一个国内的案例。2015年,上海开放数据大赛(SODA)由上海市公安局、上海市环境保护局、上海气象局、浦东公交、新浪微博等十多家政府和企业开放交通卡、交通事故、高架匝道关启、出租车轨迹、公交车运行轨迹、地铁运行、空气质量、气象预报、新浪微博等上千GB的数据集,吸引2914人报名参赛,组队817个,初赛阶段有效方案总计505个。来自保卫橙子团队的参赛作品“手机UBI引擎”和清华大学交通大数据团队的“小青椒智能选房助手”项目分别获得千万A轮投资和天使投资。

  我国政府数据开放任重道远!

  政府推动大数据产业发展还存在一些误区。

  一是盲目建设云计算中心。没有应用的云计算中心,如同在无人的沙漠兴建高铁,建的越多浪费越多。云计算中心不像建高速公路和高铁,我们国家在“胡焕庸线”以东兴建高速公路和高铁是因为需求早已存在,而目前各地兴建云计算中心是没有需求的盲目建设,更多表现为政绩工程。云计算中心最大成本不是电费而是带宽成本,缺应用、缺高带宽链接、少工程人员、硬件快速减值必然导致一批云计算中心重演园区建设的覆辙。

  大数据发展误区之一:云计算

  二是盲目兴建数据交易市场。各地兴建数据交易市场的逻辑是:工业时代每个地方都有蔬菜、百货、家具市场,建市场的收取佣金,政府收取管理费和税金,只赚不赔的生意啊!大数据时代来了,数据交易市场也应该有啊!也应该是只赚不赔的生意啊!赶紧跑马圈地吧!

  直肠逻辑看似没有问题,深入思考下此路不通!数据是新物种,如果用旧思维去思考,只会南辕北辙。

  商品交易的三个要素是,有人愿买,有人愿卖,公允价格;为何市场上鸡肉比鸭肉贵,因为一斤鸡肉需要6斤左右的饲料,而鸭仅需3斤左右。过去的工业品、农产品交易的价格是成本价加上品牌溢价,任何商品都有公允价格。交易的是同质的分子,甲果农的苹果与乙果农的苹果本质上是没有差异的。交易的过程是伴随物权转移的,甲卖给乙10斤苹果,交易后物权转移至乙,甲没有了。数据首先没有公允的价格,不同时间、不同买家、同一买家因算法的改进对同一数据的报价都会有所不同。数据交易的是异质的、零成本复制的比特,如果甲卖4G交通数据给乙,甲还有,乙还可以专卖(即使法律条文约束乙不能转售,但实际上很难控制乙的转售行为)。

  此外,网络时代的来临,对交易来讲是去中介化和去区域化的,甲与乙通过网络平台谈成一笔数据合作,为何还要去数据交易市场被扒层皮呢?浙江义乌小商品市场、江苏常熟服装市场都在向淘宝迁移,数据天生以网络为基础的为何还要逆历史潮流去每个区域物理交易市场交租金呢?

  我们在思考一个问题之前,要看这个问题的本质是什么,否则只会在错误的道路上越走越远。人类在实现飞天梦想之初是用火药绑在椅子上、模仿会飞的鸟造鸟翅膀,这些都无疾而终。空气动力学最终帮人类实现了飞天之梦,我们探寻数据交易的规则是要找到第二个“空气动力学”,而不是造鸟翅膀,否则造的越大,摔得越惨。

  我在思考数据资产交易是否是一个伪概念,根据业界的实践,提出数据权益交易的理论【DataEquityExchange(DataEEX)】,简单讲就是,甲拥有一批数据,经过脱敏化、标签化处理后,乙、丙、丁可以根据自己的商业场景,用不同的算法模型,将这些数据用于金融、交通、电商、旅游等方面,甲与各方可以评估数据在应用中的商业价值,以及各自的贡献,进行利益分成,比如甲乙交易时,数据价值占80%,剩下的20%归乙方;甲丙方交易时,甲可能只能分到70%。

  传统工业成本定价法失效

  人才是制约大数据产业发展的最大短板。以2025年万亿产业估算,我国大数据人才缺口在200万以上。很多人商业嗅觉敏感,但对数据没有高度的敏感性,即使对数据敏感,又不擅长使用各种工具,很多办公室用户不会用效率更高的数据透视表即是一例。传统IT企业以服务流程为主,他们对数据无感,所以对于这些企业来讲转型压力巨大。金融、地产、餐饮、旅游等行业用户过去的工作方式是精细化管理、服务好客户即可,大部分员工没有碰过数据,现在给他再好的数据也是枉然。也许10年后,您家楼下的小卖部,每天晚上关门之后都在用一套WIFI探测系统分析今天到店的转化率,数据反映哪些商品摆放位置有问题,这就像10年前,街头的苍蝇馆子无论如何也想不到,动辄需要花几十万的电子点菜系统,现在他只需要在淘宝花980元就搞定一样。

  竞争是推动新技术应用的最大动力。淘宝红火之后,数百万人涌向淘宝开店,淘宝网上的店小二与传统店铺素质要求明显不同,要回分析网站、分析客源、明白用户留存率、懂得精准营销等等,这些都是以数据为基础的电子商务经营分析,淘宝网上的竞争要比普通线下店激烈的多,因为每个店小二面对的是全国的商家,而不是线下区域内的3~5家经营者,所以我们看到淘宝网上店小二数据分析能力比国内500强的管理者还要强。国内大数据应用的先行者的示范作用将加速大数据在各领域的应用广度和深度。

  人才成为制约产业发展的瓶颈

  虽然技术对大数据产业影响很大,但技术不足以主导大数据产业的发展,因为大数据是以应用为导向的产业。大数据技术源于更加开放的互联网企业,如雅虎、谷歌、Facebook、Twitter等,这些企业的商业模式不是靠卖软件版权,基本是靠广告、服务或游戏分成获得巨额收益,这些企业把大数据技术开源出来推动形成更大的产业生态体系,间接获取收益。传统软件巨头如IBM、微软、甲骨文等在大数据技术储备或是在能力上没有表现出比大数据开源软件更好的功能和性能。于是,大数据底层架构技术和产品虽然很重要,但所形成可见的商业价值非常有限,相对于过去20年企业IT时代所形成的千亿美元的操作系统、数据库、中间件等基础架构软件产品市场降低了一个数量级。

  目录

  目前大数据发展阶段相当于1998、1999年的软件产业。大数据是软件的一个典型分支,我们不妨从软件产业发展的历史轨迹来洞察未来大数据产业的发展趋势。1998年北京的软件产业占全国80%以上(目前从税收、百强企业来看北京占全国的近三分之一),当前北京的大数据企业数量、产业规模占全国的70%左右。从北京86家大数据企业整体来看,平均规模为百人、千万元收入,产品和解决方案集中在金融、营销、政府等行业,要注意的是这批企业是头部比较好的企业。目前,北京软件企业总数超过40000家,上亿元的软件企业有600多家,每年新增软件企业5000家左右。从目前大数据企业的规模、成长速度来看,明显比1998、1999年的软件企业要快。

  年软件产业的发展,观未来大数据产业发展

  如果说基础设施、原材料是工业经济发展的基石,那么智能终端数、人均带宽及流量、互联网化率(行业信息化程度)是大数据产业发展的基石。截至2015年底,我国已拥有6.88亿网民,网民普及率达到50.3%,拥有全球第一的互联网用户数和移动互联网用户数。2015年月户人均移动互联网接入流量389M,比2014年增长90%。2015年,中国网络购物市场占社会消费品零售总额的12.6%,已经高于美国(2012年美国该数字为6%,2015年估计在9-10%),市场交易规模达3.8万亿元。所有以上这些都构成了我国大数据产业发展坚实的基础,为我国大数据企业的成长培育了丰富的土壤。

  我国互联网管理的特点,造成在很多领域中国对全球跨国互联网企业而言是“数据黑洞”,比如谷歌的广告、谷歌的应用分发在国内的优势相对其他国家而言要小的多,“数据黑洞”可以避免国内企业在幼稚期遭到跨国巨头的冲击。

  我国更加开放的市场管理、数据管理政策也为大数据创新企业打开了更大的市场空间

  智能终端数、人均带宽及流量、互联网化率是大数据产业发展的基石

  IT从驱动企业业务流程转向数据驱动企业经营,更大的背景是IT从企业IT时代转向消费IT时代,尤其是大众广泛使用互联网和iPhone的诞生,数十亿网民在网络上处处留痕、时时留迹,让企业有机会洞察到潜在客户,并发现销售机会,从而实现大数据商业价值的闭环。企业IT让位于消费IT,消费IT引领IT潮流,不仅意味着消费IT引领技术潮流、产品趋势和市场格局;企业IT时代,PC、键盘对普通消费者而言并不是很好用的设备,但普通消费者只能是迁就;消费IT时代,手机、触控式输入对于企业级应用并不是效率高的工具,但在潮流趋势下,企业级IT也不得不基于手机搭建。

  未来,大数据依然会围绕用户行为画像全面展开,进一步扩展至商业组织画像、生理行为画像、设备状态画像,甚至是静态建筑、桥梁画像等,大数据产业也从数百亿美元增长到数万亿美元,乃至数十万亿美元。

  大数据产业发展路径

  世界上的每个人,只要他上网,从他出生、上学、工作、交友,在他人生的每个阶段,生活的每个状态无不由大数据来驱动。逛新浪网会有基于您过去浏览行为的猜您喜欢,逛淘宝会有基于大数据推荐引擎的商品推荐,上交友网站会根据你的特点帮你推荐伴侣…..

  三大驱动力之二:数据驱动新商业

  无论美国的工业互联网还是德国的工业4.0,抑或中国的制造业2025,都是在描述未来的新工业图景,一句话简单概括之:数据驱动的新工业体系。在数据驱动下,工业产业链正在悄然发生变化,制造环节在产业链中的地位正在下降,服务业的价值正在不断提升,过去服务作为制造环节的一个补充,未来制造环节将成为服务业的补充。过去丰田卖客户一辆科罗拉,丰田不希望客户再找上门来,除非客户再次买新车而来;现在发生了根本性变化,客户取车的那一时间,对丰田来说,生意才刚刚开始,因为交付用户手中的车通过车联网产生数据才刚刚开始,随着数据产生的不断增多,丰田通过数据获取的潜在收益也在不断变大,预测性故障服务、改进产品质量、为保险公司提供个性化保险数据服务、卖旅游机票、卖户外装备……围绕汽车全生命周期的汽车服务、用户服务要比一辆车价值多得多。

  三大驱动力之三:数据驱动新工业

  过去百年的工业经济是以钢铁、石油、煤炭为资源通过铁路、公路连接,标准化满足人们消费所形成农业、工业和服务业三大产业。未来百年的信息经以永不消失的数据资源为基础,通过云计算和各种网络等基础设施,个性化满足人们消费,形成类似工业4.0的新工业、滴滴、优步、Airbnb等新服务业,农业同样也会被改造,从数据育种,到按需施肥,再到卫星确定最佳收割时期,以及基于农业大数据的期货、证券等金融衍生品。

  未来信息经济蓝图

  互联网带来经济的变化。传统经济是是范围经济,每个人的生活半径相对固定,吃喝玩乐相对在一定区域内完成,互联网打破了这一格局,原来在生活半径2~3公里购买的干果,现在可以通过淘宝购买千里之外的三只松鼠和百草味,这个小案例折射出经济的大变局。把以GDP为衡量标准的县域经济百强县与以电子商务为衡量标准的电商百强县做下比较,传统经济的百强县浙江有18个,而浙江电商百强县有41个,因为淘宝,改变了我们的生活,因为淘宝,改变了区域产业结构。随着不同行业信息化程度的不断提高,将涌现一批类似淘宝的互联网商业平台。类似淘宝的教育平台将出现在哪里呢?类似淘宝的医疗平台将出现在哪里呢?类似淘宝的车联网平台将出现在哪里呢?这些新兴网络平台的出现,都将导致未来经济结构的变局。WTO统治者全球工业经济的贸易规则,以数据为基础的DATAWTO将重塑世界贸易格局,我们准备好了吗?

  大数据、新时代、新经济、新格局

  过去20年,中国企业级IT有效的软件市场在1000亿美元左右。有限的池塘、分割的市场、不公平的竞争、IT标准被跨国巨头主导、跨国巨头占领头部市场等多种因素造成千亿美元市场被4万多家企业一条条分割,企业营收天花板不过30~50亿元而已。

  互联网则是另外一番天地,尽管国内企业没有几家能走出去,但依然出现BAT等几家营收过千亿,市值达数千亿亿美元的世界级市值的新国家企业。数以亿计的人口基数、庞大的市场、开放的竞争、放松的对内管制、等因素造就了千亿级BAT。

  我国大数据的发展虽然是企业级市场,但源头是数以亿计的普通消费者,所以其发展更像是互联网产业,2025年中国大数据产业达到一万亿元应该是非常值得期待的。

  亿元

  从国内外2000多家上市企业成长轨迹来看,尽管我国软件产业在过去几十年总是一个尾随者,并且因为企业发展阶段、管理水平的差异而落后5~10年,但这一波大数据我们几乎是齐头并进,尤其是在2010年后的这一波移动互联网普及浪潮,后发优势让我们数亿非PC互联网用户直接跨进移动互联网阶段,我们的数据资源也急速膨胀,为创新创业企业提供了天然的试验场,一批企业快速成长起来,在与XXM、XXsoft、XXale等跨国IT巨头竞争中屡次获胜,因为他们没有数据,纯粹的技术平台没有任何竞争优势。

  总结:

  1、大数据的背景:网络时代时时留痕,处处留迹;

  2、大数据的实质:数据是物理世界在网络空间的客观映射,数据是二度空间的DNA;

  3、大数据发展阶段:互联网领域小学一年级,行业领域幼儿园小班,百年信息经济的头10年;

  4、大数据生态:创新创业此起彼伏,资本关爱有加,国家大数据战略,万亿可期;

  5、如何应对:数据意识、数据思维、数据决策、数据行动。

  央视网经济频道《大数据名人讲堂》之《陈新河:万亿元大数据产业新生态》视频地址(点击文末阅读原文即可):

推荐:

0
0
0
0
0
0
0
0

网友评论 ()条 查看

姓名: 验证码: 看不清楚,换一个

推荐文章更多

热门图文更多

最新文章更多

关于联系我们 - 广告服务 - 友情链接 - 网站地图 - 版权声明 - 人才招聘 - 帮助

赞助合作: log日志

声明:网站数据来源于网络转载,不代表站长立场,如果侵犯了你的权益,请联系站长删除。

CopyRight 2010-2016 波士顿旅行网 All Rights Reserved