注:大数据不仅仅是一个营销词汇,在这篇干货满满的文章里,作者用数据告诉我们,究竟什么是大数据,大数据行业的创业机会如何,未来的创业方向又有哪些。 接触大数据,了解这个行业已经有两年多了,每天都在阅读大量的关于大数据的文献资料和技术文章。如果你要问我什么是大数据?以前可能我会和你说,大数据是一种思维,一种技术,标志的是大数据的4V特点: Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。大数据带来的是一种变革,打破了原有的随机分析(抽样调查)方法,采用所有全量的数据来进行分析,分析的数据更加复杂,有结构化数据、半结构化数据和非结构化数据,分析结构更加注重相关性而不是因果。 可是,普通人和大众用户他们听得懂吗?现在我会举例子告诉你。 比如说,采野蘑菇/野山参这样的事情,野蘑菇和野山参的分布地点都是随机的,经验告诉我,它们会分布在哪片山林,但是我们不知道具体位置,得一个一个的找。大数据可以解决这个难题。 我们可以把山林用数据可视化表现出来,然后让采野蘑菇的人根据自己的实战经验标出蘑菇分布的地点,并且把这些地点数据常年积累起来。然后结合野蘑菇的习性,收集每片山林的降雨量、灌木丛分布数据、土壤数据、温度数据以及山林里采蘑菇的人流量数据等等,来准确的预测出野蘑菇的分布地点。 这就是大数据力量。 一言以蔽之,大数据最直接的意义就是让"随机性"的事情变得可提前预测,从而提高效率和行动价值。 同样的思路,森林防火防贼、环境保护、旅游景点客流预测等等,都可以引入大数据思维。大数据同时也可以为我们工作、学习和生活中一些重大决策作为依据。 今天主要说的是大数据领域的创业思考,大数据只有和生活、学习、工作以及商业等场景结合才能产生价值。推动技术发展的从来都不是技术本身,而是消费者(用户)的需求。用户不需要知道也没兴趣知道你处理大数据是用Hadoop还是Spark、原理是什么、架构是什么,用户最关心的是大数据到底怎么用,用了能为自己带来什么好处。 今天我们将从"外部大环境"、"行业内部环境"、"创业风险"和"大数据创业机会和方向"四个点来阐述主题,聪明的朋友也许已经知道了,我们的思路就是大数据领域创业的SWOT分析。 大数据市场现状(外部环境) 根据贵阳大数据交易所5月28日发布的《2015年中国大数据交易白皮书》显示:2014年中国大数据市场规模达到767亿元,同比增长27.83%。预计到2020年,中国大数据产业市场规模将达到8228.81亿元。 一、大数据市场规模巨大 首先,中国大数据市场环比增长率较大。根据易观智库7月30号发布的中国大数据应用行业的报告显示,2015-2018年中国大数据市场营销规模达到258.6亿人民币。环比增长率为37.2%。 其次,大数据在全球范围内的市场规模同样巨大,根据IDC发布最新研究结果,预测到2018年全球大数据技术和服务市场的2018年的复合年增长率将达到26.4%,规模达到415亿美元,是整个IT市场增幅的6倍。 无论是从国内还全球的市场规模和增长率来看,我们都可以得出这样一个结论,无论你是什么样的公司,或者说你未来创业要做什么样的服务,大数据都是兵家必争之地。大数据本身就是一种无形的资产,如果你的公司还没有部署大数据,那么在未来的市场上会失去核心竞争力。就好比你走在中关村创业大街上,你能收到的100份融资BP里,可能有99份都是APP和O2O项目,但99家里90%以上会重视大数据。 二、政策好,政府支持力度大 根据gov.cn9月6日消息,国务院公开发布《国务院关于印发促进大数据发展行动纲要的通知》,纲要里明确的说明,中国将在2018年会建成政府的大数据平台。相比之下,我们敬爱的习大大和李克强总理也经常为大数据站台,为中国的大数据发展点赞。看政府对大数据的重视,你抬头看看前两天的北京的蓝天,就会对政府有信心了。政府真正要干一件事,执行力大的超出你的预期。 据我们的观察,大数据领域的创业环境只会越来越好。目前,很多一线城市乃至二三线城市的科技园区,都出台了相关的扶持大数据产业的政策。如果你真的想在这个行业创业,可选择扶持力度大、人才较多的城市作为大本营,当然了,北京肯定是首选。 三、资本关注热 上图是我们(36大数据,编者注)对大数据垂直领域2015年资本投资事件的不完全统计。其实你仔细来看图会发现,大数据行业的资本关注热度是远远高于其他行业的。这个可以从投资金额可以看出来。今年上半年O2O项目非常热,也是投资重点关注的行业,但是投资的资本里,普遍都是人民币几百万和几千万这样的量级。而大数据行业的投资,更多的资本量级都是上亿的,而且资本多源于顶级投资机构。 大数据行业现状(内部环境) "大数据就像十几岁少年眼中的性行为,每个人都在谈论它,但没人真正知道怎么做。每个人都以为除了自己之外的每个人都在使用它,所以每个人都装作自己很了解它。" TED的创始人Dan Ariely是这样调侃大数据的。虽然是句玩笑话,但也确实说出了大数据的行业现状。 现状一、市场尚未饱和,竞争并不激烈 1、尚未出现垄断性行业巨头 前面我们分析了大数据整个大环境的状况,我们知道大数据行业市场潜力巨大,未来的增长率将达37%左右。但是在中国,目前尚未出现一家如Palantir、FICO这样的垄断性质的大数据企业。也许百分点和Talkingdata都在布局上市,但是距离挂牌还有一段时间和距离。新创的大数据企业中,还没有一家在美股、港股和深交所上市。 这是一个机会。创业你做电子商务也好,做游戏也好,都有好几家有钱有用户的巨头公司和你争抢市场份额,但是大数据行业不一样,大数据行业没有那么大的竞争压力,而且真正的战争尚未开始。 2、现有大数据企业扎推北京 根据数据堂统计的数据来看,新创的大数据企业中,57%的公司都在北京,上海占了15%的份额。大数据需要和实际的业务场景结合才能产生价值,工业、农业、制造、交通和能源等传统行业仍然拥有巨大的潜力,北上广深和二三线城市的大数据力量还没有完全被挖掘出来,这同样也是一个优势。 3、大数据在生活、商业渗透性较弱 笔者做大数据两年了,天天都听到或看到大数据的各种消息,但是生活并没有因为大数据的到来变得更智能一些。它没有让大龄光棍女青年更快更精准的找到结婚对象,也没用让隔壁老王炒股赚到更多的钱,更没有让北京的交通不再拥堵……大数据有用是不假,但是和生活场景结合得还是较弱。并没有看到可以称之为"变革"的现象。 4、没有直接的变现模式 互联网上最赚钱的两大行业分别是电子商务和网络游戏,这两个行业的变现模式都是非常清晰和直接的,但是大数据的变现模式需要绕一个弯子,需要和实际业务场景结合起来才能产生价值,不直接的路定然不好走。 有人曾经把大数据比作石油,可是,目前的情况看来,大数据行业还需要像发动机一样可以将数据转化成动力的载体。一如2010年以前一样,大家都知道手机游戏是未来的一个趋势,可是没有iPhone等智能移动设备的出现,手机游戏的市场份额就非常小,用户体量也很有限。 现状二、大数据行业人才紧缺 根据中国商业联合会数据分析专业委员会统计,未来中国基础性数据分析人才缺口将达到1400万,而在BAT企业招聘的职位里,60%以上都在招大数据人才。2015年-2016年是大数据人才最为匮乏的两年,因为已开了大数据专业的高等院校,第一批大数据人才还为毕业;已有的人才里,复合型的人才较少,都是术有专攻。 全球的大数据人才情况也不容乐观,据Gartner预测,到2016年,25%的全球大型企业将部署大数据分析系统;到2015年,圈球大数据人才需求将达到440万人;调查结果表明,全球64%的企业已经开始向大数据项目注资,或者打算在2015年6月之前将计划付诸实践。 大数据创业,人才就是核心,所有的公司都在抢大数据人才,创业公司想要招到相应的大数据人才非常困难。 现状三、数据量增长超快 这里和大家分享三个数字。49亿、250亿和 39ZB。 49亿物联网设备:咨询公司 Gartner 预测今明两年互联物品的涨幅将达30%。分析师在指出,截止到2015年,全球物联网设备数量将从38亿飙升至49亿。 250亿智能装置传感器:分析师预测,传感器的普及将大大加速智能设备的开发、生产进度。到2020年,将会有大约250亿部智能装置出现在全球市场。 39ZB数据存储量:在 2014 年年底,国内网络上集中存储的数据已经达到 1ZB,到 2020 年时,当年的新增数据量将会达到 15.45ZB,整体的网络上数据存储量将会达到 39ZB,未来 6 年的年复合增长率达到了 84%。 预测到 2020 年,平均每个中国人每年产生的数据约为 4.1GB。 现状四:行业目前存在问题 1、炒作过剩,实际落地产品较少;很多产品都是打擦边球;把大数据玩坏了。现在你和大家说大数据,很多人都认为你在骗人。行业想要持续稳定的发展,企业必须有自律。 2、群众基础差,关注的人群多为三高人才,高学历高收入和高技术。从百度指数可以看出,关注大数据的人群中,53%比例的人群年龄分布为30-39岁,而20-29岁人群占的比例为28%;另外,关注大数据的男女比例里,男性占到了80%以上。这样的数字直接告诉我们的问题就是,"大数据"的话题传播性其实并不好。预计超过90%的大众用户不知道大数据是个什么东西。 3、大数据只解决了部分2B的问题,2C产品较少。现在大家都觉得大数据的方向就是2B,我们不这么认为。打个比方说,你做2B的产品,每家企业平均给你200万,新创大数据企业你撑死了一年做上20家企业,那么营收预计在4000万左右。但是如果你做2C的大数据产品,一个用户给你200块,当你做到20万付费用户的时候,你的营收就会超过4000万。为什么呢,因为用户的数据本身就是钱。从深远的角度来说,未来的创业,你必须学会讨好大众,服务好90后,这才是种子用户。 4、懂技术的人不懂业务,懂业务的人不懂商业。这一点不想做详细的说明,打击面太广了。笔者参加了众多大数据行业内的峰会大会小会,人人都在说大数据,可是问到你的业务如何赚钱的时候,很多人都是三缄其口。纯技术是无法赚钱的,必须和实际的业务结合起来产生商业价值,才能获益。 5、市面上存在的大数据工具上手门槛较高。又一个槽点出来了。前面也说了,任何的新技术,都是需求推动其发展。需求来自用户。任何的新技术,只有拥抱大众用户才能得到更好的发展,接地气非常重要。现有的大数据处理工具非常复杂,需要你懂这个那个会这个那个才能使用,大众根本接触不到。现有的大数据工具也不够亲民,无论是2B也好,2C也好,你需要给别人的是一个简单动动手就能用的工具,里面有功能按钮,而不是一堆代码,最起码应该满足目前Office工作人员使用。上手门槛较高意味着很大一部分用户被你挡在了门外。将大数据处理工具产品化势在必行。 大数据行业创业的风险预警 一、大数据的创业门槛 1、人才成本较高;在美国,在R、NoSQL和MapReduce方面需求的专业人才薪水达到了每年约11万5千美元,在中国,大数据人才一将难求,创业公司不容易招大数据技术人才,即使招到,人才方面支出也较高。包括高薪、期权和股票等等; 2、存储硬件成本高;考虑到数据归属和安全性。大数据公司一般不会数据存在云上。 自建机房比云存储成本高很多倍。 3、项目启动资金高;不是30-50十万就可以玩起来的,比移动互联网APP创业项目启动资金要求高。 4、用户少、获取成本高。这一点的门槛主要是群众基础差带来的。 没有明确的商业变现模式,这是目前大数据创业的最大门槛。 拼数据,你拼不过阿里百度腾讯,拼钱,还是算了…… 二、数据安全问题 据Verizon发布的《2015年数据泄露调查报告》显示,79790个安全事件中已有2122个确认的数据泄露。值得关注的是在2015年的报告中新增了一个统计模型,用以帮助企业评估到底每笔数据泄露,要损失多少钱。如果泄露1000条记录时,有95%的可能会损失5.2万-8.7万。泄露1千万数据记录的花费介于210万到520万之间,但最多可能到7390万。 让我们来回顾一下近年来数据泄漏的事件:2014年5月,800万小米用户数据或被泄露;2014年12月,12306大量用户信息遭泄露;2015年4月,超30省市曝管理漏洞数千万社保用户信息或泄露;2015年5月,携程网全面瘫痪疑似数据库物理删除;2015年6月,美国人事管理局(OPM)被指出大量工作人员信息泄露;2015年8月,婚外情网站Ashley Madison数据遭泄露…… 对于大数据新创企业来说,数据的安全性就是"命",如何保命事关生存。大数据的安全性,是部署大数据架构和大数据创业最大的挑战之一! 三、大数据隐私 关于大数据隐私,在美国有隐私法案,而且美国与欧盟之间还签署了安全港、隐私声明等等。而在中国,目前的立法是非常模糊的,属于灰色地带。手机号码被恶意第三方收集了,然后给用户发了很多垃圾短信,或者我的姓名,我的电话,我的邮箱,他们收集我的信息是不是合法的,目前这一点在在立法上都不清晰。不知道未来国家会不会出台相关的法律法规来规范这个领域?大数据隐私目前具有不确定因素,也是创业存在的风险之一。 说完了风险,下面我们可以来说说大数据行业的创业方向和机会。 大数据行业创业机会与方向 一、资本层面关注点 对于大数据项目,投资人到底看什么?在写这篇文章之前,我们与多家投行的投资人曾经做过访谈,下面是我们根据访谈内容整理出来的内容。 大数据没有直截了当的变现模式,那么一个新创大数据企业想要获得成功,拿什么去拼?当然是人才。这也是投资人最关注的东西。 投资人告诉笔者,对于一个大数据项目,他们最看重的是团队。那怎么看团队呢?一般从团队技术能力、背景、过往项目经验和创始人四个方面来看。大数据对技术的要求非常高,投资人看项目的时候,首先看的就是创始人的技术能力。一般情况下,投资者会更加青睐拥有技术背景的创始人和他的项目。 还有就是看项目的商业模式和变现能力。看项目方面,投资人会去看你的项目对应的国外成熟企业,或者说你的项目对应的竞争者是谁。由竞争者经营的情况来预估你在其领域的市场份额和变现能力。商业模式方面,投资者会看你的客户(用户)体量和数据源。你的客户群体有多大?你手里有哪些具体业务上的数据?这些数据如何产生价值,应用到你的客户身上?解决好这3个问题就成功了一半。 大数据项目变现方向,投资人关注的是你的项目是否能够快速直接的产生价值,而且有持续的创收能力。 解决好以上几个问题,新创大数据公司想要拿到融资就非常容易了。 二、大数据垂直领域热门的投资方向 第一个是Hadoop商业化,简单来说就是做Hadoop的收费版本。Hadoop本来是开源的,但是在具体业务场景中,还缺乏很多功能,那么Hadoop 商业化就是去完善这些功能,使其更好的应用于企业的业务场景。Hadoop 商业化最典型的公司就是Hadoop的三驾马车,Hortonworks,Cloudera和MapR,Hortonworks目前已经在纳斯达克上市。中国相应的做Hadoop 商业化的公司是星环科技。 第二个是SQL on Hadoop,用大白话来说就是基于应用场景下的数据框架 。比如说大数据架构里的查询引擎、存储引擎、计算模型等等,这个主要是基于大数据技术方向的,比如说WibiData,它提供了对Hadoop的封装,连接前端应用到Hadoop基础设施。 第三个是NoSQL数据库,非关系型数据库和云数据库服务。典型的国外企业有MongoDB 和Datastax。目前,创业公司MongoDB的估值已超过16亿美元,而在中国,基础云服务商青云QingCloud已经推出了基于MongoDB的集群服务,名字叫做青云QingCloud MongoDB。 第四个是分析和可视化。对应的国外企业有Tableau、Datameer。国内新创的大数据企业中,也有很多大数据企业在做可视化服务,比如说国云数据的大数据魔镜。 第五个是行业大数据应用。为社交媒体、广告公司、企业客户、电子商务等行业客户提供数据分析,帮助这些行业提升数据分析的水平,如DataSift、RelateIQ、RocketFuel等创业公司。 三、大数据行业现有的商业模式 谈到商业模式,肯定就要说到2B还2C的问题。 2B是目前大数据行业主要的商业模式,将大数据变为一种服务,服务的对象是企业或机构。比如现有的大数据企业里,星图数据,Hortonworks,Cloudera,星环科技、Talkingdata 都是2B的商业模式。从他们的运营状况,不难看出,2B的商业模式,要么是做解决方案(类似外包),要么就是做工具。 预计未来所有的互联网企业也好,传统企业也好,都会在企业内部成立大数据部门,那么到那个时候,解决方案的市场份额还会多么?不肯到也不否定。对于一家企业来说,大数据就是自己的资产,相信企业更倾向于自己管理自己的内部资产。所以我们大胆的预测,解决方案只是目前大数据行业的权宜之计,未来企业会用自己的人才管理自己的大数据,用自己的人才使用自己的大数据。做工具是目前较为主流的模式。Palantir其实也是做工具。 2C方面,在整理这份内容的时候,我们发现2C的产品非常少。女性经期助手、百度指数这样勉强算是2C的大数据产品。而大数据2C方面的产品,更多的是倾向于应用。可穿戴设备其实也算是大数据应用产品之一。 说了这么多,你肯定会问我了,那么腾讯、百度和阿里巴巴这样的企业,他们的大数据又是什么样的模式呢?在笔者看来,BAT企业的大数据商业模式都是2C+2B的模式,我们可以简称为复合型的商业模式,因为他们服务的用户有企业用户也有个人用户。 总结一下,现有的商业模式里,哪个最好?笔者个人认为是2B+2C模式。这样的模式是最健康的模式,形成了一个商业闭环。 用一句话来说就是:你收集用户的数据,分析出报告,然后给到的对应的企业,对应的企业根据数据反馈,从而开发或制造出更好的产品,让用户享受更智能更美好的生活。这整个过程中,大数据是贯穿始终的。 那么,现有的大数据公司,都是如何赚钱的呢? 1、广告、营销。这一类主要集中在第三方大数据营销公司里。典型的企业包括缔元信、时趣这样的公司。他们主要的业务就是帮助大数据分析能力较弱的公司来做大数据分析,优化广告和营销的路径,使市场投入的非常产生更大的价值。 2、直接卖数据的公司。典型的企业有数据堂。 3、做工具或者服务。目前的移动统计工具就是这一类,还有做Hadoop套件的也是这一类公司。 4、卖报告或解决方案的。做大数据解决方案的公司就太多太多了,典型的公司为IBM。 5、跨界和融合。 Talkingdata联合创始人蒋奇先生告诉我们,Talkingdata后台有移动互联网各个热门手机游戏的数据,包括用户的设备数据、行为数据、日常数据和游戏里的消费数据等等。根据这些数据,可以对这些游戏用户进行用户画像。 以招行信用卡推广为例,Talkingdata通过大数据分析发现,《刀塔传奇》以及《我叫MT》这两款游戏的用户属性和招商银行信用卡中心需要的用户属性很契合,于是促成了招商银行和的合作,还支持了后续的信用卡积分的礼包和活动等。 这次合作为招行信用卡带来了5万个绑定用户。一般情况下,银行类的应用要实现转化的平均成本在两百到三百块钱之间,而这样的跨界合作,招商银行基本上没花一分钱,就达到了5万转化率,理论上省掉了上千万的费用。这就是跨界和融合。 跨界和融合,其实也是大数据思维里最重要的一环。大数据就像是钱一样,你得让它流动起来才能产生价值。 四、大数据行业的创业方向和机会 先说2B方向。 大数据创业的2B方向,更多的是做工具和服务,如数据可视化、商务智能、CRM等。 现有的大数据工具有着技术门槛高、上手成本高、和实际业务结合较差以及部署成本高,小公司用不起等特点。那么新创企业就可以根据以往这些产品的缺陷,来做更适合市场和客户的大数据分析工具和服务。另外,将大数据工具完整化和产品化也是一个方向。新一代的大数据处理工具应该是有着漂亮UI,功能按键和数据可视化等模块的完整产品,而不是一堆代码。 再说2C方向。 大数据一个很大的作用就是为决策做依据,以前做决定是"拍脑袋"决定,现在,做决定是根据数据结果。在我们的生活中,需要做决策的时候太多太多,尤其是像笔者这样选择性困难的天秤座,非常需要大数据来辅助决策。个人理财(我的钱花哪去了,哪些可以省下来)、家庭决策(孩子报考哪所大学)、职业发展/自我量化(该不该跳槽,现在薪水到底合适不合适 )以及个人健康都可以用到大数据。 【图:大数据应用的现状和机会】 五、我们的创业建议 1、想清楚谁为你买单(找用户);2、痛点是什么(找需求);3、稳定/独特的数据源(找数据);4、靠谱的人做靠谱的事(找人才);5、考虑2C的产品方向;6、忘记科技行业过往经验;7、将大数据产品化 (小而美);8、深耕一个领域,不断的试错和迭代。 其他新创大数据公司创始人也提出过自己的建议。九次方大数据集团总裁王参寿认为深耕大数据领域,坚持才是王道:"大数据行业创业就像爬泰山,爬不到山顶,看不到太阳。" 国云数据CEO马晓东表示,"不要跟着概念创业,从真实需求出发,从企业和用户对数据的需求出发做大数据产品,找准自己的定位是关键。" ,