作为信息领域商业巨头,英特尔已经在大数据领域做了很多尝试。Hadoop是英特尔现在的关注重点,但最终目的是提供一个大数据平台,在平台上提供更多的服务,最后达到"让计算改变生活"这个愿景。 本刊记者专访了英特尔亚太研发有限公司总经理何京翔,他认为,英特尔有着非常良好的传统,就是把技术 变成一种生态环境、变成一种解决方案,变成真正能够产生出商业价值的商业模式。因此,在大数据领域,英特尔扮演的角色不仅是硬件提供商,而是致力于提供包含Hadoop等大数据分析软件在内的、端到端大数据方案供应商。 大数据不是灵丹妙药 《新理财》:您能否给我们畅想一下,大数据在未来几年真正大范围应用起来以后,将是一个什么样的蓝图? 何京翔:其实大数据本是通过计算机技术、智能技术来改变人们生活的大的愿景的一个技术。传统的数据往往是结构化,其数量往往有限。其实企业也有很多数据,我们一直在说,我们是在一个信息爆炸的时代,随着信息技术的发展,数据肯定是越来越多。 那为什么说传统的数据和大数据有些不一样的地方?第一,现在大量数据是非结构化的,譬如现在手机上微博、图片、视频都是非结构化的,和过去的很多关系数据库的传统数据结构是不一样的,所以在管理上技术也不一样;第二,是量的区别。我们曾经做过一个统计,在一个直辖市级别的城市,视频监控的数据一个季度大概在一两百个P左右。像现在大多数情况下是冷数据,采集完就搁在那里了,没有去实时地去分析处理,然后过一段时间就抹掉了。这里面本身的价值就没有被发掘出来。譬如在未来如果有实时分析的话,像恐怖分子、异常的意外事故,可能可以通过这个监控察觉。譬如现在有一些算法可以分析发现人包分离,可以预警,当然也不是说这人一定是坏人。还有像银行交易数据也可以分析出很多东西。 还有一些应用,可以让人民的生活更便捷。譬如你在网上、手机的消费数据可以分析出你的消费习惯,然后你走在哪里,可能手机就会提醒你可能附近有你感兴趣的商店。当然目前还存在一些困惑,比如隐私啊,这些数据会不会被人卖了啊之类的。新技术都是这样,用好了可能会社会更和谐便利,用不好也可能会带来很多问题。这就回到了一个数据安全、公信的问题。所以在今后部署这个技术的时候就应该引起注意,如何去扬长避短。 其实大数据,并不是什么灵丹妙药,就像前两年的"云"一样,它只是利用计算使我们的生活更现代化便利的过程中的一环。而且我们现在正好处在这个阶段上,随着我们移动互联网、随着物联网的发展,数据确实是越来越多。数据的含金量确实是越来稀疏了,真正你要的信息难度越来越高了,所以需要新的手段。实时的对无结构化的数据进行安全有效的分析,这就是我们大数据面临的一些主要问题和挑战。 《新理财》:从英特尔公司来看,在大数据方面做了很多工作,具体体现在哪些方面? 何京翔:芯片技术是计算的基础,但是随着现在时代的不断发展,我们本身也认识到,我们从2010年就开始重新定位我们的公司,要用计算去改变人们的生活,让世界更美好的愿景。在这个基础之上,我们不再是一个芯片公司而是一个计算公司。无论是从手机还是嵌入式设备到后台的高性能计算,任何涉及到计算的,我们都应该感兴趣。我们看到了物联网和移动计算的发展,大数据确实是一个大家都必须关注的东西。首先涉及到数据的采集、存储、传输、网络,数据处理涉及到了技术问题。恰恰在这些方面,因特尔是有自己专长的。当然在这之上要有软件。所以要看一个硬件、软件上综合的解决方案,优化和打包是因特尔在这方面的优势。现在有一些东西是开源的,但是开源的软件估计财政部门不敢用,因为稳定性、可靠性、可维护性都是问题。 我们已经在几个行业做了相应的优化。比如说电信公司的账单分析,我们做了一些行业的独特的优化、像智能交通对视频图像分析我们做了相应的优化,还有医疗、银行系统的一些优化,这些东西都不在开源社区里头。所以说开源是一个基础,但最后的优化、打包工作是非常重要的。 谈到大数据技术的应用,以电信公司为例,电信公司的客户通讯数据产生的时候是结构化的数据,但是数量太庞大了使得传统的结构化数据分析方式做起来比较吃力,所以现在我们先把它转成非结构化的,然后平行分析处理再写回结构化数据,最后电信公司看到的还是结构化的分析数据。通过这样的办法提高了很大的效率。还有像交通视频监控数据的实时性、即时性、批量处理等问题未来都需要更好的去解决。 我们提供一把"铲子" 《新理财》:您觉得在大数据领域在以后会出现哪些商业模式? 何京翔:我觉得会有只做软件的、也有从硬件一直做到软件的,也有集中在某一个行业里等公司突围出来。作为因特尔,希望形成供应链的关系。当然没有不变的商业模式。 《新理财》:现在大家都在热炒大数据,您觉得是否存在泡沫? 何京翔:我觉得大数据跟其他技术一样,在刚一开始炒概念的时候都有类似的现象,好像又是下一个改变世界的灵丹妙药。然后再逐渐的发现它的局限和其间的一些问题,然后不断去完善渐渐地成熟。很多成功的技术都走过类似的路线。 还有一个公信力的问题需要去解决,如果公信力的问题不解决,那么我们绝大多数的大数据应用愿景都不能付诸实践。还有像政府部门不同部门之间的数据想要共享、去协同分析解决也存在类似的问题。很多问题不是大数据能解决的,大数据只是一个技术手段,当然技术的进步在某种程度上也会对非技术层面的问题形成反馈促进,它将是一个漫长的过程。 《新理财》:刚才咱们也谈到政府部门的数据,这应该是一个很大的金矿,但感觉目前开发利用的还是不够充分。您怎么看待这个问题? 何京翔:这个我也不是特别了解。打个比方,我们只是提供了一把铲子,具体在哪儿挖矿,需要很多方面的努力。像智能交通、电信行业、医疗、金融领域的可以简单理解成露天矿,大数据在这需要分析,这个是一个相对明显直观的问题。但其它方面,像找石油、一些深层煤矿,是否需要和如何使用这种技术手段,这个有待进一步探讨。 《新理财》:你们与各地政府部门经常有合作,在大数据领域,从公司角度考虑最希望政府部门提供什么方面的支撑? 何京翔:有几方面吧,首先,一开始大家都本着开放和解决问题的心态,我觉得这方面目前中国政府做得蛮好的,保持着很好的开放、相互学习的态度。另外一个,希望能给我们行业专业上的一些指导,能够把我们引导到在行业里有影响力的企业去做一些合作。比如现在在财政系统里面在哪一范围怎么去用这些技术,哪块是金矿我们不知道,但是我们愿意去探索。还有一点,一旦有了相应的探索成果,政府如何去引导推广、建立标准。如果在这几方面能够得到政府的指导和帮助,大家都是双赢的结果。还有一点,就是安全性、公信问题如何去沟通、规范。