当数据洪流袭来,华为准备了一艘诺亚方舟

烫金大数据

来源:环球企业家  |  作者:金今  |  阅读:

华为继续向IT公司转型。日前,在2014年华为云计算大会(Huawei Cloud Congress,以下简称HCC)上,基于ICT(Information and Communication Technology,即信息和通信技术)发展程度,华为发布了全球联接指数用来评估全球各个国家和行业的联接水平,以及由联接带来的价值。这或可看作华为从设备制造商向ICT服务商转型的一次全新尝 试。

这是依据情势重塑自我的过程。华为在全球联接指数白皮书中指出:2025年,全球将有65亿互联网用户、80亿智能手机用户享有随时随地的宽带接入体验,产生的数据总量将超过176ZB,而2013年年底这一数字仅为3.8ZB。曾经,为应对数据海啸(Data Tsunami),华为成立了“诺亚方舟实验室”。自2011年第一届HCC上成立IT产品线,华为“IT家族”日益壮大;而今,“洪水”进化成大数据(Big Data),其显然多了几分“为我所用”的信心。

回溯

信息技术的发展在前30年可用摩尔定律来表示。其速度每18个月翻一番,计算性能的提高带动了存储和交互的发展。彼时,以针对结构化数据挖掘为主,在顶层设计和数据结构的基础上再填入清洗后的数据。

当数据库膨胀成大数据,存储技术也迅猛发展,存储速度大约每9个月翻一番。第一个Web服务器诞生,其在软件支持下可发布包括文本、表格、图片、音视频的碎片化超媒体信息,人类开始进入半结构化数据挖掘时代。随后,互联网带宽6个月翻一番,人类进入交互时代。

中国工程院院士李德毅将计算、存储、交互比作嵌在一起的三个齿轮,三者的主导地位不断更迭。而今,互联网交互以每6个月翻一番的速度“逼迫”着存储和计算向前发展。“移动互联网时代的大数据挖掘主要是网络环境下的非结构化数据挖掘,它们是鲜活的、碎片化的、异构的、有情感的原生态数据。”李补充道。

业界对大数据的觉醒早于大众流行。亚马逊于2009年就推出了弹性MapReduce编程模型(Amazon Elastic MapReduce),用于大规模数据集(大于1TB)的并行运算。大数据技术曾有另外一个名字:协同过滤(Collaborative Filtering)。随着互联网公司纷纷加入,形成“大规模机器学习”(Large-scale Machine Learning)浪潮;接着,他们发现大规模已不足以形容数据之大,便加了个前缀“非常”(Very)。华为诺亚方舟实验室主任科学家戴文渊认为,当更多的前缀也无法描述数据之大时,业界开始将其视作“数据洪水”。2012年3月,美国政府发布《大数据研究与发展计划倡议》,宣布启动对大数据的研发计划。“大数据”这一简单朴素的称呼开始迅速蹿红,至此,更多国家和IT厂商从危机意识走向了价值发掘。

云图

云计算从一开始就是“拥抱大数据”的有效工具。李德毅打了个比方,如果数据是资产,云则是数据资产保管场所和访问渠道。大数据的处理和分析必须依靠云计算提供计算环境和能力,挖掘出适合于特定场景和主题的有效数据集。

作为较早认识到ICT价值的企业,华为在2010年底正式开始“云端漫步”,意在构建开放、融合的大平台,并提供兼容行业标准的应用接口。HCC2012以“精简IT,敏捷商道”为主题,表达了华为对企业需求的理解,并在大会上推出FusionCube一体机和OceanStor等高端存储产品。接下来的一年,围绕之前提出的Fusion战略,华为开始在发布的产品前冠上“最”字头:全球首个全分布式、性能最强的云操作系统FusionSphere3.0、性能最佳的FusionCube融合一体机V2.0等等。

华为的产品线逐渐清晰。华为轮值CEO徐直军介绍,公司主要聚焦在IT基础设施,基于开放的硬件、提供以软件为核心的数据中心解决方案。谈到FusionCube时,华为IT产品线总裁郑叶来说:“FusionCube是业内第一的虚拟化平台,”并两次强调,“没有之一。”郑认为,数字世界的发展正从各个方面重新定义IT,未来会有更多基于移动的数据消费、基于物联网的数据收集、基于大数据的数据分析以及基于云计算的数据分 享。

华为认为企业的IT消费模式正在悄然转变,以设备为中心的模式正转变为以应用和业务为中心,独立的管理和运营将向统一的管理运营转变。为此,华为推出了面向未来的SD-DC2,即业务驱动的分布式云数据中心架构。它将分别从云、大数据、管理几个层面帮助企业构建具备业务感知、商业智能和管理统一等关键能力的业务驱动的IT基础设施,同时保持开放和多厂商兼容,以应对变化和加速创新。

为期两天的HCC2014吸引了来自全球80多个国家、超过10000名客户、合作伙伴和业内人士参加

大数据的最终目的是在海量和快速增长的数据堆栈中挖掘、分析出有价值的数据,因而在数据存储与管理的基础上,还需搭载行业建模、数据挖掘、商业分析等软件。华为试图为客户提供整体的解决方案,实现从大数据基础架构到大数据处理和分析平台的贯通。IDC的相关分析报告指出,每个行业都有各自的业务模式,要想实现数据价值的最大化,必须要对行业应用有深入的认识。因此,要构建完整的大数据生态系统,华为需要与熟悉垂直行业的ISV(Independent Software Vendors,即独立软件开发商)进行更深度的合作。

这样的合作已然开始。在HCC2014上,7200平米空间分布着66家赞助商。在平面图上,包括英特尔、希捷、SAP、SAS在内的厂商标识在展馆内均匀分布,成古典花瓶的形 状。

德国队在巴西世界杯夺冠后,很多人将“大数据”技术视作其场上的“第12人”。这个技术就是德国足球联盟和SAP联手开发的应用——SAP Match Insights。该软件为运动员提供了训练的新技术,其运行在SAP HANA内存数据库平台上,能够记录球员跑动路线和传球路线,通过对这些数据的深度分析,可提高训练质量并制定高效的训练计划,从而帮助运动员提高成绩。而SAP和华为在这一技术方面的合作从2013年3月开始,华为陆续推出官方认证的SAP HANA一体 机。

华为认为,以大数据分析为核心整合起来的人类和机器智能,将重新创建和重新定义智能与智慧。在李德毅看来,未来的计算平台应该是以GPU为主的、GPU和CPU混合并行的结构。“大数据时代缺的不是数据,而是选择。”李补充说。