透析大数据负载平台与技术现状及趋势

ZDnet

    在上一篇文章中,我们结合 ZDNet 发起的中国大数据认知与应用市场调研,从全局的角度对基于中国不同地域以及不同行业对大数据的认知和关注程度进行了扫描,并从中看到了 x86 架构作为大数据基础平台的接受度以及发展潜力。本文将在上一篇的基础上,结合数据库应用和相关技术对调研报告进行解读,并从中总结几大发现和结论。

一.对大数据分析和存储的需求旺盛

    调研的数据显示,除了已经认知到大数据具备容量大、产生速度快、数据类型多的特点,包含非结构化和半结构化数据之外,更多的企业还会联想到数据存储和数据分析等大数据处理技术,不难看出在对大数据认知的基础上,企业对大数据分析处理已经表现出强烈的渴望和兴趣,并极有可能将其作为企业的一项重要 IT 规划。

二.x86 成数据库应用主流平台

    虽然数据具有多种来源,但是毫无疑问,数据库是企业数据的首要来源,构建数据库、数据仓库以及商业智能分析平台也是迎击大数据进程中极其关键的一环。在数据时代,数据库应用无疑也是企业的核心应用之一,从企业现有数据库平台来看,有 72.93% 的企业目前的数据库应用基于 x86 平台,只有 20.79% 的企业将现有的数据库应用基于安腾、SPARC、POWER 等 Unix 系统。

    从现有数据库平台来看,x86 架构已经获得了企业的广泛认可和信赖,良好的“先天优势”为 x86 应对大数据挑战时发挥重要作用埋下了伏笔,随着在数据库等关键应用领域性能的进一步提升,x86 平台在数据库领域的应用还将更加广泛和深入。

    同时,在构建数据仓库、商业智能方面,调查的数据也与企业现有数据库应用负载主要平台保持一致,其中有 82.99% 的企业倾向于选择 x86 平台来构建这类数据分析与商业智能应用,具体而言,有 48.99% 的企业倾向于采用四路及以上 x86 服务器,有 34% 的企业倾向于采用双路 x86 服务器,这也与四路或以上的高端 x86 服务器的定位相匹配,近几年越来越多的四路及以上高端服务器开始进入数据库、虚拟化等企业关键应用,并获得了企业的广泛认可。

三.Hadoop 广为接受

    与现有的传统结构化数据处理不同,大数据处理将涉及到海量的非结构化和半结构化数据处理,在这种处理场景中,针对传统结构化数据处理的技术和方法显然难以应付,也正因为如此,越来越多的大数据处理技术开始涌现,并获得企业青睐,比如时下火热的分布式运算系统 Hadoop。值得注意的是,Hadoop 的诞生本身就与 x86 平台有着极为密切的关系,也正是 Hadoop 的诞生才使得在低成本的通用硬件集群上运行分布式计算框架成为可能,从这个角度上来说,Hadoop 本身就是为 x86 平台而设计并优化的。

    Hadoop 最早是一个开源的框架,并由 Apache 基金会开发,其重要创新是将任务分解并运行在多个节点中处理,当数据量大到无法在一台服务器上处理时,分布式计算的优势就体现出来,此外,通过将这种技术与 Linux 服务器结合还能以极高的性价比替代大规模计算阵列。也正是看到了 Hadoop 未来应对大数据的潜力,不少组织和供应商开始着手发展 Hadoop 技术,并形成了一定规模,英特尔就是其中的代表。

    作为 x86 平台的推动者,英特尔显然已经预见到 x86 平台与 Hadoop 技术结合在应对大数据方面能释放的巨大威力,并在 2012 年 7 月正式发布了 Hadoop 发行版,借助软硬组合迎击大数据,在短短半年时间里,Hadoop 发行版已经获得了市场的高度认可,在针对 Hadoop 版本的认知调研中,英特尔 Hadoop 发行版就以 44.02% 的占有率成为企业最关注的 Hadoop 版本,由此也可以看出除了硬件平台,英特尔在大数据软件平台方面同样受到推崇。

四.大数据平台方案面临的挑战

    随着越来越多的企业关注大数据,并最终将构建大数据平台作为企业的 IT 规划,一场大数据平台和解决方案的选型已经不可避免,通过调研,在平台和方案的选型中,企业最关注的前三大因素依次为:性价比、安全性、稳定性,很明显,更多的企业既希望部署大数据平台来应对数据增长的压力,同时又担心对大数据平台的投入带来成本上的压力;此外,数据安全和隐私一直是数据处理的巨大隐患,企业对大数据处理的安全性的担忧也源于缺少专门用于保护企业数据隐私的数据安全标准和特定技术;对稳定性的关注程度位于性价比和安全性之后,不难看出企业对通用硬件平台稳定性的担忧其实已经有所下降,这也与 x86 平台近几年的性能提升不无关系,同时 x86 平台与 Hadoop 的结合也为处理大数据提供了更为低成本的选择。

五.对大数据技术供应商的认知

    如果从数据库负载平台和相关技术的认可度能从侧面反映出 x86 架构在应对大数据方面的技术实力,那么对大数据技术供应商的认知则表现的更为直观,其中有 19.42% 的用户认为英特尔与大数据密切相关,其接受度超过了 IBM、甲骨文、微软等 IT 供应商,可见英特尔作为一个大数据技术供应商已被广泛认知。

    随着大数据时代的来临,以数据为中心的应用无疑是核心所在,企业将更加重视数据的存储、分析以及管理,基础设施能否满足大数据环境下的扩展性并提供出色性能无疑是一大挑战。英特尔作为大数据技术供应商被广泛接受,一方面与英特尔近几年在大数据领域的宣传攻势密不可分,但更重要的是作为数据中心基础设施的供应商,英特尔在数据分析和存储的能力已经不容置疑,在大数据的全新浪潮下,英特尔也正着手推动数据中心基础设施向着大数据平台演进,此外,在对 Hadoop 功能的优化和扩充之后,英特尔也积累了 Hadoop 应用的最佳实践经验,在应对海量数据和非结构化数据处理方面无疑更加游刃有余。1

产品和性能信息

open

1. 媒体文章均为第三方观点,仅供参考, 不代表英特尔官方观点。