遵义商行系统迁移:至强驾驭关键业务应用

IT168

    随着云计算的不断发展,IT 系统逐渐演变为“同构融合、异构水火”两分天下的局面。企业用户往往拥有两个资源池:关键核心应用多数由 non X86(也就是传统的 RISC 小型机)系统承担,X86 平台则承担周边非关键业务应用。由于架构不同,所使用的指令集不同,这两个硬件的资源池是相互独立、无法整合。

    然而,随着英特尔处理器性能不断提升,X86 系统稳定性及可用性也大幅提高,整体云计算架构也日趋成熟,X86 系统已经吸引了大量的企业关键业务应用从 RISC 平台迁移过来,遵义市商业银行就是其中的一家。

遵义商行成长的烦恼

    遵义商行是遵义地区存贷规模最大的金融机构,2008 年末,资产总额就达到了 99 亿元,2010 年末则突破 200 亿元,发展速度十分迅速。据了解,在遵义市商业银行内,中小企业及个体工商户贷款占全部贷款额的 50% 以上,本地城区中小企业在遵义市商业银行的开户数占工商注册数的 70%,对当地经济建设有着直接的支持,并在地区金融体系中占据重要位置。

    由于银行核心业务系统往往要求较高的处理性能、IOPS 和可靠性,服务器采购也一直以 RISC 服务器为主,偶有采购的 X86 服务器一般用于办公等外围应用,甚至水电缴费等外围业务系统也采用 RISC 服务器。

    遵义商行也采用了类似的 Risc 架构,“遵义商行以前的业务系统主要部署在由两台 IBM P590 小型机构成的数据库双机环境中,核心交易系统数据库存放在后端的直连存储系统里,各类应用系统主要部署在 x86 服务器平台上。” 遵义市商业银行 CIO 兼科技部总经理王勇谈到。

    随着遵义商行逐步发展,老系统在性能、安全等方面都碰到了一些瓶颈和挑战,最终遵义商行决定针对整体系统架构进行一次大的升级改造。“我们综合考虑了性能、可靠性、应用灵活性、人才资源和成本多方面的因素,最终才考虑将核心业务应用迁移到 X86 平台。”

    据介绍,遵义商行原先的应用系统和数据库都部署在物理机上,不仅存在单点故障隐患,而且设备、能源效率低下。核心数据库系统采用的是 HA 双机方案,存在存储层的单点故障,而且所有硬件设备都在同一个机房内,一旦有意外事故发生导致该机房不能使用,那么银行整个数据会丢失。

    应用方面,原有的小型机系统属于紧耦合系统,要开发一个新的业务,需要牵扯到数据库结构、索引、人际界面等多方面因素,银行创新业务又非常多,开发周期慢不能满足快速变化的市场需求。“我们现在是用 SOA 的架构规划业务系统,有几个框架来规划我们的业务,可以把存款、交易、中间交易分成几个不同系统,然后相互之间联系可以规划成相同的标准,这样人机界面、数据结构、数据层都很容易实现统一了。”王勇谈到。

    人才方面,基于 Risc 架构的应用开发需要专门技能的人才,而在贵州遵义,这类型人才极其缺乏。当系统迁移到 X86 标准化平台后,在人力招聘、培训方面的成本都大大降低了。资金成本方面,王勇介绍,应用 X86 平台+虚拟化的私有云解决方案的投入成本大约在 600 万左右,而应用 IBM 小型机实现相当的效果则需要耗费 1800 万左右,仅仅相当于小型机方案的 1/3。

数据说话,X86 平台 PK 小型机

    对银行系统来说,在核心数据库系统采用 X86 服务器少有先例,为了稳妥起见,遵义商行决定先进行实用测试。

    实用测试主要针对数据库系统性能展开,具体的测试计划是,通过运行银行的实际业务,评比基于至强 E7 处理器的浪潮 TS850 八路服务器的系统性能与目前在 IBM 小型机 P590(8 socket)的系统性能的高低。

    该测试是将银行的核心交易系统的部分业务,封装成存储过程,然后在客户端提交存储过程,在主机端进行性能监控,以业务的最终完成时间和并发处理的个数作为评价的标准。测试的架构图如右所示:

    结果,经过多轮测试,结果如下表所示,TS850 的实际应用性能相当于 IBM P590 的3-5 倍,大大超出了预期。而且在整个测试过程中 TS850 的 CPU 利用率大部分维持在9% 左右,最高峰值是 17%,但是持续时间比较短,磁盘 IO 维持 1%左右,属于轻载运行。以遵义商业银行目前的业务增长速度,TS850 的系统处理能力足以应对该行未来两年的业务增长。

测试结果对比表

浪潮 TS850

IBM P590

结息过程需要 17 分钟左右

结息过程需要 1 个小时左右

更新过程需要 8 分钟左右

更新过程需要 25 分钟左右

更积数处理需要 2 分钟左右

更积数需要 10 分钟左右

加载 67 万条记录需要 1 分 25 秒

加载 67 万条记录需要 8 分钟

 

关键业务应用的坚实平台

    遵义商行的测试结果清楚表明了 X86 平台已经有足够能力担当关键业务应用,应用Xeon E7540 处理器的浪潮天梭 TS850 服务器在测试中表现出了超出小型机的事物处理性能。

    传统来说,小型机一直把持关键业务应用领域的杀手锏在于性能和可靠性。然而随着英特尔处理器技术不断提升,X86 处理器表现出了越来越强劲的性能和让人信赖的可靠性。

    Xeon E7 系列处理器是英特尔于 2011 年推出专门针对关键业务应用的系列处理器,是至强 7500 的继任者,在技术上不仅提升三级缓存容量到 30MB 以及集成内存控制器数量达 32GB,同时在虚拟化方面,具有增强的虚拟化支持,将有效提升虚拟机的切换速度,并加入 Real mode 功能、减少延迟和响应时间以及 RAS 特性等方面改进。

    可靠性方面,英特尔 E7 拥有 20 余条 RAS 特性,主要表现在三个方面:保护业务数据、增强可用性和最小化停机时间。而需要支撑关键任务的系统一般都要具有以下几个特点:在可靠性方面,系统要可以容忍多种族间的故障和错误;在可用性方面,系统需要在出现故障时应用仍然可以被访问;在可服务性方面,系统可以被监控、自我修复以及提示警告;在可扩展性方面,系统可以扩展性能来满足业务的需要。

    性能方面,至强 E7 处理器最多可集成 10 个支持英特尔超线程技术的内核,相比英特尔至强 7500 系列处理器,其性能提升最多可达 40%。在科研和金融服务等领域,能够大幅提高其关键业务应用的运行速度和精确度;它运行虚拟机应用的性能比前一代产品提升 25%,这意味着它拥有业界最高的虚拟化性能表现。至强 E7 处理器包含了 18 个面向双路、四路和八路服务器的产品,经过扩展最多可以支持到 256 路服务器。一套采用 E7 处理器的四路服务器最多可以支持 2TB 的内存容量。

    此外,谈到应用 X86 服务器担当核心业务应用的可靠性问题,遵义商行的王勇有独特的见解:“整个系统的风险可控性,不能依靠某一台机器的安全性,而是整体方案的可靠性。”遵义商行的系统方案就从两台小机互为热备的保护方案,转移到了综合数据库、双机、灾备中心、虚拟集群多个层面安全保护的 X86 业务连续方案。

    “以前我们的数据库实际上只实现了单层保护,现在我们的架构是四层保护措施。以前我们是 1+1,现在我们变成了 N+N。”王勇谈到。

整体方案保障系统可靠性

    遵义商行最终采用的是以四台浪潮 TS850 八路服务器为核心的整体“金融云”解决方案,共分为业务逻辑处理层及数据存储处理层两层构架,其中业务处理层主要处理核心交易系统及外围系统业务,数据存储层主要部署银行的核心业务数据库。其拓扑结构如左图所示:

    可靠性方面,遵义商行以前的系统是两台小机互为热备的保护方案,现在遵义商行的整体保护体系则更为复杂和立体。遵义商行在数据库层面使用了 IBM DB2 数据库自带的高可用灾难恢复工具,主服务器上的数据发生任何更改的同时,系统自动的通过日志同步另一台服务器的硬盘数据;第二层数据保护则是同城容灾中心,当主生产中心数据更新的同时,对灾备中心数据实现同步镜像。

    第三层保护措施则是双机热备,不过王勇提到传统的双机热备系统过于依赖硬件,事实上发生故障的几率很大;第四层保护措施则是虚拟机,实际上实现了另外一个层次上的热备,也就是说,在硬件的数据库服务器出现故障后,还可以启用虚拟机数据库服务器。通过不同层次的系统保护措施,现在系统可靠性已经远远高于以前仅仅依赖双机设备了。

    承担遵义商行私有云基础设施的浪潮 TS850 八路服务器实际应用性能相当于 IBM P590 的 3-5 倍,性能已经大大超出了遵义商行原有的预期。在前期业务压力的测试过程中,浪潮 TS850 的 CPU 利用率大部分时间维持在 9%左右的水平,最高峰值是 17%,但是持续时间比较短,磁盘 IO 维持 1% 左右,属于轻载运行。

    该套 X86+ 虚拟化系统上线后,不仅仅改变了原有的业务系统封闭、僵化的格局,提升了系统灵活性和可靠性,在处理业务的性能方面也获得了不小的提升。王勇表示:“原来我们跑一次利息结算需要半小时时间,更换到新的系统上之后,进行一次利息结算只需要 6 分钟。”1

产品和性能信息

open

1. 媒体文章均为第三方观点,仅供参考, 不代表英特尔官方观点。