IT 运维经理救赎日记 2:弄清挑战目标,有的放矢

讲述人:徐志韬,农发行辽宁省分行,信息技术处,高级业务副经理

    终于回来了!经过了半个月的脱产学习,总算基本掌握了总行的新业务系统。新系统虽然学起来也有些难度,但不用每日奔波于故障处理之间,其实内心来说是有一丝小轻松的感觉的,更不用说杭州西湖的美景美食,确实让人难忘。不过,在出差的这几天,下面几个兄弟可就辛苦了,特别给他们带了点明前的龙井,算是慰劳一下。

忙碌的现状何时是个头?

    回到单位简单问了一下这半个月的情况,因为人工管理的模式并没有改变,所以面临的困境依旧。各位同仁仍然扮演着救火队员的角色在各种非故障的报告、突发状况之间奔忙。同志们看到我,那种发自内心的激动(好吧,其实不排除是因为终于我回来帮忙了),让我觉得真有必要好好考虑一下如何优化我们的工作了。

    说到这里,我想起一个故事:一天动物园管理员发现袋鼠从笼子里跑出来了,于是开会讨论,一致认为是笼子的高度过低。所以他们决定将笼子的高度由原来的 4 米加高到 6 米。结果第二天他们发现袋鼠还是跑到外面来,所以他们又决定再将高度加高到 8 米。没想到隔天居然又看到袋鼠全跑到外面。

    看着焦急的管理员,长颈鹿和几只袋鼠们闲聊,“你们看,这些人会不会再继续加高你们的笼子?”长颈鹿问。“很难说”袋鼠说∶“如果他们再继续忘记关门的话!”

    很显然,事有“本末”、“轻重”、“缓急”之分,关门是本,加高笼子是末。我们希望优化工作方式,但应该先分析主要矛盾和次要矛盾,从重要的方面下手。应该先总结一下究竟面临哪些问题,再通过之前的小规模试用结果来验证是否解决了这些问题。以便确认这样的解决方案能否帮助我们把精力解放出来,真正用到像 BYOD、虚拟化、云计算、移动办公、新一代数据中心以及大数据等目前讨论得十分火热、代表未来趋势的技术上去。真正让 IT 运维可以做到帮助银行业务部门提升效率并形成更强大的竞争力,而不是一个被日常琐碎运维事件纠缠的网管部门。

理清思路,梳理挑战

    仔细想想,其实表面看我们面临的挑战主要是在人力上,我们有限的几个人,人工维护所有机关的 PC 显得挺吃力。但真的只是这样吗?不如先看看具体有哪些难题再说:

    首先是资产盘点,每年年底的这项工作可真是个体力活儿,分布在各个部门的几百台机器查证统计下来,跟和 LP 逛了一天街没啥差别。更不用说,还要检查和统计分行和支行的设备状况。

    其次是日常维护。上次我就说过,无法用言语沟通,只能出现场来解决各种误操作带来的小问题,虽然只是十分钟的事儿,但已经让人无语。而那些把系统彻底弄崩溃,捅了篓子后还装无辜的眼神,就更让你崩溃了。因为我们的系统重装可不能像家用 PC 那样随便,必须由我们工作人员来进行,并负责安装各种软件,并禁止安装像 QQ 这样的 IM 软件。重做系统所花的时间不少,而且对于各个办公室的人员来说,也耽搁自己的工作。

    第三是补丁更新安装。就目前我们的管理来说,生产网段的 PC 是全隔离的,基本不允许任何自行操作,所以出问题的几率也很小。而出问题最多的还是办公网段中的 PC。我们总共的有 200 台左右的办公网段 PC。之前当各种软件需要进行补丁更新时,我们只能通过人工来进行操作,在上下楼层的各个机关单位到处跑,基本上比资产盘点还累,因为你得一个一个操作,不是记录一下就走。不但如此,如果对方手上有要紧的工作要做,恐怕我们的维护还得为他们让路,毕竟我们 IT 管理是为人民服务的,必须得尊重他们的工作需求。

    第四是安全策略的组建。所谓的安全策略,简单说就是防病毒。过去的几年里,蠕虫、熊猫烧香等问题,都曾经在我们内部网肆虐过。后来干脆设置了内网防病毒服务器,并与总行的防病毒服务器互联,进行病毒库定期自动更新。然后每台办公 PC 再与内网防病毒服务器进行定期更新。但是这样的策略也不能充分防范病毒。因为你没法儿控制同事们不用 USB 接口往机器上 COPY 内容,而 USB 接口一向是各种病毒的最快、最直接的传播通道,一旦像蠕虫这类病毒在内网反复传播,要想彻底清除可就费劲了。在通过防病毒服务器对内网自身进行隔离之后,最好是能对 USB 接口再限制一下。

    仔细想想,其实我们碰到的最大难题就是上述 4 个,这虽然表面上看是人力不足的问题,但其根本在于没能实现自动化的远程管理模式。加人可以解一时之难,但领导其实很难同意添加编制,提高人力成本。向领导汇报的要点应该落在自动化上,通过高科技的手段来提升生产力和效率,这才是一劳永逸的方式。

了解新技术,提高 IT 运维效率的项目

    之前我们的软件服务商通软公司曾经向我们介绍过基于 Intel 博锐技术的通软™ 远程管理解决方案,我们也小批量采购并激活。通过通软™ (英特尔® 博锐™ 技术)中国解决方案中心的技术指导,初期的体验是工作强度下降了,因为有些不需要到现场了,通过技术可以远程解决。这无形中就给我们解决了很多问题,以前要有修复系统的时间,人力会很麻烦,重装系统,哪怕用 DOS 也需要恢复一段时间,所以博锐技术的远程管理的确是很方便的。不过,因为平时太忙,其实对它的了解还不够深入。接下来看来我的工作重点就应该是仔细了解博锐技术,研究一下它究竟能给我们的工作方式带来怎样的变化。或许,过段时间我就该考虑去跟领导提出进行大规模测试。在我的心里,IT 管理一般有散乱、管理和高效三个阶段,希望博锐能让我们完成从管理到高效的转变!