您的位置: 网界网 > 周报全文 > 正文

[周报全文]未雨绸缪,防患未然—浙江移动携手惠普软件主动监管IT运营

2010年04月20日 13:46:31 | 作者:CNW.com.cn | 来源:网界网 | 查看本文手机版

摘要:惠普的专家认为必须对业务系统等进行主动监控管理,优化关键业务服务的可用性和性能,在问题发生之前及时应对并解决问题,及时采取有效的措施,从而提升用户的满意度。

标签
惠普
IT运营
浙江移动
主动监管

【CNW.com.cn 专稿】浙江省作为全国的经济大省,移动用户数量已突破4000万,网络规模和客户总数连续八年位居全国第二位,形成了全球通、神州行、金卡神州行等品牌系列。为了在竞争中保持领先地位,同时不断扩展业务,中国移动浙江公司(以下简称浙江移动)的IT系统运维承受着巨大的压力。“千里之堤,溃于蚊穴”。任何一个小问题都可能降低客户体验,进而造成客户流失。

传统的BOSS监控仅能简单收集主机、数据库的参数状态,没有一种好的BOSS系统运营评价机制,没有能力提前“预知”故障的发生,未能从业务应用的整体有机的进行监控和管理,导致整个IT运维团队成了消防队,疲于被动应付各种突发事件,客户体验难以从根本上得以改善。

主动出击,全面监控

惠普的专家认为必须对业务系统等进行主动监控管理,优化关键业务服务的可用性和性能,在问题发生之前及时应对并解决问题,及时采取有效的措施,从而提升用户的满意度。惠普的业务可用性中心提供了全面业务服务管理:包括端到端应用响应时间测量、SLA( 服务水平协议)监控和报告、基础架构事件管理、IT 服务依赖性视图等。尤其值得一提的是惠普终端用户监控器(HP End User Monitor),这有助于应用专家利用Web 界面,快速锁定问题,解决问题。

惠普从业务感知角度出发,以业务拓扑模型为核心,依据业务建模、数据聚集、告警管控和界面展示四个层次来实现IT运营管理,从而让浙江移动的业务、应用、各类平台资源等IT运营管理要素全部覆盖于BAC系统。这样,浙江移动通过惠普的终端用户监控器监控网上营业厅、BOSS等系统,不仅得到了综合业务视图,同时还可以得到关键性能指标(KPI)的趋势分析、历史数据展现、图表等。

客户体验:问题消弭于无形

惠普软件业务可用性中心给浙江移动带来的价值是多方面的,具体而言集中在以下几个方面:

解决业务监控盲点 对渐进式的业务故障提升趋势预警能力,做到及时发现、尽早解决,降低对业务的影响。比如,某日从0:30分开始,前台充值卡、现金和505充值的业务探针出现多次超时,时长达35秒(正常应小于1秒),平台生成趋势预警。值班人员据此检查这几个业务共用的充值数据库的性能,发现某个定时任务出现了挂起,并不断消耗数据库性能。经过紧急处理于凌晨3点50分排除故障隐患,避免了充值业务中断。

快速定位故障环节 显著缩短故障处理时长。平台运行以来,故障平均处理时长缩短18%。比如,营业员投诉积分商城访问慢且易失败,通过业务探针的耗时细分(+本站微信networkworldweixin),发现在非工作时间业务快且稳定,而工作时间的网络建立连接时间很长,随后深入分析网络连接时长并结合外网业务探针,定位故障根源是内网代理服务器在工作时间内带宽不足。

业务全景展示分析 自动生成分析报告,切实提升运维管理效率。浙江移动IT运营管理平台还包括了一个基于BAC产品之上的门户,这个门户还被投射到监控室的超大屏幕上。通过这个门户,IT管理人员能从直观的仪表盘上看到业务可用性、健康度等关键指标的实时信息;监控人员能够通过仪表盘以及业务全景视图功能清晰看出不同的业务是如何被IT资源支撑起来的。

项目试运行以来,月均成功预警业务问题29次,预警有效率和覆盖率均达到96%以上,预警时间点比传统模式告警和客服报障平均提前42分钟,每月减少BOSS核心系统故障11分钟。通过业务故障快速定位,使业务故障处理时长平均缩短了42%。充分实现了提前预警避免故障为主,故障发生后快速定位、修复为辅的项目目标。

浙江移动负责BAM建设的项目经理唐涛表示:“在惠普的帮助下,我们建立了IT运营管理平台。通过运行报告和数据,我们发现平台提供了有效的业务预警和告警,能够帮助运维人员快速发现并定位故障,并能够面向各类人员提供不同的分析展示界面,这都使员工效率和客户满意度得到了提升。”

[责任编辑:程永来 cheng_yonglai@cnw.com.cn]