数据中心的IT运维不仅要对传统IT基础资源的运行状况负责,更要对承载于其上的业务服务运行的性能与质量负责。为此,数据中心应对运行于IT基础架构之上的业务系统进行有效监控和风险防范,从业务角度出发,以业务服务为中心,监控和洞察服务交付路径整体及各个关联节点的网络、应用服务的性能,并对现有运维流程进行优化,与传统的IT运维监控系统进行有机整合,改变当前的被动的、孤立的、分散的“救火队”式IT运维管理模式,不断提升管理和运维水平。
统一性能管理平台是为了能够建立一套完整的网络应用系统监控方法和流程,实现对关键系统端到端的应用性能的监控及相关的故障分析流程,在同一格式的界面和统一的指标上能够呈现不同的监控视图,供不同部门的人员协同分析自己关心的数据,快速进行故障的分诊和定位。统一性能管理平台是通过对网络性能和应用异常分析,查明原因并提供优化方案,保障网络及应用系统的交付能力。统一性能管理平台旨在以服务为中心,关注用户的满意度、业务的交易状态、各应用系统的服务质量、快速锁定影响业务的故障点,从业务角度出发去整体提升IT运维质量。
实时监控、主动预警:
通过采集分析网络中的流量数据,7*24实时监控用户的每次访问以及数据中心各设备之间的数据交互,任意用户、任意节点出现异常时,Netscout可主动发出预警&告警信息
Ø 从最终用户的视角,7×24小时监控各区域用户访问数据中心业务系统的实时用户感知,用户感知下降时,及时发出通知
Ø 基于历史数据动态调整告警基线,确保及时、准确的发出预警和告警信息。
端到端可视化分析:
Ø 基于业务系统的真实数据交互流量,自动生成该业务系统的端到端可视化拓扑图
Ø 实时统计分析各应用节点的网络流量、可用性、负载、性能、用户感知等指标
Ø 通过可定制化的Dashboard监控界面,直观的呈现业务系统各阶节点实时运行状态,异常时可基于Dashboard,“1分钟”快速定位故障域
交易监控与分析
Ø 基于用户业务系统的报文规范,订制专有的协议解码引擎,通过网络流量数据,实时计算出各业务的运行指标,实时交易量、实时交易性能、实时交易成功率、实时交易响应率等
Ø 用户可基于交易流水号、订单号、操作员ID等信息,快速检索出异常交易的原始数据
Ø 可基于流水号、订单号等关键字段,实现单笔业务追踪分析
故障现场数据回溯
Ø 设备提供大容量存储空间,循环滚动存储整个数据中心的网络报文数据,并自动建立数据仓库;
Ø 用户可基于时间、IP、端口、用户名等关键字段,快速检索出想要分析的数据
Ø 可提供实时数据抓取功能及历史数据回溯功能,回溯数据可以以报表及cap/pcap原始文件形式导出
数据包解码
Ø Sniffer专家解码系统,自动识别超过2000种协议的数据包内容解析。并自动进行故障判断,提供快速的会话、故障数据包筛选与过滤。
交易会话分析
Ø 30年的网络流量分析的技术积累,可支持2000余种协议的支持及会话分析。支持Web、Database、MQ、银联等专用协议。
Ø 支持多节点会话的关联分析,最多支持8个节点数据关联。
方案概述
流量汇聚交换机
硬件专用设备;该产品用于从数据中心的交换机上采集镜像流量,支持对镜像数据的汇聚、过滤、去重、脱敏等操作,将所分析的数据流引流至后端的数据分析探针。
流量分析探针
从交换机或者流量汇聚设备接收镜像流量,并对流量进行深度的可视化分析,分析内容包括网络层面、应用层面以及业务层面;数据探针具备大空间存储,长周期存储数据中心的应用交互数据,为容量规划及故障分析提供充足的可回溯数据支撑。
数据分析展现
nGeniusOne 系统,基于Web的统一数据展现平台,支持分布式部署,集中管理多台数据探针,提供基于业务流的自动梳理以及端到端可视化监控功能,智能的基线告警,提供准确的业务预警。异常事件发生后,nGeniusOne的会话分析引擎,将帮助用户快速的找到故障点。