随着信息化建设步伐的加快,大量的日常工作和业务由信息系统承载,提供高效、便捷的服务,服务同时伴随着安全保障的要求越来越高。
为保障信息系统的安全稳定、绿色健康运行,提高信息系统安全稳定运行的监控预警能力,保障互联网业务系统正常运行,需要建立XXXX综合监控平台,主要以主机监控、网络监控、业务系统监控及其基础设施环境监控为主的信息系统健康状态监控预警应急响应平台。
实现对信息系统的可视化管理,提高信息系统的性能检测、分析和故障定位能力,实现对信息系统的全生命周期管控,构建统一的监控预警工作界面。
随着信息化建设步伐的加快,大量的日常工作和业务由信息系统承载,提供高效、便捷的服务,服务同时伴随着安全保障的要求越来越高。
为保障信息系统的安全稳定、绿色健康运行,提高信息系统安全稳定运行的监控预警能力,保障互联网业务系统正常运行,需要建立XXXX综合监控平台,主要以主机监控、网络监控、业务系统监控及其基础设施环境监控为主的信息系统健康状态监控预警应急响应平台。
实现对信息系统的可视化管理,提高信息系统的性能检测、分析和故障定位能力,实现对信息系统的全生命周期管控,构建统一的监控预警工作界面。
网络监控模块实现对网络基础设施环境性能的监控,定时采集网络性能信息,及时发现那些可能会导致服务质量出现明显下降的情况及故障隐患,并通过告警阀值设置,实时显示告警等,主动预警隐患,通过报表等工具进行网络环境性能统计、性能趋势分析,为网络排错、网络优化、网络改造等提供依据。
根据网络监控对象,网络性能可分为网络设备性能、重要网络链路性能等,网络性能主要指网络设备的CPU利用率、内存利用率、网络负载均衡设备的流量、重要网络链路的带宽利用率、丢包率、错包率、CRC校验错误包率等。
对设备网络性能的监控手段,主要是通过SNMP协议和TCP,IMCP协议采集设备网络性能,设定网络性能阀值,产生设备网络性能监控报警,对整体运行环境进行预警并通过短信事实发送给接收人。
主机监控模块主要对主机的运行状态,CUP、内存、网卡等硬件使用和分配状态进行实时监控,实现对服务器系统的基本信息和运行状态的监控,包括AIX、SCO UNIX、LINUX、Windows和HP-UX等操作系统的各种版本。
虚拟化环境监控管理包括对主流的VMware ESX、XEN Server虚拟化环境的运行状态、虚拟机环境状态、虚拟网络状态进行监测。
服务监控模块主要对中间件和应用监控,包括应用系统中使用的各类中间件和应用服务,能够监视中间件系统和应用服务的基本信息和运行状况。
能够动态收集应用性能数据并通过界面展现,可以对任意关键性能监控对象定义告警阀值并根据阀值提供不同的监控展示方式。可以根据不同情况设置不同报警级别和预警阀值。
能够对J2EE管理、 MQ Series管理、Lotus Domino/Notes管理、Web管理、应用服务管理等中间件系统监控管理。
数据库监控模块主要包括各重要应用系统中使用的各类数据库,能够监视数据库系统的运行状况和性能情况,能够支持各种主流数据库,包括DB2、Sybase、SQL Server、Domino、Informix和MySQL数据库。
对数据库的监控主要采用基于代理的监控架构,能深入获取被管理对象的信息。可以预设性能门限阀值,当参数达到门限值时,通过事件管理自动告警,以便及时采取措施。
网站监控模块主要对网格中的Web服务器进行监控,包括监控Web服务器的性能、可用性和利用率、连接数等数据。
信息统计模块对各类报警进行收集,统计、分析,如可以按年、月、日进行主机、交换设备宕机率分析,最终可以得出网络或服务器等健康状态。可通过温度报警日志进行分析得出空调状态等。
报警管理模块支持多种的报警模式,短信、邮件、微信。当所监控的设备出现问题时,可以根据问题等级的不同通过不同的颜色显示在监视端,并有语音报警,所能管理的事件等级应不少于4级,既(正常、宕机、未知、恢复)对于事件管理可以方便的扩展,并可以自定义事件的等级和对应等级的报警颜色。事件的报警还应可以通过邮件、短信等方式通知对应的管理员,并可以根据管理员的设定。
机房的安全运行至关重要,机房环境监控模块有以下七部分构成:
实现对中心监控大屏的投放,支持业务服务视图展示、自定义视图展示。通过统一的展示功能,综合反映整个IT系统运行状况和运维服务管理情况,有效展示内部的IT资源运行状况、性能状况、服务工单情况等,使维护人员、普通用户和管理人员能迅速了解自己所关心问题的情况。
手机移动端展示:主要功能(1)查看主机报警信息(2)环境报警信息(3)各类日志信息以及设备状态(4)日志流信息(5)出口流量状态(6)温度、流量曲线走势图(7)市电状态(8)烟雾报警状态(9)机房渗水报警(10)动力电监控
综合监控平台的部署方案通常采用综合监控平台一体机部署方式,集成了综合监控管理平台服务器和数据采集探针引擎,在数据中心部署一台综合监控平台一体机,同时负责侦听和解析网络报文,并将采集数据上报到综合监控管理平台服务器。
对于网络较为复杂IP目标不可直达的网络环境下,可采用分布式部署方案,在各分支部署一台用于数据采集的现场探针,定期模拟服务使用以探测服务可用性和性能,并将侦测结果数据通过HTTP协议上报到综合监控管理平台服务器。