服务周期1年,适用监控300-1000节点的客户,主要应用于基础设施运维保障场景。资源节点数量为客户端网络、安全、服务器、存储、数据库、操作系统等可被监控IT资源总和,其中无线AP数量按1:20比例折算;主要服务内容:IT资产监控与刷新、无线网络监控与刷新、告警策略定制及优化、网络配置备份与异常提醒、7*24H云端值守及告警通告、校园业务系统可用性探测、关键资源健康巡查、云服务报告、运维信息可视化展示、IT运维服务成果及改进,以及配套使用的智能运维管理平台。 服务内容要求: 一、日常运行保障需求: (一)实时监控包括不限于网络设备、无线设备、数据库、操作系统、中间件、web应用、存储、虚拟化、硬件服务器等组织全部可网管IT资产的运行状态和性能,确保运维团队对IT资产状态和性能实时可观测; (二)服务商应提供专属运维管家和管家群,需针对我校关键设备、关键区域进行7*24小时不间断保障值守,当出现故障或重大风险时进行初步确认,并第一时间通报我校网络中心人员,早发现早修复。须针对此项提供专项承诺函,格式自拟。 (三)服务商应提供关键设备状态和性能的巡检服务,每天最少完成一次巡检并将结果通过我校网络中心人员;如果发现异常,需要进行初步确认后,第一时间通报我校网络中心人员。须针对此项提供专项承诺函,格式自拟。 二、运维数据统计与展现需求: 服务商需按周输出服务报告,统计包括资产变更情况、运维事件态势、告警闭环处置及协查跟踪以及监控工具整体运行情况等。每周一次,确保运维团队对关键事件可跟踪、运维变更记录可追溯、运维基本态势可感知。须针对此项提供专项承诺函,格式自拟。 配套运维管理平台要求: 一、运维工作台: (一)系统需支持以下需求: 系统出厂需要内置运维工程师、运维管理员的工作台页面,让这两个角色的用户进入系统后就自动拥有工作台页面,无需每个用户手动添加。 (二)系统应能具备灵活的详情自定义能力,能提供资源详情定制工具,并可将页面发布到任意关注的资源类型中,实现不同资源可关注到不同的内容,而不是所有详情都一样无法灵活定制。 二、资源监控 (一)支持通过SNMP自动发现各类主流网络设备(支持IPv6地址),包括锐捷、华为、H3C、CISCO等主流厂商的的路由器、交换机、防火墙、负载均衡、VPN等设备,监控能力包括:ping状态、ping延时、SNMP状态、CPU利用率、内存利用率、端口状态、端口速率、端口带宽利用率、端口丢包率、端口错包率、广播包速率、总流量、上行流量、下行流量、板卡、光模块、风扇、电源等运行状态和指标。 支持通过HTTP发现锐捷极简光交换机,监控能力包括:ping状态、CPU利用率、内存利用率、端口状态、端口速率、端口带宽利用率等指标。 (二)支持通过SNMP、ICMP协议对无线设备的性能指标监控和告警,包括锐捷、H3C、华为、信锐等主流厂商的无线设备;监控能力包括但不限于:ping状态、ping延时、SNMP状态、在线终端数、终端饱和度、在线AP数、离线AP数、AP在线率、AP在线状态、AP总速率等运行状态和指标。 (三)当某个资源出现告警时,可以通过系统在一个页面内集中查看资源的相关信息。 (四)能够查看当前资源的所有相关详细信息,包括但不限于资源的告警、拓扑、组件及指标。 三、资源发现 (一)1.应满足自动网络拓扑发现要求,支持对主流厂商网络设备(包括IPv4和IPv6地址)的自动识别;支持操作系统(包括IPv4和IPv6地址)资源、数据库资源、应用&服务资源、虚拟化资源以及中间件资源的自动识别;支持对锐捷极光设备纳管,并能够通过新增模型增加可发现资源类型; 2.支持识别资源的内部组件及关键属性,以及识别资源内外部的关系变化并有明显的提示; 3.应支持通过文件导入方式,实现不同类型资源批量一次性发现,以方便运维人员能够快速完成监控平台初始化工作; 4.支持对已监控设备进行网络链路的补充发现,以方便运维人员及时发现网络链路的变化,保证拓扑数据的准确性; 5.为了能够适应设备接口不同的监控需求 ,可根据接口不同状态配置加入监控的规则。 (二)1.系统应支持周期性的扫描发现能力,通过周期性发现新增了哪些设备、哪些设备的属性发生变化、哪些设备已离线; 2.支持按照一次、每天、每周、每月设置,并可以配置固定时间及重复时间,并在任务执行完成后,支持查看发现结果; 3.当系统发现新的网络设备后,应支持自动将新发现的网络设备及链路添加到对应的拓扑图。 (三)系统应能支持自动识别能力,包含以下内容: 1.应能基于操作系统的进程监听端口和命令行,通过匹配规则,自动识别出中间件与数据库; 2.应能支持自定义匹配规则,增加识别的准确度和多样性; 3.应能根据识别出的结果,直接发现需要纳入系统监控的资源。 四、告警中心 (一)系统应能支持多种条件的组合方式,即能支持且、或的条件运算符,复杂的条件组合能力。 (二)系统应能支持基于单资源多指标、多资源多指标、指标与属性同时判断告警条件。 (三)系统应能支持提供原因、影响和相关性的分析数据,包含以下能力: 1.应能基于故障资源的CMDB关系,自动分析引起当前故障的关联告警作为可能的原因,也可基于经验值,自定义可能原因的分析说明。 2.应能基于故障资源的CMDB关系,自动分析当前故障影响的其他资源范围,也可基于经验值,自定义影响范围的说明信息。 3.应能支持自动显示故障资源上下层关系图,默认显示一层,可基于该资源展开到最多5层的关系图,可查看1~5层内与当前故障资源有关联的其他资源是否存在异常。 4.应能支持根据故障的不同原因,自动显示处理建议,同时支持自定义处理建议的内容。 (四)系统应该支持分时段告警规则的设置和告警级别变化,包含以下能力: 1.支持分时段阈值的告警规则设置,即根据策略所选的时间不同时间范围,可支持设置不同的阈值,以满足不同时间对于指标判断的条件不一样的情况; 2.故障的严重程度可能会由于指标值不断的递增或递减而进行变化,因此系统应支持根据指标值的变化来配置告警级别的变更。 五、网络拓扑 (一)为了让运维人员方便快捷的进行网络设备的管理和其拓扑图的配置,系统需支持以下需求: 1. 通过SNMP协议自动发现、识别包括路由器、交换机等各类网络设备或组件; 2. 运用智能拓扑算法,自动绘制完整的网络拓扑结构图。 (二)为了降低拓扑图配置的工作量,需要支持以下需求: 1. 支持通过多种模板创建多样化、层次化的拓扑图,其中需包括分层拓扑、分区拓扑和空白拓扑,且不同模板之间能够方便快速的进行切换; 2. 在分层拓扑中,需支持快速调整分层数量,且增加分层后原有资源节点相对位置等比变化; 3. 在分区拓扑中,需要支持区域根据其中的节点自适应调整大小,保持所有区域中的节点始终在区域中。 (三)为了方便设备在一张拓扑图中统一管理,查看拓扑图时,需支持将不常关注的资源合并展示: 1. 支持将资源节点放于区域中展示; 2. 支持将区域收起展示,支持区域的节点一并收起展示; 3. 区域收起展开时,需支持区域外资源节点在拓扑图上的展示位置不变; 4. 区域内的资源/链路的告警和风险提示展示于收起区域。 (四)为了方便网络管理人员选择最合适的拓扑图风格和展示样式,满足拓扑图的多种展示效果,需要支持以下需求: 1. 所有拓扑的全套默认图标的一键切换; 2. 拓扑图整体样式风格一键切换。 六、关键链路监控 (一)为了能够全面、准确的感知到关键链路的运行状态,系统需具备以下能力: 1.支持获取关键链路的运行性能数据,如带宽利用率、源/目的端发送丢包数、源/目的端接收错包数、发送/接收速率等指标; 2.支持获取关键链路端到端的运行状态,如端到端的ping时延、端到端ping丢包率、端到端ping抖动等关键指标。指标数据计算需要排除采集点到链路两端的内部网络影响。 (二)为了能够灵活管理关键链路的监控方式,系统需具备以下能力: 1.支持通过多种协议监控关键链路,包括但不限于snmp、icmp、remoteping等标准协议; 2.支持灵活配置关键链路端到端的探测参数,如探测的频度、探测包的大小、探测包个数等; 3.为确保链路故障能够及时发现,应支持以最小10秒一次的探测频度进行信息记录。 针对以上(二)提供具有CMA标志的第三方权威机构出具的检测报告证明。 (三)为了让运维人员能够方便且全面的获取到关键链路日常维护的相关数据,需要展示以下内容: 1.展示链路基本信息及关键的运行指标数据。 2.展示两端接口错包、光模块、带宽箱线图数据。 七、无线管理 (一)为了及时感知无线设备的运行状态,快速识别异常并恢复,以保证终端的正常上网体验,系统应具备以下能力: 1.支持通过SNMP、HTTP、ICMP协议对无线设备的性能指标监控和告警,包括锐捷、H3C、信锐、华为等主流厂商的无线设备;监控能力包括但不限于:ICMP状态、ICMP延时、SNMP状态、在线终端数、在线AP数、离线AP数、AP在线率、AP在线状态、Radio状态、当前信道、端口状态、端口速率等运行状态和指标。 2.系统应支持设备离线等严重故障的秒级告警。 3.为快速恢复设备的正常运行,系统应支持对AP、智分主机、微AP等无线设备进行一键重启。 4.为分析设备负载,系统应能准确统计每个设备的在线终端数,并按照2.4G、5G分别统计分析。 5.系统能够按照不同位置对设备进行划分,并统计每个位置的设备运行情况、在线终端数量,以识别设备运行质量差或负载高的区域,进行针对性优化。 (二)系统应能够记录每个无线终端的上网情况,并支持通过账号等信息快速定位终端及终端关联设备,以便进行终端故障分析。系统应具备以下能力: 1.能够统一查看华为、H3C、锐捷、Aruba等不同厂商AC上的在线终端,无需登录多个系统。 2.能够基于syslog等协议,获取不同厂商的终端上网日志,更新终端的上网状态,并还原终端真实上网行为,包括但不限于上线、下线、漫游、关联异常等,分析终端上网质量,并关联AP等设备信息进行分析,定位终端上网异常根因。 3.能够对接深澜、SAM+等常见认证系统,获取终端账号和认证计费状态,通过账号快速识别终端,定位到终端的关联AP和位置,并通过认证计费状态判断当前终端上网是否正常。 4.能够实时查看终端当前的上网质量,指标包括但不限于信噪比、信号强度、发送/接收速率、重传字节数等。系统应能对信噪比、信号强度等指标作出评价,并关联分析AP的底噪、信道利用率、在线率等指标,帮助用户分析终端当前上网是否存在异常。 5.能够查看一段时间的终端上网质量,指标包括但不限于信号强度、信噪比、关联发送速率、关联接收速率、发送速率、接收速率等,识别终端上网异常的时间段。 6.系统应能自动识别终端连接异常、上网体验差、乒乓漫游、非5G优先等异常场景,并给出常发生问题的TOPN AP、位置等信息,以提高终端上网异常的定位和排查效率 八、自动巡检 (一)交换机/交换机集群是一个网络系统的核心设备,网络设备的潜在风险进行深度挖掘,保证网络稳定运转,进而保障所有的业务系统正常运转。 (二)路由器是一个网络系统的核心设备,需要对网络设备的潜在风险进行深度挖掘,保证网络稳定运转,进而保障所有的业务系统正常运转。 (三)对网络设备的潜在风险进行深度挖掘,保证网络稳定运转,进而保障所有的业务系统正常运转系统需要能够检测交换机中深层次的风险,除基础的指标检查外,还应包括但不限于:风险服务开启检查(能够识别设备上是否开启了高危的风险端口,可以进行风险提示,并展示出端口列表)、RLDP防环路配置检查(检查交换机中的是否开启了RLDP防环路功能,如果未开启则给出开启的命令)、路由表变动检查(持续监测设备路由表的变化情况,当发生变化时展示具体变化的时间点、变化的内容)等;当出现该类故障时,能够及时的通知到管理员并且给出一定的问题修复建议(包括修复的办法、修复的命令等),辅助管理员进行处理。 需提供具备(三)功能的系统截图 九、配置合规检查 (一)为了减少系统的使用门槛,系统应该内置检查项目,这些检查项可以在安装后直接被使用 1.系统应内置多种资源类型的检查项目,包括但不限于:交换机、路由器; 2.系统应内置多种检查项,包括但不限于:VLAN命名检查、Loobpack接口掩码为32位、OSPF末端网络接口建议配置为被动接口、SNMPv2团体字配检查等; 3.系统应内置Windows和Linux操作系统的检查项,包括但不限于:RDP加密协议检查、guest用户状态检查、icmp重定向检查等。 (二)为了应该支持在一次检查任务中同时检查多种类型的设备,方便运维人员使用 1. 系统应该支持按照业务的要求定义分组或模版,并且模版内部的检查项可以在界面上自行定义,基于检查模版能够实现包括:指定类型设备的检查模版、混杂多个类型设备的检查模版;方便后续快速的进行检查。 2. 系统应该支持同时对多个类型的资源进行检查,每个类型支持定义不同的检查项目。还需要支持同一个类型的资源分组,并且设定不同的检查项目。比如:交换机分为核心交换机、汇聚交换机,分别设置不同的检查项目。 3. 系统能够在选择完成资源后,系统能够根据资源的特征自动筛选出检查项目,无需人工干预。 4. 系统能够支持手动执行检查任务,并且检查的报告至少留存6个月,随时可以调阅。 十、运维成果可视化 (一)能够通过资源运行概况、告警追踪及风险预知等方面保障IT资源运行连续性,需要提供IT资源连续保障监控视图: 1.能够总览监控资源的健康情况,及时了解各类资源中健康状态、告警状态、风险状态的资源数量分布; 2.能够查看告警追踪概况,包括最近一周处理告警数量及上周环比,以及今日待受理、已受理、已恢复、已关闭的告警数量分布,并能够让我校网络中心人员查看实时告警列表,及时追踪故障处理情况; 3.能够查看风险预防概况,包括最近一周修复风险数量及上周环比,以及今日待修复、修复中、已修复、已关闭的风险数量分布,并能够让我校网络中心人员查看实时检测到得到的风险列表,以便于让用户及时感知网络风险,规避网络异常发生。 (二)系统应支持视图可视化的管理,一目了然的了解无线设备运行情况及无线用户分布,视图包括: 1.视图应支持以星光点可视的形式,展示AP的分布密度及状态,当AP不在线或故障时,视图可在AP所在区域中标示出来,以便提醒人员去处理。 2.视图中分布的各区域,点击可查看单个区域的关联设备(AP、智分主机、POE交换机、微AP)状态统计、在线用户区域及历史峰值统计、终端SSID及频段用户占比,以及关联设备的详情信息,可方便运维人员进行问题处理。 十一、IP地址管理 (一)为了支撑网络运维能够快速定位终端的接入位置信息,需支持以下需求: 1.支持设定IP地址基准表,基准表按照IP地址范围、子网掩码设定网段、IP使用者、部门、地理位置等信息。 2.支持自动收集终端的网络接入数据,包括终端IP地址、MAC地址、接入交换机名称、接入交换机IP、接入交换机MAC、接入交换机端口、最后上线时间等信息。 3.支持对关键的终端接入信息进行强管控,开启强管控后,一旦接入信息变更,系统会自动提醒网络运维人员 4.支持对闲置的IP地址进行回收,支持基于分配到期、长时间未使用等自定义规则进行系统自动回收、手动的回收。 5.支持提供全局的IP地址使用看板,呈现包括可用地址总数、分配情况、使用情况、各子网使用情况,按部门、使用人、所属业务进行汇总展示。 针对以上(一)提供具有CMA标志的第三方权威机构出具的检测报告证明。 |