当我们决定开始要针对现行网络环境开始进行管理与监控时,并不是仅要购买或者从网络上随便抓取一套网管软件直接安装起来就可以开始进行网络管理的,我们需要作事前的规划与准备,而且了解到我们管理需求是要这些软件帮助我们解决哪些问题,从网络协议OSI 7 层架构来看,是要做到全面性网络协议分析,做好网络传输流量统计与分析方面,另外还有应用程序服务的可用度监控等等,才能落实监控工程上网络,设备与传输管理工作。
在进行网络传输管理时,我们可以透过以下各项效能指标让我们对问题做更清楚分析:
1. 是否有网络攻击行为发生?
2. 网络整体设备的带宽是否足够?
3. 是否有封包遗失现象产生?
4. 网络应用程序传送时间变慢?
5. 网络服务器及主设备的CPU使用率是否过高?
6. 是否可以提升整体网络可用度与降低网络当机次数?
7. 是否可以及早发现网络上潜在问题,避免更大的网络异常发生?
8. 是否可针对过去历史讯息进行分析,快速找出网络问题?
9. 是否有警讯提醒机制,当异常发生时可及早预防?
10. 可以订定网络效能指针,订出传输管理效能标准。
[nextpage]
具体改善监控网络设备与传输管理四个法则是:
一、选择具有网管功能的设备。
为了要能够更详尽了解网络上运作情况,最佳方式就是透过具有网络管理功能的网络设备,监控网络设备运作效能与各种产生自网络设备上的错误或异常讯息,避免网络因为这些异常事件持续发生而导致网络整体效能严重降低,甚至产生网络无法正常运作或瘫痪情况发生。
二、对每台监控及网络设备进行时间校正。
为每台网络设备进行时间校正对于网络管理工作上是非常重要的,而且这也是大多数厂商在帮客户架设网络设备而不会主动做的工作,由于中高阶的网络设备在遇到网络上有异常或冲突情况发生时候,都会有系统记录System log产生,这些记录都会储存在网络设备本机,降低问题除错复杂度;所以网络设备一定有时间校正设定机制。
三、启动网络设备SNMP管理功能。
接下来工作就是要进行启动各网络设备的网管通讯协议功能,这里建议要启动三项支持网管使用的通讯协议:SNMP,SNMP Trap,System log。当启动了这三项网管通讯协议功能,网管主机便可以读取这些系统或设备上效能数据,并且接收所有的讯息与事件,找出问题发生的原因与来源,并改善这些问题。
四、开始收集各项设备稳定与健康度。
在此我们定义的监控系统网络稳定与健康度是由两项指标所组成,第一个是网络运作效能,第二个是网络设备的CPU使用率。特别是CPU的使用率高低会严重影响到整体网络运作的效能,故需要将此列入网络传输稳定与健康度观察项目。