蓝盟经验,你不能错过的十大网络监控神器

发布者:上海IT外包来源:http://www.lanmon.net点击数:1643



随着IT外包网络信息应用项目的不断进步,许多公司或组织已经积累了一定数量的网络硬件设备,并且这些网络硬件设备将根据不同的功能分散在不同的物理位置,并且可以使用一些网络硬件设备。它是集中管理,有些网络硬件设备不能集中管理,只能以分散的方式管理。这将给计算机网络设备的管理带来一定的困难,因为一旦网络设备发生故障,就不能准确及时地分析网络故障的位置,以适应基于网络硬件设施的网络信息系统。影响巨大,后果非常严重。因此,如何准确有效地获取这些网络基础设施的运行状态信息,方便快捷地监控网络硬件设备的运行状态,是网络管理人员面临的一个亟待解决的大问题。


1OpenNMS


OpenNMS是网络管理系统的缩写,网络管理系统是一种开源软件网络监控工具。它可用于自动发现网络节点和监控网络服务,如HTTPDNSSSH等。当系统服务停止时,OpenNMS将根据管理员建立的规则发送通知,通知操作和维护人员网络障碍,事件收集和自动执行相应的操作和服务级别性能监视。它可以支持SNMP网络管理协议,确保管理可扩展性,并提供定制功能,以方便管理范围的扩展。需要在snmp中配置流量和联系人系统硬件使用情况。


目前,OpenNMS主要关注以下三个方面:


•服务轮询 - 检查应用程序服务的可用性以生成可用性报告。


•数据收集 - 收集、以保存和报告网络信息数据,并设置和触发阈值。


•事件和提示管理 - 接受事件系统的内部和外部事件,为强大的故障警报和故障升级系统提供源事件。


OpenNMS缺乏足够的中文文档和本地服务支持。目前,中国化还有很长的路要走。而且,技术要求非常高,一般操作和维护人员很难使用它。在使用过程中,会出现无法启动的现象。特别是对于SNMP问题,通常需要关闭TRAP服务。




2SugarNMS


SugarNMS智和网管平台已经实现的包括设备拓扑、故障管理、性能管理、配置管理以及安全管理等基础网管功能,采用了设备统一接入模型,全面监控网络设备、主机/服务器、中间件应用、Web服务等。




1.自动发现:在自动发现的过程中可搜索到网络设备,并识别设备类型和厂商型号,生成设备的面板图或搜索设备资源,如:板卡、端口、CPU、内存、磁盘等,并发现设备之间的链路关系。


2.拓扑管理:以具象化拓扑图方式展示网络设备及其连接关系,用户可编辑。通过拓扑图可以对设备、设备资源、连接进行管理。




3.设备管理:通过拓扑视图中,用户可以方便的管理设备及其配置参数。


4.设备资源管理:支持在拓扑图的基础上,进一步展示设备细节,包括设备的物理组件,服务器上的服务(Web服务器、中间件应用服务、数据库服务器、邮件服务器)或者用户定义的其他监控对象。


5.连接管理:用户可以通过拓扑视图编辑连接,选择连接实时显示的性能数据项。


6.故障管理:可以收集多种故障信息,并及时的展现出来,通过设备、资源、连接可以查看到故障信息,也可以通过统一的故障管理界面管理故障。




7.性能管理:全面采集或接收设备资源的多种新能数据,通过曲线图、柱状图或表格等形象化的展示出来,按天、星期、月 查看性能指标变化。


8.安全管理:支持多种安全管理功能,如QOS安全策略、MAC-IP绑定、黑白名单以及准入控制等。


9.统计报表:支持多项数据的统计功能,让用户对网络有一个全面直观的了解放。支持将软件中的统计图表导出或打印,以便备份或对比查看。




3Nagios


Nagios是一个开源服务器/网络监控解决方案,为服务器、交换机、应用程序和服务提供完整的监控和报警机制。它有一个插件API,所以你可以扩展它的开箱即用的功能。Nagios可运行在Linux/Unix平台之上,同时提供一个可选的基于浏览器的WEB界面以方便系统管理人员查看网络状态,各种系统问题,以及日志等等。


Nagios的主要功能特点:


1.监视网络服务 (SMTP, POP3, HTTP, NNTP, PING)


2.监视主机资源 (进程, 磁盘等)




3.简单的插件设计可以轻松扩展Nagios的监视功能


4.服务等监视的并发处理


5.错误通知功能 (通过email, pager, 或其他用户自定义方法)


6.可指定自定义的事件处理控制器


7.可选的基于浏览器的WEB界面以方便系统管理人员查看网络状态,各种系统问题,以及日志等等


8.可以通过手机查看系统监控信息




4Collectd


collectd是一个守护(daemon)进程,用来收集系统性能和提供各种存储方式来存储不同值的机制。比如以RRD 文件形式。当系统运行和存储信息的时候,Collectd会周期性统计系统的相关统计信息。那些信息可以用来找到当前系统性能瓶颈。(如作为性能分析 performance analysis)和预测系统未来的load(如能力部署capacity planning.如果你需要美观的图形来显示您的数据,并且已经厌烦了内部解决方案,恭喜您,你找到了正确的地方。




collectd的强大之处在于其丰富的插件。在README文件中可以找到插件列表的描述。


插件主要分为两类:输入和输出


输入插件:用于周期性的查询,通过某种方式查询到想要得到的当前值提交给守护进程。比如,CPU插件读取当前CPU计数器的各种参数(用户,系统,nice等等)并派发这些值到守护进程


输出插件:从守护进程中取值处理。一般应用会写到RRD文件和CSV文件,或者通过网络发送数据到远程盒子(a remote box)。


当然并非所有插件都可以这样划分。比如,网络插件(network plugin)可以发送(输出)与接收(输入)值。另外,该插件在初始化时启动了一个socket端口,接收到数据后就发送数据,这一点不同于其他输入插件。你可以理解为网络插件是异步工作,这样也很合理。


除此之外,还有日志插件(log)目前有两个:logfile插件和syslog插件。通过这些插件,collectd可以提供给用户解决方案的信息。你可以设置不同的log level


从版本4.3.0开始collectd支持了监测功能。这一点通过用户定义阈值来实现。如果某个值超出了阈值范围,通知将会被派发到通知插件(notification plugin)。


5Monit


Monit是一款功能非常丰富的进程、文件、目录和设备的监测软件,用于Unix平台。它可以自动修复那些已经停止运作的程序,特使适合处理那些由于多种原因导致的软件错误。Monit是一个跨平台的用来监控Unix/linux系统(比如LinuxBSDOSXSolaris)的工具。Monit特别易于安装,而且非常轻量级,并且不依赖任何第三方程序、插件或者库。




monit来监控进程,尤其对监控守护进程很有用,比如在系统启动时间启动的 /etc/init.d,比如sendmail,ssh,apachemysql


1、你可以用Monit来监控filesdirectories,文件系统,monit可以监控这些项目的改变,比如时间戳,校验和改变,文件大小改变,这样比较安全,比如你改变了文件的内容,那么它的md5或者sha1校验码不会改变。


2monit可以监控到各种服务器的网络链接,本地或者远程,TCP还是UDPUnix DomainSockets 都支持


3monit可以用来在某些时候测试程序或者脚本,你可以测试程序的返回值,并以此为依据,进行一些必要的操作,比如执行某一个动作或者发送一个警报


4Monit可以用来监控一般的系统资源,比如CPU使用,内存,以及负载均值(Load Acerage)


6Cacti


Cacti是一套基于PHP,MySQL,SNMPRRDTool开发的网络流量监测图形分析工具。


Cacti是通过 snmpget来获取数据,使用 RRDtool绘画图形,而且你完全可以不需要了解RRDtool复杂的参数。它提供了非常强大的数据和用户管理功能,可以指定每一个用户能查看树状结 构、host以及任何一张图,还可以与LDAP结合进行用户验证,同时也能自己增加模板,功能非常强大完善。界面友好。软件 Cacti 的发展是基于让 RRDTool 使用者更方便使用该软件,除了基本的 Snmp 流量跟系统资讯监控外,Cacti 也可外挂 Scripts 及加上 Templates 来作出各式各样的监控图。




cacti是用php语言实现的一个软件,它的主要功能是用snmp服务获取数据,然后用rrdtool储存和更新数据,当用户需要查看数据的时候用rrdtool生成图表呈现给用户。因此,snmprrdtoolcacti的关键。Snmp关系着数据的收集,rrdtool关系着数据存储和图表的生成。



7Icinga


Icinga最开始是作为Nagios的分支,但最近被改写为Icinga 2。这两种版本都正在积极开发中,现在已经可用,Icinga 1.x向后兼容Nagios插件和配置。Icinga 2已经被开发为更小更时尚,它提供分布式监控和多线程框架,这是NagiosIcinga 1中没有的。你可以从Nagios迁移到Icinga 1,以及从Icinga 1Icinga 2




Nagios一样,Icinga可以用来监控任何使用IP通信的设备,正如你使用SNMP和定制插件及附件一样。


有几个用于IcingaWeb用户界面,与Nagios的主要区别是配置,其配置可以通过web用户界面来进行,而不需要通过配置文件。对于喜欢管理配置而不是命令行的人,这是很好的优势。


Icinga整合了各种图形和监控软件包,例如PNPP4NagiosinGraph以及Graphite,提供坚实的性能可视化。Icinga还扩展了报表功能。


8zabbix


zabbix是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。能监视各种网络参数,保证服务器系统的安全运营;并提供柔软的通知机制以让系统管理员快速定位/解决存在的各种问题。




zabbix server可以通过SNMPzabbix agentping,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能,它可以运行在Linux, Solaris, HP-UX, AIX, Free BSD, Open BSD, OS X等平台上。


zabbix agent需要安装在被监视的目标服务器上,它主要完成对硬件信息或与操作系统有关的内存,CPU等信息的收集。zabbix agent可以运行在Linux ,Solaris, HP-UX, AIX, Free BSD, Open BSD, OS X, Tru64/OSF1, Windows NT4.0, Windows 2000/2003/XP/Vista)等系统之上。




zabbix server可以单独监视远程服务器的服务状态;同时也可以与zabbix agent配合,可以轮询zabbix agent主动接收监视数据(trapping方式),同时还可被动接收zabbix agent发送的数据(trapping方式)。




9Ganglia


GangliaUC Berkeley发起的一个开源集群监视项目,设计用于测量数以千计的节点。Ganglia的核心包含gmondgmetad以及一个Web前端。主要是用来监控系统性能,如:cpu mem、硬盘利用率,I/O负载、网络流量情况等,通过曲线很容易见到每个节点的工作状态,对合理调整、分配系统资源,提高系统整体性能起到重要作用。




每台计算机都运行一个收集和发送度量数据的名为 gmond 的守护进程。接收所有度量数据的主机可以显示这些数据并且可以将这些数据的精简表单传递到层次结构中。正因为有这种层次结构模式,才使得 Ganglia 可以实现良好的扩展。gmond 带来的系统负载非常少,这使得它成为在集群中各台计算机上运行的一段代码,而不会影响用户性能。所有这些数据多次收集会影响节点性能。网络中的 抖动发生在大量小消息同时出现时,可以通过将节点时钟保持一致,来避免这个问题。




gmetad可以部署在集群内任一台节点或者通过网络连接到集群的独立主机,它通过单播路由的方式与gmond通信,收集区域内节点的状态信息,并以XML数据的形式,保存在数据库中。


10Munin


Munin是一个功能强大的服务器监控软件,与传统的服务器状态监控软件Nagioscacti所不同的是,Munin不需要PHPMysqL,没有Web操作界面,更节省服务器资源,同时Munin又具备了自动采集数据并绘出图像出来,简单、方便、快捷。




穆宁的主要优点是,它提供了收集,并在同一时间分析信息,这样你就不必安装到每个节点上的Web服务器的详细信息页面底部的能力,并且附加信息可以帮助您一些重要的数据统计。


主要功能是收集和分析功能,可以帮助您从多个服务器收集信息并分析在中央服务器中收集的所有信息。通过aptyum源安装和更新非常容易。当访问http//本地主机/穆宁,穆宁将显示示出了所有连接的节点,包括节点特定的功能,例如网络驱动器、、NFS和过程的概述。单击节点名称将显示两行图形。每行将显示左侧的每日统计数据和右侧的每周统计数据。单击这些图表将显示一个显示月份、的详细页面。在此详细信息页面的底部,将显示有关数据的更多详细信息,包括不规则活动通知。 


Monit是一款运行于应用层功能非常丰富的用于对系统中的进程、文件、目录、以及设备等进行监视和管理的工具。Monit 包含一个内嵌的 HTTPS Web 界面,可以使用浏览器方便地查看 Monit 所监视的服务器。Monit 对管理员来说可谓神器也。Monit可以自动修复那些已经停止运作的程序,特使适合处理那些由于多种原因导致的软件错误。 Nagios 也就是在监控,而 Monit 不但本地监控,远程服务监控。可以做到服务就永远都能死而复生,是服务一直在线。





IT外包
>
400-635-8089
立即
咨询
电话咨询
服务热线
400-635-8089
微信咨询
微信咨询
微信咨询
公众号
公众号
公众号
返回顶部