回顾RedHat和CentOS操作和维护中的网络知识

发布者:上海IT外包来源:http://www.lanmon.net点击数:841

操作和维护是一门艺术和家务活。每个人对此都有不同的理解。千人眼中有一千个哈姆雷特。如果您选择这个行业,最好是做到最好,并使用您的最佳价值。
分为以下四个方面:
一,系统运维网络的规划与思考
二,网络在系统运行和运行中的运行和维护
第三,在系统运行和维护过程中需要掌握的武器
四是故障的诊断和分析
同时,也将分享一些具有参考意义的经验和方法。
一,规划和思考系统运维的网络方面
在许多公司,工作职责非常明确,全职转移,每个人或团体负责一项业务。 IT架构中系统运维岗位基本相对落后,岗位和网络管理岗位基本平行。因为今天我们在讨论系统运维的网络方面,或多或少会处理网络帖子,那么就要谈谈网络帖子的内容。
系统操作和维护基于网络。如果没有相对合理的网络架构,恐怕系统的运行和维护就不那么容易了。公司基本上将网络与服务器分开,在不同区域划分设备,并且通常是物理隔离的。大多数服务器访问交换机通过配线架连接,一些服务器机柜安装在服务器机柜中。这是一种相对常见的方法。
从侧面的线路可以反映出公司对IT的重要性和投资,许多公司无法做到如此美丽的效果。所有这一切都必须以预算为基础,现在基本上没有预算轶事无法做到。
当大多数IT机房首次建立时,从设备布局到区域清晰划分的混乱,以及从区域功能到后期功能区域的模糊性,都反映了一个问题:计划无法跟上变化。十年前,目前潍坊的计划未能跟上时代的步伐。这不是任何人的错。它仍然要求我们适应变化,业务引领变革,基础设施需要相应调整。唯一不变的是变革。
在我看来,现阶段企业目前相对理想的架构如图所示:
这种传统企业的典型网络结构确保每个核心节点都是双链路,链路自动切换。在这种典型的网络结构中,各种切换或多或少都是简单或复杂的,并且是不同的。 。该网络侧重于几个方面:稳定性,安全性和自动化。业务系统组件也尽量避免单点。通过这种方式,后端业务系统可以保证连接网络级别的稳定性。在主机系统级别,可以避免个别问题并消除性能瓶颈。异常自动报警可以相对完美地自动修复。当然,这应该基于预算。
二,网络在系统运行和运行中的运行和维护
在系统操作和维护中,通常涉及的网络操作通常包括以下方面。
1.设备在线,物理连接设置
许多操作和维护人员应从项目开始到项目,然后到操作和维护,从事一站式服务。每个链接都必须亲自动手。这是一件好事,也是一件坏事。好处是您的环境通常非常熟悉。糟糕的是,事情必须完成,而不是生活,而且表现并不明显。你必须进入自己,你可能没有太多精力去做其他事情。这是一个矛盾,你可以自己掌握它。
2.网络逻辑配置调整
这条内容涉及具体操作,您可以一步一步手动,或者您可以使用高层工具分批完成,具体取决于公司IT架构的能力。具有一个点错误的掩码将导致网络连接异常。如果您有能力开发,您还可以使用脚本或语言来编写内容。通常你会累积并使用它们。
具体内容涉及:
1)配置ip,别名,设置端口监听,绑定网卡,设置路由
2)划分vlan并配置中继
3)测试端口并配置监控
具体的操作过程在这里不介绍太多,比如做一个网卡绑定,测试一个端口,这些操作有大量的文件可以在互联网上查阅,这部分是在日常的Linux系统操作和维护中描述的对网络中涉及的操作有一个总体印象。
3.性能分析和优化
这部分内容操作起来比较不舒服,不仅可以随便根据葫芦画完成,稳定的性能分析和定位也比较困难,很多场景需要结合多方面进行统一分析。这需要一些结论和工作经验的沉淀,选择合适的工具,并经常与许多方面合作。
如果一个工人想要做一些好事,他必须首先磨练他的武器:
熟练掌握地图上的各种工具基本上可以解决99%的性能分析,剩下的1%不是错误或自然灾害。这实际上是一个笑话,但它也表明了一个好工具的重要性。其余的要小心,无论工具有多好,它都行不通,态度是第一位的。
第三,在系统运行和维护过程中需要掌握的武器
我在上面分享了一张图片,其中涵盖了广泛的主题。本节重点介绍网络,并分享工作中经常使用的一些工具。
首先让我们分享当前Linux系统性能查看调优工具的图片:该图像基本上涵盖了Linux系统各个方面的性能工具。可以说它相当全面。让我们来看看我们通常在网络上使用的命令或工具,它们将帮助您查看和使用它。
以上工具基本上用于日常工作中。每个工具都有自己的重点。这只是大量工具的一小部分,因为每个人都有不同的习惯,每个人都有自己的专注,选择适合你。好的,以上工具仅供参考。
本文的内容旨在进行整理,而不是在使用特定工具时更详细地解释,因为如果详细说明每个工具将涉及大量空间,并且不可能涵盖所有内容。有兴趣的人可以在社区或搜索引擎中搜索。
推荐小工具:
挖掘,ethtool,iperf,iftop,dstat,mtr
例如,如果您想知道两台主机之间的带宽是否可以达到相应的带宽,请使用iperf。要动态查看可用性和延迟等信息,请使用mtr。
四是故障的诊断和分析
用一两句话来判断错误的诊断和治疗。这主要是由于通常经验的积累。许多故障是相互关联的。如何找出问题的最终原因,有一些方法可以从中学习。我没有详细描述用于解决问题的方法。我只是谈谈解决问题的经验和技巧。
分享一点经验:
a)通常会问更多问题
b)是否可以再现故障,找到第一个场景,注意细节的整体组合
c)相互参考很多方面,同事之间相互合作
d)你可以再做一些假设,直到你推翻你的想法
e)您自己的工具箱应该有几个易于使用的TOOLS,包括您自己的开发。
以上只是解决问题的一些方法,具体问题需要详细分析。
下面我们描述一个真实案例:在网络出现故障的情况下。我们如何找到一种快速消除问题的方法。
场景描述:
一天下午,该公司的内部业务系统突然响应缓慢,几位业务经理过来描述这个问题。最近期间也出现了类似的问题。造成这种问题的原因是业务区域的防火墙老了,处理能力不足。结果,短时间内的CPU使用量激增,超过了领域的阈值。发生。
解决方案:
1)初步定位
这也是类似问题的出现。这绝对不是个别业务系统的问题。乍一看,有一个共同的问题。问题应该出在网络设备上。这将导致大规模问题。但是,防火墙已于一周前升级。应该没有这样的问题。查看业务范围拓扑,因为拓扑已经在脑海中直接进行。2)一步一步
首先登录到新防火墙,检查CPU使用情况,一切正常,似乎问题不在这里。
然后登录到业务系统以查看交换机上的负载。乍一看,它很高,高达99%。我将继续使用它,并与网络管理员合作检查问题的原因并查看各种性能信息。没有合理的线索,问题无法准确定位。收集各种信息并为供应商支持做好准备。
3)协助排除故障
许多政党已经回忆起他们是否在不久的将来做了其他工作。
网络:一周前升级了该地区的保护墙
主持人:昨天,访问6个新设备,并做端口绑定绑定
4)再次检查
由于该区域的Windows主机设备上已经安装了防病毒软件,病毒的可能性很小,Linux病毒的可能性更小。由于昨天有6台主机设备在线,我们专注于连接到网络设备的端口。
通过交换机和监控性能视图,分析了当前端口流量过大的问题,并且端口已经饱和。由于对业务方面的影响,有必要快速找到问题或暂时消除影响。初步认为,交换机上线以关闭连接到这6台机器的端口。经过一段时间的连续观察后,交换机的CPU处于负载状态,其他服务逐渐恢复。考虑到你已经下班了,请花点时间观察并调整明天的情况。并结合制造商的意见。
5)工作第二天后,六台机器的恢复恢复,交换机的CPU负载再次出现。但是,其他服务没有效果。现在是什么状况?再次检查并找到线索。
6)进一步调查
网络管理员打开调试视图信息。经过一段时间的分析后,现有12个mac地址的剪发经常出现在两个交换机上。检查mac后,可以找到CPU过载的原因。这是新的6台机器(机器绑定的每两个端口),果断地拔掉其中一个端口,交换机的CPU负载快速下降,然后就可以找到绑定绑定问题。
7)进一步调查该系统
我已多次完成绑定,即使我更改了高版本的操作系统,也应该没有问题。果断检查它,检查绑定模式,并将模式看作0.我当时感到震惊。进一步查看确实是模式配置错误,我原本想设置模式6,后来不知道怎么写0,以为其他机器都是复制过去的,所以它们都是模式0,并立即更改。重启网卡,一切正常,重新插入网线,观察交换机的CPU负载是否稳定。这次CPU的高度无疑应该由此引起,这个锅被扣在了我的头上。
8)下午14点: 00,问题再次出现,此时交换机的CPU不高,什么情况下,面对激进的状态。再次检查,这次关注交换机,收集大量信息反馈给制造商,很快制造商给出了一个建议,即端口饱和包严重,影响其他服务端口的正常使用,经过制造商的进一步故障排除,模型切换虽然性能非常好,但它已经是一个旧设备。该模型端口的端口组容量仅为1G。该组中其他端口的总带宽已超过1G,这对于交换机来说是不够的。
9)进一步协调项目人员,将大量交互端口调整为内网的私网段,使用千兆交换机进行内部业务交互,外部接入继续跟随此切换。最终这个问题得到了解决。
IT外包
>
400-635-8089
立即
咨询
电话咨询
服务热线
400-635-8089
微信咨询
微信咨询
微信咨询
公众号
公众号
公众号
返回顶部