回顾RedHat和CentOS操作和维护中的网络知识-IT外包官网-蓝盟集团

回顾RedHat和CentOS操作和维护中的网络知识

发布者：上海IT外包来源：http://www.lanmon.net点击数：915

操作和维护是一门艺术和家务活。每个人对此都有不同的理解。千人眼中有一千个哈姆雷特。如果您选择这个行业，最好是做到最好，并使用您的最佳价值。
分为以下四个方面：
一，系统运维网络的规划与思考
二，网络在系统运行和运行中的运行和维护
第三，在系统运行和维护过程中需要掌握的武器
四是故障的诊断和分析
同时，也将分享一些具有参考意义的经验和方法。
一，规划和思考系统运维的网络方面
在许多公司，工作职责非常明确，全职转移，每个人或团体负责一项业务。 IT架构中系统运维岗位基本相对落后，岗位和网络管理岗位基本平行。因为今天我们在讨论系统运维的网络方面，或多或少会处理网络帖子，那么就要谈谈网络帖子的内容。
系统操作和维护基于网络。如果没有相对合理的网络架构，恐怕系统的运行和维护就不那么容易了。公司基本上将网络与服务器分开，在不同区域划分设备，并且通常是物理隔离的。大多数服务器访问交换机通过配线架连接，一些服务器机柜安装在服务器机柜中。这是一种相对常见的方法。
从侧面的线路可以反映出公司对IT的重要性和投资，许多公司无法做到如此美丽的效果。所有这一切都必须以预算为基础，现在基本上没有预算轶事无法做到。
当大多数IT机房首次建立时，从设备布局到区域清晰划分的混乱，以及从区域功能到后期功能区域的模糊性，都反映了一个问题：计划无法跟上变化。十年前，目前潍坊的计划未能跟上时代的步伐。这不是任何人的错。它仍然要求我们适应变化，业务引领变革，基础设施需要相应调整。唯一不变的是变革。
在我看来，现阶段企业目前相对理想的架构如图所示：
这种传统企业的典型网络结构确保每个核心节点都是双链路，链路自动切换。在这种典型的网络结构中，各种切换或多或少都是简单或复杂的，并且是不同的。。该网络侧重于几个方面：稳定性，安全性和自动化。业务系统组件也尽量避免单点。通过这种方式，后端业务系统可以保证连接网络级别的稳定性。在主机系统级别，可以避免个别问题并消除性能瓶颈。异常自动报警可以相对完美地自动修复。当然，这应该基于预算。
二，网络在系统运行和运行中的运行和维护
在系统操作和维护中，通常涉及的网络操作通常包括以下方面。
1.设备在线，物理连接设置
许多操作和维护人员应从项目开始到项目，然后到操作和维护，从事一站式服务。每个链接都必须亲自动手。这是一件好事，也是一件坏事。好处是您的环境通常非常熟悉。糟糕的是，事情必须完成，而不是生活，而且表现并不明显。你必须进入自己，你可能没有太多精力去做其他事情。这是一个矛盾，你可以自己掌握它。
2.网络逻辑配置调整
这条内容涉及具体操作，您可以一步一步手动，或者您可以使用高层工具分批完成，具体取决于公司IT架构的能力。具有一个点错误的掩码将导致网络连接异常。如果您有能力开发，您还可以使用脚本或语言来编写内容。通常你会累积并使用它们。
具体内容涉及：
1）配置ip，别名，设置端口监听，绑定网卡，设置路由
2）划分vlan并配置中继
3）测试端口并配置监控
具体的操作过程在这里不介绍太多，比如做一个网卡绑定，测试一个端口，这些操作有大量的文件可以在互联网上查阅，这部分是在日常的Linux系统操作和维护中描述的对网络中涉及的操作有一个总体印象。
3.性能分析和优化
这部分内容操作起来比较不舒服，不仅可以随便根据葫芦画完成，稳定的性能分析和定位也比较困难，很多场景需要结合多方面进行统一分析。这需要一些结论和工作经验的沉淀，选择合适的工具，并经常与许多方面合作。
如果一个工人想要做一些好事，他必须首先磨练他的武器：
熟练掌握地图上的各种工具基本上可以解决99％的性能分析，剩下的1％不是错误或自然灾害。这实际上是一个笑话，但它也表明了一个好工具的重要性。其余的要小心，无论工具有多好，它都行不通，态度是第一位的。
第三，在系统运行和维护过程中需要掌握的武器
我在上面分享了一张图片，其中涵盖了广泛的主题。本节重点介绍网络，并分享工作中经常使用的一些工具。
首先让我们分享当前Linux系统性能查看调优工具的图片：该图像基本上涵盖了Linux系统各个方面的性能工具。可以说它相当全面。让我们来看看我们通常在网络上使用的命令或工具，它们将帮助您查看和使用它。
以上工具基本上用于日常工作中。每个工具都有自己的重点。这只是大量工具的一小部分，因为每个人都有不同的习惯，每个人都有自己的专注，选择适合你。好的，以上工具仅供参考。
本文的内容旨在进行整理，而不是在使用特定工具时更详细地解释，因为如果详细说明每个工具将涉及大量空间，并且不可能涵盖所有内容。有兴趣的人可以在社区或搜索引擎中搜索。
推荐小工具：
挖掘，ethtool，iperf，iftop，dstat，mtr
例如，如果您想知道两台主机之间的带宽是否可以达到相应的带宽，请使用iperf。要动态查看可用性和延迟等信息，请使用mtr。
四是故障的诊断和分析
用一两句话来判断错误的诊断和治疗。这主要是由于通常经验的积累。许多故障是相互关联的。如何找出问题的最终原因，有一些方法可以从中学习。我没有详细描述用于解决问题的方法。我只是谈谈解决问题的经验和技巧。
分享一点经验：
a）通常会问更多问题
b）是否可以再现故障，找到第一个场景，注意细节的整体组合
c）相互参考很多方面，同事之间相互合作
d）你可以再做一些假设，直到你推翻你的想法
e）您自己的工具箱应该有几个易于使用的TOOLS，包括您自己的开发。
以上只是解决问题的一些方法，具体问题需要详细分析。
下面我们描述一个真实案例：在网络出现故障的情况下。我们如何找到一种快速消除问题的方法。
场景描述：
一天下午，该公司的内部业务系统突然响应缓慢，几位业务经理过来描述这个问题。最近期间也出现了类似的问题。造成这种问题的原因是业务区域的防火墙老了，处理能力不足。结果，短时间内的CPU使用量激增，超过了领域的阈值。发生。
解决方案：
1）初步定位
这也是类似问题的出现。这绝对不是个别业务系统的问题。乍一看，有一个共同的问题。问题应该出在网络设备上。这将导致大规模问题。但是，防火墙已于一周前升级。应该没有这样的问题。查看业务范围拓扑，因为拓扑已经在脑海中直接进行。2）一步一步
首先登录到新防火墙，检查CPU使用情况，一切正常，似乎问题不在这里。
然后登录到业务系统以查看交换机上的负载。乍一看，它很高，高达99％。我将继续使用它，并与网络管理员合作检查问题的原因并查看各种性能信息。没有合理的线索，问题无法准确定位。收集各种信息并为供应商支持做好准备。
3）协助排除故障
许多政党已经回忆起他们是否在不久的将来做了其他工作。
网络：一周前升级了该地区的保护墙
主持人：昨天，访问6个新设备，并做端口绑定绑定
4）再次检查
由于该区域的Windows主机设备上已经安装了防病毒软件，病毒的可能性很小，Linux病毒的可能性更小。由于昨天有6台主机设备在线，我们专注于连接到网络设备的端口。
通过交换机和监控性能视图，分析了当前端口流量过大的问题，并且端口已经饱和。由于对业务方面的影响，有必要快速找到问题或暂时消除影响。初步认为，交换机上线以关闭连接到这6台机器的端口。经过一段时间的连续观察后，交换机的CPU处于负载状态，其他服务逐渐恢复。考虑到你已经下班了，请花点时间观察并调整明天的情况。并结合制造商的意见。
5）工作第二天后，六台机器的恢复恢复，交换机的CPU负载再次出现。但是，其他服务没有效果。现在是什么状况？再次检查并找到线索。
6）进一步调查
网络管理员打开调试视图信息。经过一段时间的分析后，现有12个mac地址的剪发经常出现在两个交换机上。检查mac后，可以找到CPU过载的原因。这是新的6台机器（机器绑定的每两个端口），果断地拔掉其中一个端口，交换机的CPU负载快速下降，然后就可以找到绑定绑定问题。
7）进一步调查该系统
我已多次完成绑定，即使我更改了高版本的操作系统，也应该没有问题。果断检查它，检查绑定模式，并将模式看作0.我当时感到震惊。进一步查看确实是模式配置错误，我原本想设置模式6，后来不知道怎么写0，以为其他机器都是复制过去的，所以它们都是模式0，并立即更改。重启网卡，一切正常，重新插入网线，观察交换机的CPU负载是否稳定。这次CPU的高度无疑应该由此引起，这个锅被扣在了我的头上。
8）下午14点: 00，问题再次出现，此时交换机的CPU不高，什么情况下，面对激进的状态。再次检查，这次关注交换机，收集大量信息反馈给制造商，很快制造商给出了一个建议，即端口饱和包严重，影响其他服务端口的正常使用，经过制造商的进一步故障排除，模型切换虽然性能非常好，但它已经是一个旧设备。该模型端口的端口组容量仅为1G。该组中其他端口的总带宽已超过1G，这对于交换机来说是不够的。
9）进一步协调项目人员，将大量交互端口调整为内网的私网段，使用千兆交换机进行内部业务交互，外部接入继续跟随此切换。最终这个问题得到了解决。

上一篇: 蓝盟IT外包，元宇宙：四梁八柱是什么
下一篇: 什么是DNS劫持，中毒和解决方案？我理解这篇文章！
分享到：

微软云

IT采购

弱电工程

系统集成

客户故事

回顾RedHat和CentOS操作和维护中的网络知识

400-635-8089