《mLACP协议原理详解.docx》由会员分享,可在线阅读,更多相关《mLACP协议原理详解.docx(10页珍藏版)》请在三一办公上搜索。
1、mLACP协议原理详解mLACP协议学习 在电信级以太网中,各种冗余机制提供了节点和网络的弹性互联。冗余机制的选择要依靠各种不同的因素:传输技术,拓扑,单节点对整个网络的多归属,设备性能,自治系统边界或者运营商的服务模型,以及运行商的选择。 电信级以太网络的高可用性可以通过同时使用机框内和机框间的冗余机制实现。运营商希望一台设备双归属到两个上游PoA上进行冗余,Cisco的多机架链路聚合解决方案的满足了机架间的冗余机制的需要。一些运营商不希望或者不支持在接入网行运行环路预防控制协议,这就需要一个替代的冗余机制。MCEC解决了对802.3ad链路汇聚控制协议实现增强这一问题。 1. mLACP限
2、制 l l l l l l l l l l l l mLACP不支持快速以太网 mLACP不支持半双工链路 mLACP不支持多邻居 端口通道转换到mLACP可能引起服务中断 PoA上LAG的最大链路数受到端口通道的最大端口数的限制。 DHD上的系统优先级必须小于PoA的优先级 MAC Tunneling Protocol (MTP) supports only one member link in a port channel. 当LACP稳定时,一个端口通道或它的成员链路可能flap 当最小链路数没有配置时,基于DHD的控制不能进行。 不支持最小链路数的DHD-controlled恢复行为
3、强制故障切换总会导致min-link故障 任何强制故障切换的故障可以回复 2. 多机架链路聚合概述 在MCEC中,DHC双归属到两个上游PoA上。DHD不能运行多生成树这样的环路保护控制协议。因此,需要一种防止环路的冗余设置。一种方法是将DHD的上行链路放到一个聚合组中,通常被称为链路聚合。这种方法假设DHD可以运行IEEE802.3ad LACP来建立和维护聚合组。 LACP,是一个链路级控制协议,允许聚合组的动态协商和建立。需要一个LACP应用到PoA的扩展,使得DHD连接到一个虚拟的LACP对等体而不是连接到两个分开的设备上。这种扩展被称为Multichassis LACP或者mLACP
4、,如图所示: PoA形成了一个虚拟的LACP对等体,从DHD的角度看,它被定义为冗余组的成员。由于冗余组中的PoA对DHD表现为一个独立的设备,PoA之间的状态必须通过机框间通信协议进行同步。ICCP提供了一个仅仅用于控制的机框间通信通道。 系统可以有active和standby两种冗余模式。这种模式下,在任何时间,系统的上行链路中仅仅有一个独立的PoA可以是active模式。DHD认为一个PoA是active的,另一个是standby的。这种情况是允许的:一个给定的PoA,对一个DHD是active,对于另外一个是standby。这种性能使得两个PoA为不同的服务提供负载共享。 3. MPL
5、S伪线冗余机制的交互 Figure1中的网络设置可用于为虚拟专网服务和虚拟专线服务部署提供运营商边缘节点的冗余。 连接环路冗余机制决定和控制伪线冗余机制。mLACP根据配置的LACP系统和端口优先级决定一个给定PoA的连接环路的状态,然后给定PoA的伪线状态和本地连接环路的状态进行同步。这种同步保证了带有active连接环路的PoA的伪线也是active的。同样的,standby的PoA的伪线也是standby模式。通过保证连接环路的转发状态和伪线的转发状态的同步性,可以避免一个冗余组中PoA间转发数据。这种同步性节约了因在故障时PoA间进行数据转发而浪费的带宽。 4. 冗余机制 电信级以太网
6、解决方案应该包括以下处理过程: l 连接环路active或standby状态选择可以由接入节点或网络决定,也可以由聚合节点决定,或者两者组合决定。对于mLACP,连接环路的状态选择由DHD和PoA协同决定。 l 伪线状态转发通告当mLACP部署到VPWS或者VPLS应用中时,也就是当PoA上行连接使用了伪线技术时,这种通告是强制的。当PoA需要决定自己是处于active还是standby的时候,就需要通知对方自己连接到远端的PE的伪线状态。对于MPLS 伪线,这个功能通过使用LDP协议来完成。 l MAC flushing indication:对于任何一种冗余机制来说,如果要快速收敛和避免流
7、量黑洞,都必须支持这种indication,mLACP必须集成802.1Q/802.1ad/802.1ah的MAC flushing机制,这样在VPLS中应用时就可以使用。 注意:流量黑洞的出现是:当接收的报文被丢弃时,却没有将该报文无法递交到其接收者的消息通知源。只有监测到了报文丢失,才能够发现流量黑洞。 l Active vlan通告:对于mLACP来说,只要PoA遵循了Active/Standby冗余模型,这种通告就是不需要的。 Figure2 展示了电信级以太网络中冗余机制。 5. 使用mLACP的双归属拓扑 虚拟LACP实例和DHD之间通过IEEE802.3ad来形成横跨两个或多个机
8、框的聚合组。 5.1 LACP和802.3ad参数交换 在802.3ad中,LACP system ID由LACP system MAC和system priority组成。tow byte system priority + six byte MAC address。两个设备之间的system ID优先级的比较是使用小写字母来比较。为了获得最高的system ID优先级,mLACP的两端互相交互冗余组的system ID信息,然后选取其中较小的一个作为整个虚拟的LACP设备的system ID。 cisco可以提供两个冗余组下的命令mlacp system mac和mlacp system
9、priority来配置。这两个命令可以较好的确定连接环路的哪一边来控制LAG的选择逻辑。缺省时mac使用系统mac地址,priority使用32768。 5.2 端口标识符 IEEE 802.3ad 在一个系统中使用一个4字节的标识来唯一标识一个端口。端口标识由端口优先级和端口编号组成。 端口标识的比较是按照无符号整型原则,组成原则是2字节的端口优先级16+2字节的端口编号。mLACP特性需要对端口ID进行一些调整,以确保其在冗余组内是唯一的 。 5.3 端口号 LACP对端口编号的依赖很大,故在mlacp特性中,必须使用mlacp node-id命令来协调这些端口编号,来避免两个PoA之间的
10、端口编号重复。 5.4 端口优先级 当对一个链路聚合组的最大链路数做了限制的时候(软件或者硬件),端口优先级用来决定一个端口的active/standby状态。对于mLACP来说,因为是冗余机制,故Active PoA中所有连接DHD的端口优先级都必须比Standby PoA中连接DHD的高。端口的优先级可以显式配置也可以由系统依照选择标准自适应产生。如,挑选拥有最高端口优先级的PoA为Active PoA,并动态的调整其他具有相同的port key的链路的端口为同一优先级。 当前mLACP只支持Active/Standby冗余模式,一个聚合组中的同一个PoA中的所有成员链路端口优先级须是相同
11、的。为了支持这种需求,可以在端口下配置mlacp lag-priority命令,这个命令可以配置所有位于一个LAG组中的所有端口的优先级。而LACP配置的优先级将会被忽略。mlacp lag-priority命令也可以用于在以下两种情况下的强制切换: 设置当前active的PoA LAG的优先级比standby的优先级的值大,这会快速的完成切换。因为需要转换的状态少。 设置standby PoA的LAG 优先级比active PoA的LAG 优先级小。这个切换花费的时间比较多,因为standby链路在变为active之前,必须通知DHD一个消息OUT_OF_SYNC。 5.5 多机框注意事项
12、由于LACP是一个链路层协议,一个链路上的所有信息交换包括链路的特定信息和本地信息。交换信息包括: l 系统属性优先级和MAC地址 l 链路属性端口key、优先级、端口号和状态 当在多机框上执行扩展LACP设置时,需要对两个机框间协议属性的状态的同步。 5.6 系统MAC地址 LACP依靠System MAC地址来确定对端设备通过一个特殊的链路连接起来。故必须将DHD对端的两个设备为虚拟一个。协调两个PoA的system MAC地址就是基本要求了。一般LACP 使用的system MAC address缺省使用系统的基本MAC(不可以通过配置更改)。对于mLACP来说,以下两点是必须的: l
13、每一个PoA的System MAC必须与对方交互例如: PoAs选择值更小的那一个做为system mac。选择低值mac有利于获得更高的系统优先级。 l System MAC 是可配置的做为系统优先级的一部分,运行商或许希望让PoAs的系统优先级比DHD的高。一个高的优先级保证了PoA的端口的优先级优先于DHD的端口优先级的配置。System MAC的配置必须保证在两个PoA中是统一的,否则系统将自动认为mac矛盾,然后会选择一个缺省的mac来使用。 5.7 系统优先级 对于mLACP,需要两个PoAs之间的协商来通告一个相同的值给DHD。 5.8 端口key 选择具有相同此值的链路到同一个
14、LAG组,一般情况DHD设备的和PoA的不需要相同 ,对于mLACP,这个值不需要特别的配置。 6. 故障保护场景 mLACP为防止端口、链路和节点故障,提供了网络弹性化。故障分为以下5类: 当这些故障产生时,会触发active PoA和standby PoA之间的切换。这种切换包括PoA上行线路和下行线路同时发生的故障。 故障点A和C是端口故障,故障点B是以太网链路故障,故障点D是节点故障。当PoA连接到一个MPLS网络时,故障点E可以划分为以下4中类型: l 伪线故障监测伪线,如果伪线出现故障,则通知与之关联的服务实例,上游失效。 l 远端PE IP路径故障监测远端PE的IP可达性 (如使
15、用IP路由watch),如果路由失效,则通知所有与之关联的服务实例,上游失效。 l LSP故障监测到远端PE的LSP状态,如果LSP失效,则通知所有与之关联的服务,上游失效 l PE孤岛监测PE所有的连接核心网络的物理接口,当所有的这些接口Down,则说明PE对于核心网络来说已经成为了孤岛,因此必须通知所有与之关联的服务,上游失效。 如果IP MPLS网络使用了自己的冗余和弹性机制,如MPLS FRR,则mLACP解决方案能够充分的解决PE孤岛;且在此种情况下,PW,LSP和IP路径失效的问题都会由IP MPLS自身的保护机制处理。 注意:对所有需要监测的连接核心网络的物理接口必须显式配置指定
16、。在每一个冗余组中都必须独立的定义连接核心网络的接口。此种情况下的E处失败,会造成PoA上所有的multichaissis LAGs进行切换。 7. 操作变化 LACP在两个设备间提供这样一种链路冗余机制将聚合组中的一条或几条链路设置为standby状态来提供链路冗余。这种冗余的实现通常为:给一些端口配置相同的port key,这种端口的数量要超过一个链路聚合组最多能够聚合的链路数。如:一个设备上两个port都配置了相同的port key,但LAG配置允许最大链路数为1。 如果DHD和PoAs都能够利用配置来限定LAG的最大链路数目,这样就会出现以下三种情况: 1. 基于DHD的控制 DHD配
17、置每捆绑的最大链路数比PoAs的配置小。这时active/standby链路的选择就由DHD控制。链路的active/standby设置依赖于相关端口的port priority。而配置了较高系统优先级的PoA可以判定这个选择的结果。DHD会把port priority比较低的链路设置为standby模式。 为了适应DHD控制的故障切换,DHD上配置可以捆绑的最大链路数L必须是连PoA中最少的链路数。由L来限制DHD同一时刻能和两个PoAs中的一个PoA的部分链路达到active。 DHD控制情况必须和PoA最小链路阈值故障时的策略一起应用,这个最小链路阈值必须设置为L。最小链路阈值必须在每一
18、个PoA上配置,因为一个A,B或者C的链路失效可能不会触发一个切换(因为最小链路阈值故障没有达到),DHD只会在standby PoA的捆绑中增加一条 standby链路,这种添加可能会导致出现active/active场景。 DHD control eliminates the split brain problem on the attachment circuit side by limiting the DHDs attempts to bundle all the links。 2. POA控制 PoA配置为限制每一个捆绑最大链路数L与PoA相连的链路数相等。而DHD配置为比L大,此
19、时,active/standby链路的选择就由PoA来处理。 3. 共享控制 此方式下,DHD和PoA均配置每一个捆绑的最大链路数目L连接到PoA的链路数目。这样每一个设备都会独立的选择active/standby链路。 共享控制的坏处就是共享控制的故障切换时间由DHD和PoA二者来决定,包括在设置链路为IN_SYNC之前,每一个从standby到SELECTED链路的变化和WAIT_WHILE_TIMER到期的等待。这需要DHD和PoA都支持LACP快速切换特性,使得故障切换能在1秒内完成。 8. mLACP故障切换 当以下故障产生时,mLACP强制将一个PoA切换到standbyPoA。
20、l DHD上行端口故障、以太网故障或者active PoA下行端口故障 l Active PoA故障 l Active PoA上行链路故障 9. MAC flushing机制 当mLACP用来为多点桥接服务提供冗余时,必须支持MAC flushing通告机制来避免可能出现的流量黑洞。当主备切换之后,流量黑洞会在如下的情景中出现:假设远端设备试图给DHD发送流量,而在二者的网络中存在一个桥,此桥保留的MAC地址属于原active的PoA,如此这个流量就会在原active的PoA上丢失,直到桥的此MAC地址老化,这个时间一般为5分钟。为了避免这种情况的发生,切换完成后,新的Active PoA必须立即向远端设备发送自己的MAC flush 通告消息。以更新路径中的MAC地址信息。