无损以太网关键技术研究 以太网和宽带的区别
中图分类号:TN915.1 文献标志码:A 文章编号:1009-6868 (2012) 04-0027-005 摘要:文章认为为使以太网能更好地适应数据中心网络融合需求,需对现有以太网进行全面性能提升,以实现低延时、无损的增强型以太网。文章探讨了无损以太网关键技术:量化拥塞通知(QCN)、基于优先级的流控(PFC)、增强传输选择(ETS)、自动发现和能力交换协议(DCBX),并对这些技术的特点及协议兼容性进行了研究和分析。文章认为无损以太网技术是保障数据中心网络基础设施在处理网络流量过程中低延迟、无丢包的关键技术,将逐步为数据中心产品所支持。
关键词:无损以太网;拥塞管理;流量控制;增强传输选择
Abstract:Before converging Ethernet in data centers, it is necessary to improve the performance of existing Ethernet so that low-delay, lossless enhanced Ethernet can be achieved. In this paper, we introduce the key technologies in lossless Ethernet networks, including quantized congestion notification, priority-based flow control, enhanced transmission selection, and data-center bridging exchange. We analyze protocol compatibility between these technologies and predict the future of these technologies. Lossless Ethernet technologies are central in creating low-delay, lossless data-center networks and will be supported in all future data-center products.
Key words:lossless Ethernet; congestion management; flow control; enhanced transmission selection
新的数据中心中无损以太网技术是关键技术之一,国际电子电气工程师学会(IEEE) 802.1数据中心桥接(DCB)工作组为此定义了多个标准。这些标准主要有:
(1)802.1 Qau[1],该标准定义了后向拥塞通知协议,也称量化拥塞通知(QCN)。其主要原理是当配置拥塞检测点(CP)的桥端口检测到拥塞情况,则通过拥塞通知消息(CNM)将拥塞情况反压给导致拥塞的反应点(RP),通知其进行自身数据传送速率的控制。
(2)802.1 Qbb[2],该标准定义了基于优先级的流控(PFC)。该标准采用了类似802.3X的暂停(PAUSE)机制,但PAUSE机制是对每个优先级单独进行的。
(3)802.1Qaz[3],该标准包括增强传输选择(ETS)、自动发现和能力交换协议(DCBX)两部分。其中ETS将具有相同时延、丢包要求的不同优先级业务流划分到一个流量类别(TC)组,并为该TC分配一定比重的可用带宽,以满足不同应用对传输带宽的需求;DCBX主要是通过扩展链路层发现协议(LLDP)的类型长度值(TLV)实现DCB控制层面协议。
(4)802.3bd[4],该标准是为支持802.1Qbb PFC而对802.3[5]媒体访问控制(MAC)控制帧进行的修订,用于通过修订后的M_CONTROL PFC原语实现对各优先级的PFC功能的使能和流量控制。
1 无损以太网关键技术
1.1 量化拥塞通知
QCN是IEEE 802.1Qau标准所定义的拥塞管理机制。相对于其他拥塞管理技术,QCN采用了相对精准的后向拥塞通知机制,在核心网络设备基于出端口队列设置拥塞检测点,检测到拥塞发生则组建包含拥塞程度的拥塞通知消息CNM,并反压至导致拥塞的源终端,令其依据CNM指示降低相应流的数据传送速率。
图1为QCN拥塞控制机制示意图,终端数据流在设置了拥塞检测的核心网络设备汇聚,若发生拥塞,核心设备则根据拥塞程度组建CNM通知相应的终端降低速率。
图1中核心网络设备B6检测其出端口缓冲占用率并采样收到的帧,一旦发生拥塞即生成拥塞通知消息CNM,反压到造成拥塞的数据帧的源节点,其中检测拥塞的网络功能实体为拥塞检测点(CP),对拥塞情况进行反应并进行相应数据速率调节的功能实体为反应点(RP)。
由上述QCN机制可见,其核心组件主要是用于检测网络拥塞的CP和用于调整终端速率的RP,下面将分别就CP和RP的工作原理进行简要介绍。
(1)拥塞检测点
CP是通过对于当前缓存占用情况的衡量来决定是否需要调整当前来包的速率,以及调整幅度的大小;通过对来包采样来决定通知哪个源站点降低传送速率。CP的缓存如图2所示。
图2中,Qeq是一个门限值,通常为物理缓存的20%,Q为当前队列长度,Q off =Q -Q eq代表当前队列超出阈值的长度。定义Q old为上次反馈F产生时的队列长度,Q? =Q -Q old反应了自上一次F发送后的速度增加情况。则F的计算公式为:
这里w是一个非负常数,基准值为2。根据上述对于Q off和Q old的定义,当F为负(F =0时,说明没有拥塞发生,因此不需反馈拥塞消息。当F为负,即判断有拥塞发生时,CP将提取被采样报文的源地址作为CNM消息的目的地址,并将反应拥塞程度的参数信息作为CNM消息的有效负荷反压至源终端,令其降低数据传送速率。
