摘 要 路由集群技术是近年应对用户大数据,高吞吐量需求快速发展的一个趋势。本文通过对集群技术的简要介绍并结合实际案例中网络改造前后的使用效果对比,阐述了集群路由器的采用给运营数据网络中带来的重要作用。
关键字 IP网络、路由器、集群、扁平化、吞吐量、负载均衡、策略路由
Tim Berners-Lee免费把互联网的构想推广到全世界,让互联网科技获得迅速的发展,深深改变了人类的生活面貌,互联网应用从最初的bbs,电子邮件,Web浏览,mud文字游戏等等,发展到今天的P2P下载、高清在线视频、云计算、物联网业务等,无论是从应用模式,还是网络流量,都发生了翻天覆地的变化。互联网应用已经大大地改变了人们的生活模式。
根据工信部发布的数据,截至2012年6月底,中国网民总人数达到5.38亿,互联网普及率已经达到39.9%。相应地,互联宽带网络的设备能力也在不断地提升,尤其是骨干网的核心高端路由器。IP网络的电信化对高端核心路由器在容量、安全可靠性、多业务承载能力等方面提出了极高的要求,骨干网核心路由器必须具有良好的扩展性和升级能力,以适应互联网多变、飞速发展的趋势,核心骨干网络设备对计算能力、转发能力和端口密度都提出了更高的要求。传统路由器在可靠性、性能可扩展性、规模可扩展性和服务可扩展性等方面有其难以逾越的障碍,已经不能满足下一代互联网的发展需求怎样实现核心层设备“大容量、可扩展”的特性,用更加简单且方便维护的网络架构来满足网络核心交换和互联的需求,正是运营商目前最关心的问题。
路由器集群技术通过集中化、一体化的控制管理,将两台或两台以上普通核心路由器(线卡框)通过中央交换网络(中央框)连接起来组成一个统一的路由系统,使集群系统各台路由器单机之间能够很好地协同工作,极大的扩展了路由器的容量,从而突破了单机在开发技术工艺上的限制。在成本方面,由于集群系统中各台路由器通过高速光背板互连,节省了额外的内部互联端口,大大减少了投资。更为重要的是,由于集群路由器对外仅体现为一台路由器,使得网络拓扑和路由策略变得简单和清晰,维护也更加方便快捷,不改变网络结构,应对网络容量的不断增大、充分保护既有投资,多机框集群技术成为必然选择。
从2004年6月思科发布第一台集群路由器产品CSR-1,至今已形成Cisco CSR系列、JuniperT系列、华为NE5000、中兴T8000等多个品牌多个系列产品,集群路由器也由少数大运营商用得起的‘王谢堂前燕’,逐渐进入普通运营商的‘寻常百姓家’。
当然,任何事物都有一个分久必合,合久必分的过程,集群路由技术固然给系统的扩容,运行稳定性带来了巨大的好处,但同时由于集群线缆、集群框的引入,又给设备带来了需要集中部署的要求。这也间接降低了整个系统的异地容灾性能,相信伴随随着OTN技术的进化,会逐渐演化出具备异地部署能力的集群路由产品。本文就不对此进行进一步的探讨了。
笔者长期从事数据网络规划设计与数据网络运维工作,下面以我司具体案例阐述集群技术的采用给城域网和出口路由带来的显著成效。
![]() |
图1
原有宽带城域数据网结构如图所示,十几个边缘站点设备通过OSPF路由分别连接至较近的2个核心站点,4个核心主站点各采用一台ne80高性能路由器进行路由汇聚转发,最终将数据上送至出口路由器,这种路由分布结构也是很多运营商普遍采用的架构。
这种结构有几个关键点需要特别留意
1、 汇聚接入层稳定性较好,容灾性强,采用OSPF双归路由保护边缘接入站点,一旦接入侧某条光链路中断或发生某个端口故障,业务流数据会自动通过osfp路由调整到其他链路。
2、 核心数据路由流量需要根据用户使用情况进行人为干预调整。由于ne80路由器为2.5G产品,4台核心路由器之间采用2.5Gpos进行互联,极端情况下可能出现用户带宽不均衡的情况,需要通过人工调整ospf权值进行流量优化,达到负载均衡的效果。
3、 核心路由器与出口路由器多个出口之间的策略路由分布比较复杂。需要考虑到2台不同出口路由器之间的流量走向及策略路由分布,以及出现紧急故障时的应急切换,需要在两台出口路由器上设置多个不同的源地址及目的地址策略路由。无法实现真正的热备冗余,一旦某台设备出现硬件故障,将影响用户对相应相应出口的访问,并且需要通过比较繁琐的操作将该部分业务切换到另外一台设备上,处理不慎会导致路由异常,甚至可能会引起部分片区用户无法正常上网。
4、 扩容成本较高。4台核心路由器分布在4个不同的机房,扩容时需要根据每个机房所挂接的业务量追加相应数量的板卡及端口,而且ne80大容量端口密度低,单板价格高,无形中又提高了扩容的成本。原来的网络架构已无法满足大容量的用户增长需求。
用户的发展需求是推动运营商进行网络改造的源动力,原来的网络经过多次扩容后,设备可用的板卡槽位已经所剩无几,扩容性价比低。而且对原有2.5G平台进行再进行扩容也不符合低投入,高产出,提高能效比的总体要求。通过与多个设备厂商进行多次的方案探讨和多轮的技术论证,我们逐渐把核心和出口路由器升级方案锁定为集群架构,并得到了司领导的大力支持。集群设备选型范围在华为、中兴、思科、juniper等几家主流厂家。
最终采用中兴T8000 1+2集群对网络进行升级改造后,把核心汇聚路由器与出口路由器合二为一,实现了从核心汇聚到出口的完全热备冗余,整个汇聚及出口共用一套高性能集群,实现了路由的扁平化,大大简化了路由的跳数,最大限度的提升了路由的可靠性。另外由于采用同一套策略路由,不需要进行设备间的流量穿透及路由学习,所有流量均通过集群设备背板或集群线缆传送,数据的转发效率和稳定性也得到极大提升和保障。
将整个网络由之前的核心、汇聚、接入3层网络结构缩减为核心、汇聚/接入2层结构,整个网络呈大容量、扁平化、少居所组网架构,极大地简化了网络结构,减少了网络的路由跳数,同时使得整个网络具备高性能、高容量、高可靠性和可扩展性。通过此次项目建成了一张满足公司当前的发展需求,并适度超前着眼于未来3到5年网络和业务发展需要,适应未来“三网融合”趋势的城域骨干网络
采用中兴T8000 1+2集群对网络进行升级改造后的架构图
图2
图3 图4
如图3所示,对于不需经过防火墙的数据,原有网络架构中A处的数据如果要发到出口D,通过路由tracert,可以发现路由走向需要经过B1-B2-B3-C2 四跳链路,而在改造过的集群路由系统中,无论从哪个接入接入机房访问哪个出口,tracert路由均只需经过1跳链路即可直达目标,效率成指数倍提高。
图5
原网络结构中对于需要经过防火墙的流量数据,流向则更为复杂,不仅需要根据实际路由匹配相应的源地址或目的地址策略,还要考虑到网络流量的均衡情况,如图5所示,从A处发出,送到出口D的需要经过防火墙数据,需要经过B1-B4-C1-防火墙-C2方可到达出口D处,而且各个不同接入站点发到不同出口的数据流向均不相同,都需要有针对性的设置策略路由。
图6
而在集群路由网络架构中,则可以给根据出口选择设定一套固定的策略路由,无需根据数据来源的不同接入站点路由信息进行繁琐的路由处理,对于需要经过防火墙的不论从哪个接入站点来的数据,只需统一经过集群-防火墙-集群即可到达指定出口,大大简化了配置的数据量,同时也降低了出现故障的可能。
ZXR10 T8000路由器,其高速路由转发、大容量分组交换、流量管理三大核心芯片均由中兴通讯北美研究所自主研发,采用业界领先的45nm工艺,能够提供单槽位100G线速转发能力,全面提供对IPV4/V6的支持。值得一提的是,T8000路由器可以通过中心机框将业务机框互联构成集群系统,大大提高了整机的数据转发能力,同时集群系统在逻辑上仍表现为一个节点,其网络拓扑结构简单清晰,维护方便,实现了网络扁平化。
目前这套集群系统已经在厦门广电网络中已稳定带载运行了将近1年时间,运行稳定,使用情况良好。使网络运维,网络升级改造工作告别了原来的零敲碎打,修修补补的阶段,对整个网络运行的稳定性,可靠性的提升带来了巨大的提升。
参考文献
【1】 王志刚,路由器集群技术,硅谷,2010
【2】 彭莎,路由器多框集群中IP转发测试技术的研究与实现,湖南大学,2010