l 首先騰訊云物理服務器都分布在T3及以上級別的機房,平均一年的宕機時間小于1.6小時,就好比一個人一年只休息少于1.6小時的時間,其余時間都在集中精力上班工作,其難度可想而知,除非發生不可抗力的災害,否則風火水電任意一個或一套組件發生故障,都不會造成業務受損,拋開風火水電等基礎設施不談,那么從網絡上來看,是如何保證服務器上聯網絡的可靠穩定呢?
l 網絡上的“三頭六臂”:三頭六臂體現在兩個方面,一方面,業務服務器采用雙上聯甚至多上聯的方式接入到上聯網絡設備,然后通過邏輯鏈路捆綁協議,把物理上的多條鏈路捆綁成邏輯上的一條,更有甚者在多條捆綁好的邏輯鏈路上利用OSPF或者BGP實現ECMP,這種情況下一條鏈路中斷,流量自動收斂到其余的鏈路上;另一方面,考慮到如果單臺業務服務器即便是雙上聯到網絡設備,如果網絡設備僅僅是單臺,那么還是存在單點故障,因此三頭六臂還體現在服務器上聯到多臺網絡設備上,規避單點風險
l 網絡上的“身外身”:單臺服務器的網絡既然已經這么可靠,但是如果把業務放在一臺虛擬機上那也是不夠明智的,極端情況下如果單臺服務器發生某種邏輯上的錯誤或者上聯的兩臺或者多臺網絡設備同一時間不可用,那么此時業務上的單機部署是致命的,“雞蛋永遠不能放在一個籃子里”道理會告訴你最好把業務部署在不同的物理服務器上,當然你可能要問:騰訊云上,我作為租戶,騰訊云物理服務器對于我來講是透明的,我并不清楚的虛擬機生產后的具體物理位置,我該如何部署我的業務呢?針對這種場景,騰訊云提供了【置放群組】的技術幫助您盡可能將CVM分散的部署在不同的物理服務器上,實現業務上的“身外身”具體實現請參考:https://cloud.tencent.com/document/product/213/15486,另外騰訊云服務器如果感知到網絡異常,利用HA技術可以自動將存在故障的服務器上的實例遷移到其他空閑的可用服務器上,在此過程中不會改變虛擬機子網及IP地址,但不論是【置放群組】還是HA技術,這一切都要依賴于構建在服務器之上的跨物理機、跨三層的overlay網絡,騰訊云通過自研的overlay網絡技術實現了同地域下同一VPC網絡的自由互通,支持租戶的單臺服務器的虛擬機實例自由的進行跨服務器、跨機柜的遷移以及業務層面上的橫向擴展,輕松的實現虛擬機的“身外身”;
當然了,整個機房內部網絡都采用多級CLOS組網架構,不同層級間采用了大帶寬、高冗余的設備和鏈路構建容錯能力強、故障切換快的網絡,保證機房內部的服務器可靠穩定的交互流量