面對大量用戶訪問、高并發請求,海量數據,可以使用高性能的服務器、大型數據庫,存儲設備,高性能Web服務器,采用高效率的編程語言比如(Go,Scala)等,當單機容量達到極限時,我們需要考慮業務拆分和分布式部署,來解決大型網站訪問量大,并發量高,海量數據的問題。
從單機網站到分布式網站,很重要的區別是業務拆分和分布式部署,將應用拆分后,部署到不同的機器上,實現大規模分布式系統。分布式和業務拆分解決了,從集中到分布的問題,但是每個部署的獨立業務還存在單點的問題和訪問統一入口問題,為解決單點故障,我們可以采取冗余的方式。將相同的應用部署到多臺機器上。解決訪問統一入口問題,我們可以在集群前面增加負載均衡設備,實現流量分發。
負載均衡(Load Balance),意思是將負載(工作任務,訪問請求)進行平衡、分攤到多個操作單元(服務器,組件)上進行執行。是解決高性能,單點故障(高可用),擴展性(水平伸縮)的終極解決方案。
本文是負載均衡詳解的第一篇文章,介紹負載均衡的原理,負載均衡分類(DNS負載均衡,HTTP負載均衡,IP負載均衡,鏈路層負載均衡,混合型P負載均衡)。部分內容摘自讀書筆記。
一、負載均衡原理
系統的擴展可分為縱向(垂直)擴展和橫向(水平)擴展。縱向擴展,是從單機的角度通過增加硬件處理能力,比如CPU處理能力,內存容量,磁盤等方面,實現服務器處理能力的提升,不能滿足大型分布式系統(網站),大流量,高并發,海量數據的問題。因此需要采用橫向擴展的方式,通過添加機器來滿足大型網站服務的處理能力。比如:一臺機器不能滿足,則增加兩臺或者多臺機器,共同承擔訪問壓力。這就是典型的集群和負載均衡架構:
應用集群:將同一應用部署到多臺機器上,組成處理集群,接收負載均衡設備分發的請求,進行處理,并返回相應數據。
負載均衡設備:將用戶訪問的請求,根據負載均衡算法,分發到集群中的一臺處理服務器。(一種把網絡請求分散到一個服務器集群中的可用服務器上去的設備)
負載均衡的作用(解決的問題):
1.解決并發壓力,提高應用處理性能(增加吞吐量,加強網絡處理能力);
2.提供故障轉移,實現高可用;
3.通過添加或減少服務器數量,提供網站伸縮性(擴展性);
4.安全防護;(負載均衡設備上做一些過濾,黑白名單等處理)
二、負載均衡分類
根據實現技術不同,可分為DNS負載均衡,HTTP負載均衡,IP負載均衡,鏈路層負載均衡等。
2.1 DNS負載均衡
最早的負載均衡技術,利用域名解析實現負載均衡,在DNS服務器,配置多個A記錄,這些A記錄對應的服務器構成集群。大型網站總是部分使用DNS解析,作為第一級負載均衡。
優點
使用簡單:負載均衡工作,交給DNS服務器處理,省掉了負載均衡服務器維護的麻煩
提高性能:可以支持基于地址的域名解析,解析成距離用戶最近的服務器地址,可以加快訪問速度,改善性能;
缺點
可用性差:DNS解析是多級解析,新增/修改DNS后,解析時間較長;解析過程中,用戶訪問網站將失敗;
擴展性低:DNS負載均衡的控制權在域名商那里,無法對其做更多的改善和擴展;
維護性差:也不能反映服務器的當前運行狀態;支持的算法少;不能區分服務器的差異(不能根據系統與服務的狀態來判斷負載)
實踐建議
將DNS作為第一級負載均衡,A記錄對應著內部負載均衡的IP地址,通過內部負載均衡將請求分發到真實的Web服務器上。一般用于互聯網公司,復雜的業務系統不合適使用。