大型網(wǎng)站軟件系統(tǒng)特點(diǎn)
- 高并發(fā),大流量
- 高可用
- 海量數(shù)據(jù)
- 用戶(hù)分布廣泛,網(wǎng)絡(luò)情況復(fù)雜
- 安全環(huán)境惡劣
- 需求快速變更,發(fā)布頻繁
- 漸進(jìn)式發(fā)展
大型網(wǎng)站架構(gòu)演化發(fā)展歷程
- 初始階段的網(wǎng)站架構(gòu)(單服務(wù)器)
小型網(wǎng)站訪(fǎng)問(wèn)量人少, 應(yīng)用程序,數(shù)據(jù)庫(kù),文件資源都在同一臺(tái)服務(wù)器上。
- 應(yīng)用服務(wù)和數(shù)據(jù)服務(wù)分離
隨著用戶(hù)訪(fǎng)問(wèn)量的增長(zhǎng),需要更多的資源來(lái)承載用戶(hù)量, 因此需要需要將應(yīng)用和數(shù)據(jù)分離。
分離后將會(huì)用到 三臺(tái)服務(wù)器,應(yīng)用,文件,數(shù)據(jù)各一臺(tái),每臺(tái)服務(wù)器對(duì)應(yīng)的硬件資源要求各不相同。
應(yīng)用服務(wù)器:需要更快更高配置的cpu來(lái)處理大量的業(yè)務(wù)。
文件服務(wù)器:需要更大的磁盤(pán)來(lái)保存用戶(hù)上傳的文件。
數(shù)據(jù)服務(wù)器:需要更快的硬盤(pán)和更大內(nèi)存來(lái)快速檢索和數(shù)據(jù)緩存。
- 緩存提高性能
每次讀寫(xiě)都要從數(shù)據(jù)庫(kù)獲取數(shù)據(jù),會(huì)做成IO的壓力上升,瓶頸會(huì)隨著業(yè)務(wù)的發(fā)展慢慢出現(xiàn)。
這里可以通過(guò)使用緩存來(lái)緩解數(shù)據(jù)的壓力(根據(jù)二八定理基本80%的業(yè)務(wù)都集中在20%的數(shù)據(jù)上)。
緩存:本地緩存和分布式緩存
本地緩存:訪(fǎng)問(wèn)速度快但受到服務(wù)器內(nèi)存的限制
分布式緩存:相對(duì)訪(fǎng)問(wèn)速度慢點(diǎn),但可以通用集群來(lái)部署大內(nèi)存來(lái)緩存,理論上不受內(nèi)存的限制
- 使用集群提高并發(fā)處理能力
當(dāng)單臺(tái)服務(wù)器的運(yùn)算能力到達(dá)瓶頸的時(shí)候,不要企圖換更強(qiáng)大的服務(wù)器,畢竟單服務(wù)器的總有瓶頸的,通常做法是通過(guò)添加一臺(tái)服務(wù)器來(lái)分?jǐn)傇蟹?wù)器的壓力。
數(shù)據(jù)庫(kù)讀寫(xiě)分離(主從模式) 改善數(shù)據(jù)庫(kù)負(fù)載壓力
加速網(wǎng)站響應(yīng) 主要手段有CDN 和反向代理
CDN 和反向代理:都是使用緩存的技術(shù)來(lái)加速網(wǎng)站的響應(yīng),主要分別:
CDN:部署在網(wǎng)絡(luò)提供商的機(jī)房使用戶(hù)請(qǐng)求網(wǎng)站服務(wù)時(shí)可以從距離自己最近的網(wǎng)絡(luò)提供商機(jī)房獲取數(shù)據(jù)。
反向代理:部署在網(wǎng)站的中心機(jī)房,用戶(hù)發(fā)起請(qǐng)求是經(jīng)過(guò)反向代理服務(wù)器,如果反向代理服務(wù)器有緩存直接返回給用戶(hù)。
- 使用分布式文件系統(tǒng)和分布式數(shù)據(jù)庫(kù)
分布式數(shù)據(jù)庫(kù)是網(wǎng)站數(shù)據(jù)庫(kù)拆分的最后手段,只有在表單十分龐大的時(shí)候使用,文件系統(tǒng)也一樣。
網(wǎng)站常用的數(shù)據(jù)拆分手段是業(yè)務(wù)分庫(kù),將不同業(yè)務(wù)部署在不同的服務(wù)器上。
最終網(wǎng)站的業(yè)務(wù)越來(lái)越復(fù)雜,對(duì)數(shù)據(jù)的存儲(chǔ)和檢索的需求也越來(lái)越復(fù)雜,這時(shí)需要使用一些非關(guān)系數(shù)據(jù)庫(kù)如NoSql和非數(shù)據(jù)庫(kù)查詢(xún)技術(shù)如搜索引擎。
NoSql和搜索引擎都是源自互聯(lián)網(wǎng)的技術(shù)手段,對(duì)可伸縮性的分布式特性具有更好的支持。應(yīng)用服務(wù)器通過(guò)一個(gè)統(tǒng)一數(shù)據(jù)訪(fǎng)問(wèn)模塊訪(fǎng)問(wèn)各種數(shù)據(jù),減輕應(yīng)用程序管理諸多數(shù)據(jù)源的麻煩。
- 業(yè)務(wù)拆分
大型網(wǎng)站對(duì)應(yīng)負(fù)責(zé)的業(yè)務(wù)場(chǎng)景,通過(guò)分而治之的手段將整個(gè)網(wǎng)站的業(yè)務(wù)拆分不同的產(chǎn)品線(xiàn),如大型的購(gòu)物網(wǎng)站就會(huì)有首頁(yè),商鋪,訂單,賣(mài)家,買(mǎi)家等不同的業(yè)務(wù)線(xiàn),分歸不同的團(tuán)隊(duì)負(fù)責(zé)。
也可以將網(wǎng)站分為各個(gè)不同的應(yīng)用程序,每個(gè)應(yīng)用部署到不同的服務(wù)器上,然后同個(gè)首頁(yè)的導(dǎo)航和每個(gè)應(yīng)用關(guān)聯(lián)起立,也可以通過(guò)消息隊(duì)列進(jìn)行數(shù)據(jù)分發(fā),最多還是通過(guò)訪(fǎng)問(wèn)同一個(gè)數(shù)據(jù)存儲(chǔ)系統(tǒng)來(lái)構(gòu)成一個(gè)關(guān)聯(lián)的完整系統(tǒng)。
- 分布式服務(wù)
隨著業(yè)務(wù)的拆分越來(lái)越少,存儲(chǔ)系統(tǒng)越來(lái)越龐大,應(yīng)用系統(tǒng)的整體復(fù)雜度呈指數(shù)增長(zhǎng),部署維護(hù)越來(lái)越困難。由于所有應(yīng)用都有和數(shù)據(jù)庫(kù)系統(tǒng)連接,在數(shù)萬(wàn)臺(tái)服務(wù)器規(guī)模的網(wǎng)站中,這些連接數(shù)數(shù)服務(wù)器規(guī)模的平方,導(dǎo)致數(shù)據(jù)庫(kù)連接資源不足,拒絕服務(wù)。
既然每一個(gè)應(yīng)用系統(tǒng)都需要執(zhí)行許多相同的業(yè)務(wù)操作,比如用戶(hù)管理,商品管理等,那么可以將這些公用的業(yè)務(wù)模塊單獨(dú)出來(lái)做成一個(gè)服務(wù),獨(dú)立部署。由這些可復(fù)用的業(yè)務(wù)連接數(shù)據(jù)庫(kù),提供共用業(yè)務(wù)服務(wù),而應(yīng)用程序只需管理用戶(hù)界面,通過(guò)分布式服務(wù)調(diào)用公用服務(wù)完成具體操作。
參考資料:《大型網(wǎng)站技術(shù)架構(gòu) 核心原理和案例分析》 李智慧