過去二十年,從看文字資訊,到后來看圖片集錦,再到現(xiàn)在看視頻,互聯(lián)網(wǎng)內(nèi)容不斷更新迭代,信息量變得越來越大、可視性也越來越強(qiáng)。短視頻也因此應(yīng)運(yùn)而生,并且迅速占據(jù)我們工作、生活之余的大部分碎片時間,目前,單獨(dú)一個短視頻平臺的日播放量就能高達(dá)到100億次。
在短視頻業(yè)務(wù)快速擴(kuò)張的背后,是各種技術(shù)的不斷革新包括移動終端性能的提升,移動網(wǎng)絡(luò)的提速,當(dāng)然還有后端計算平臺的日益強(qiáng)勁和穩(wěn)健。
當(dāng)我們從看圖時代轉(zhuǎn)向視頻時代時,又需要什么樣的變革來適應(yīng)新的業(yè)務(wù)應(yīng)用?
開展短視頻業(yè)務(wù)前,你需要先了解這些數(shù)字
每月PB級的數(shù)據(jù)存在哪?
相對于文字和圖片,視頻的存儲需要更大的空間。以國內(nèi)某短視頻平臺的對外公開數(shù)據(jù)來看,其平臺注冊用戶超過5億,日活躍人數(shù)8000萬,每天新增的段視頻數(shù)量1000萬,按照1條57s的視頻大小6MB左右來算,僅從存儲的視頻容量來看,平臺每月新增的短視頻容量都將超過1PB.那我們再算下,按照單塊硬盤8T,每臺服務(wù)器12塊硬盤,那么每月僅為了存儲這些視頻就新增12臺服務(wù)器。
如何面對80%的 冷 卻不可舍棄的數(shù)據(jù)?
視頻行業(yè),不論是短視頻,還是直播,又或是視頻網(wǎng)站,他們的數(shù)據(jù)都有著一個共同的特點(diǎn) 數(shù)據(jù)的熱度不均且變化較快。比如據(jù)統(tǒng)計,大部分上傳的數(shù)據(jù)的高熱度狀態(tài)僅能保持1周甚至更短的時間。在數(shù)據(jù)中心中熱數(shù)據(jù)、溫數(shù)據(jù)和冷數(shù)據(jù)占總數(shù)據(jù)量的比例約為5%、15%、80%.冷數(shù)據(jù)也可以被叫做 低價值度的數(shù)據(jù) ,因為它們占用著大部分的存儲空間,但是通常不會再產(chǎn)生價值(被觀看)。
但是,從一方面來看短視頻從本質(zhì)上來講類似QQ空間、微信朋友圈,是一種記錄生活的平臺,因此平臺需要保證保有的數(shù)據(jù)不會被刪除,因此這80%的數(shù)據(jù)成為 沒有價值 但是不能被舍棄的 雞肋 數(shù)據(jù)。
如何安全且低成本地保存這些低價值度的視頻數(shù)據(jù)?
高功耗的存儲服務(wù)器將帶來居高不下的運(yùn)營成本
服務(wù)器產(chǎn)品在維護(hù)階段具有周期長、維護(hù)成本高的特點(diǎn),一般而言2年的維護(hù)成本就會超過購買成本。所以在設(shè)備運(yùn)行過程中降低耗電量和簡化維護(hù)成了必須重視的工作。
目前國內(nèi)大部分的存儲服務(wù)器仍是采用通用服務(wù)器的配置,并沒有針對溫冷數(shù)據(jù)的存儲應(yīng)用進(jìn)行優(yōu)化。因此目前大多數(shù)數(shù)據(jù)中心中的存儲系統(tǒng)都處于低負(fù)載卻高功耗的狀態(tài),如何把存儲集群的功耗降下來,是把數(shù)據(jù)中心從成本中心轉(zhuǎn)為利潤中心的關(guān)鍵之一。
浪潮SA5224M4存儲集群
短視頻背后的數(shù)據(jù)中心需要怎樣的存儲架構(gòu)
計算和存儲分離,讓專業(yè)的機(jī)器做專業(yè)的事
短視頻背后的數(shù)據(jù)中心架構(gòu)其實并不是特別復(fù)雜,從視頻采集端到客戶端,編解碼、用戶特征分析由專門的計算節(jié)點(diǎn)完成;CDN節(jié)點(diǎn)負(fù)責(zé)熱點(diǎn)視頻的緩存加速和分發(fā);高密度的存儲節(jié)點(diǎn)用于存儲平臺的視頻數(shù)據(jù)。
CDN節(jié)點(diǎn),考慮如何讓熱點(diǎn)數(shù)據(jù)最快發(fā)出
由于視頻流量大,因此CDN節(jié)點(diǎn)所承載的吞吐量較大,因此對于存儲容量和擴(kuò)容的便捷度要求更高。另外由于CDN需要存儲的數(shù)據(jù)熱度不一,比如1年前的自拍視頻,和最熱網(wǎng)紅的最新出品的點(diǎn)擊率有天壤之別。因此,視頻數(shù)據(jù)需要分級存儲,將不同熱度數(shù)據(jù)放在不同的存儲介質(zhì)中,充分發(fā)揮部件的利用效率,提升存儲能效比。
對于CDN服務(wù)器的選擇,通常會需要計算和存儲兩類服務(wù)器來支撐:計算型主要用于處理分發(fā)任務(wù)等,CPU采用較高主頻即可,對于內(nèi)存和硬盤容量的要求并不高;存儲型則用于在關(guān)鍵節(jié)點(diǎn)的數(shù)據(jù)存儲和快速分發(fā),因此要求IT架構(gòu)中需要大容量的SSD或者高速HDD來應(yīng)對。
在服務(wù)器的選擇上可以考慮浪潮SA5212M5這種計算存儲均衡類服務(wù)器,。在存儲性能上,SA5212M5搭配12塊大容量SATA硬盤,單塊容量達(dá)到8T,單機(jī)可容納96T的CDN數(shù)據(jù),滿足CDN集群的龐容量需求。而對于相對熱的數(shù)據(jù),SA5212M5中可加入的4塊2.5寸SSD盤位,將提升系統(tǒng)整體響應(yīng)速度,經(jīng)實測,使用SSD固態(tài)硬盤后單臺服務(wù)器的服務(wù)能力提升了1倍以上。
高密存儲節(jié)點(diǎn),考慮如何提升存儲能效比
作為存儲節(jié)點(diǎn)的高密度服務(wù)器本身不需要太高的計算處理性能,因此可以選擇基于Intel Xeon-D處理器家族的SA5224M4機(jī)型,搭配單顆D-1521 CPU,借助Xeon-D的SOC特性和低功耗優(yōu)勢,通過大容量8T硬盤的使用,以追求更優(yōu)的TCO收益。
從實際測試數(shù)據(jù)來看來看,搭載D-1531 CPU的SA5224M4的計算性能已經(jīng)達(dá)到原E5-2620V3 平臺服務(wù)器的80%左右,但是單CPU的TDP(散熱設(shè)計功耗)只用45W,相比傳統(tǒng)E5 CPU功耗降低35W以上。一般服務(wù)器的生命周期為三年,這樣算下來,1000臺的存儲服務(wù)器集群就能節(jié)省下至少1050萬的電費(fèi)。
高硬盤IO和網(wǎng)絡(luò)IO
在短視頻的傳遞鏈條中,從用戶端上傳的視頻可以直接存入4U36盤位組成的存儲集群中,并通過分布在各地的CDN節(jié)點(diǎn)傳送給用戶端觀看,這樣自然對后端存儲服務(wù)器的硬盤IO表現(xiàn)有著較高的要求。而目前應(yīng)用的SA5224M4機(jī)型,其36盤位順序?qū)懙目値捊咏?.8GB,順序讀接近6GB,有力支撐了這種硬盤高IO讀寫的性能需求。此外,借助SA5224M4的板載萬兆優(yōu)勢,可構(gòu)建起10Gb的內(nèi)部高速互聯(lián)網(wǎng)絡(luò),保障了數(shù)據(jù)訪問和傳輸所需的網(wǎng)絡(luò)帶寬。
更高的機(jī)柜部署密度
同時,衡量服務(wù)器的磁盤密度不僅要看每U空間支持的磁盤數(shù)量,更要放在機(jī)房供電環(huán)境下評估單機(jī)柜支持的磁盤密度?;贗ntel Xeon-D平臺的集成性和低功耗優(yōu)勢,在20A的機(jī)柜中,42U的空間內(nèi),SA5224M4可部署9-10臺,單機(jī)柜磁盤部署密度提升25%,即以往雙路4U36需要部署5個機(jī)柜的磁盤密度,當(dāng)前4個機(jī)柜就能解決。不僅提高了單機(jī)柜供電利用效率,更減少了租賃機(jī)柜的數(shù)量,節(jié)省服務(wù)器生命周期內(nèi)的運(yùn)營成本。
基于Xeon-D平臺的浪潮SA5224M4高密存儲服務(wù)器
短視頻無疑是2017年投資的風(fēng)口,在互聯(lián)網(wǎng)巨頭爭相布局的同時,不妨審視一下自己的數(shù)據(jù)中心:你真的為海量視頻資源找到理想的存儲選擇了嗎?
文章編輯:CobiNet(寧波)
本公司專注于電訊配件,銅纜綜合布線系列領(lǐng)域產(chǎn)品研發(fā)生產(chǎn)超五類,六類,七類線,屏蔽模塊,配線架及相關(guān)模塊配件的研發(fā)和生產(chǎn)。
?2016-2019寧波科博通信技術(shù)有限公司版權(quán)所有浙ICP備16026074號