盛大游戲云GCloud是一個(gè)全能型的游戲云平臺(tái),完全為游戲的需求定制,可以承接所有的游戲產(chǎn)品。高性能成熟穩(wěn)定,多種資源模型可供選擇,有5年、50多款游戲及其他業(yè)務(wù)的運(yùn)營支撐的經(jīng)驗(yàn)。在今年第二屆的游戲運(yùn)營技術(shù)論壇上,盛大游戲IDC部門經(jīng)理馮禎旺與大家分享了盛大游戲私有云GCloud是如何從內(nèi)部需求慢慢轉(zhuǎn)變到平臺(tái)產(chǎn)生的過程以及GCloud的特點(diǎn)和優(yōu)勢(shì)。馮禎旺擁有14年IT基礎(chǔ)架構(gòu)領(lǐng)域從業(yè)經(jīng)驗(yàn),在盛大IDC部門工作期間,將部門由只機(jī)房現(xiàn)場(chǎng)支持,做成現(xiàn)在獨(dú)立核算并已內(nèi)部盈利的云資源提供及運(yùn)營方。
盛大游戲IDC部門經(jīng)理馮禎旺
GCloud的誕生過程
馮禎旺表示以前在實(shí)際運(yùn)維過程中經(jīng)常受到來自業(yè)務(wù)部門和老板的雙重壓力,怎樣才能既支持好業(yè)務(wù)部門的業(yè)務(wù)又能很好地來控制運(yùn)營成本,是擺在運(yùn)營部門前面的一個(gè)很重要的難題。 隨后馮禎旺分享了他們5年來從單機(jī)虛擬化到虛擬化集群再到私有云、混合云的艱苦過程。
2008年-2009年,研究探索服務(wù)器虛擬化方案,同時(shí)進(jìn)行單機(jī)虛擬化的嘗試。盛大從2008年開始做云平臺(tái),當(dāng)時(shí)也是虛擬化云計(jì)算在國內(nèi)剛剛興起的時(shí)候,在一系列的探索和測(cè)試以后開始小規(guī)模的試用,2009年將一款有500多臺(tái)機(jī)器的端游傳世搬到平臺(tái)上。第一款產(chǎn)品是VMware的3.5免費(fèi)版,當(dāng)把游戲放上去時(shí)運(yùn)維管理機(jī)制就出現(xiàn)了問題,運(yùn)維管理缺少了一些機(jī)制、工具,相當(dāng)于物理機(jī)需要手工部署、管理每臺(tái)機(jī)器,過程相當(dāng)?shù)穆闊?/span>
與此同時(shí),盛大也在研究開源的方式,一方面為了提高運(yùn)維管理能力,另一方面避免被商業(yè)化的產(chǎn)品綁架。從2009年到2010年一直在測(cè)試評(píng)估KVM的單機(jī)虛擬化,在確認(rèn)適用性后開始遷移新的游戲,但是當(dāng)玩家人數(shù)較高時(shí)還是會(huì)出現(xiàn)問題,業(yè)務(wù)部門最關(guān)心的是穩(wěn)定性、可靠性,在經(jīng)過不斷的研究和測(cè)試以后終于找到相對(duì)穩(wěn)定的版本。
2010年:新增2款700+服務(wù)器的游戲全部遷移到開源虛擬化平臺(tái),開始研究集群。在隨后的一兩年中虛擬主機(jī)達(dá)到了一定規(guī)模,把七八百個(gè)服務(wù)器全部遷移到平臺(tái)上面來,但還是出現(xiàn)了兩個(gè)問題:第一預(yù)留空間較多,利用率低整合麻煩;第二故障以后恢復(fù)時(shí)間長。基于這兩個(gè)原因盛大開始研究集群的方案。最早考慮的是用開源的、分布式的、快存儲(chǔ)的方式,但是經(jīng)過較長的時(shí)間運(yùn)維和開發(fā)一起研究后發(fā)現(xiàn)像IOPS包括延時(shí)很難達(dá)到要求,而且也沒有足夠的人力和技術(shù)能力,所以退而求其次用商業(yè)化的存儲(chǔ)。
在之后2011年后推出這樣的方案,前期是用一些輕載的,對(duì)性能各方面要求不是特別高的業(yè)務(wù)在使用。同時(shí)單機(jī)和集群兩個(gè)一起來部署,可以根據(jù)不同業(yè)務(wù)的不同需求去利用。
2012年:集群給游戲業(yè)務(wù)使用,虛擬機(jī)比例達(dá)25%。到了2012年,在2011年的基礎(chǔ)之上推動(dòng)更多的業(yè)務(wù)放到新的虛擬化平臺(tái)上,很多運(yùn)維管理的問題通過后端的腳本一些工具來去做的。平臺(tái)也在專門的開發(fā)部門安排下根據(jù)各方面需求緩慢開發(fā)。當(dāng)平臺(tái)發(fā)展得比較大,虛擬機(jī)比例達(dá)25%左右的時(shí)候,在集群的基礎(chǔ)設(shè)施方面也做了一些改善,用刀片機(jī)加一套商業(yè)化的存儲(chǔ),部署變得非常方便。
2013年:虛擬機(jī)比例達(dá)1/3,研究私有云GCloud。2013年是頁游、手游是快速發(fā)展的時(shí)期,手游也是公司業(yè)務(wù)重要的戰(zhàn)略方向。面對(duì)手游、頁游上線快、資源彈性需求高的特點(diǎn),特別是手游,前面兩個(gè)方案也會(huì)遇到一些問題。隨后盛大對(duì)集群的方案做一些優(yōu)化:重組集群形成一個(gè)池子,存儲(chǔ)里面根據(jù)不同類型的分為三部分:前端是高性能容量低的機(jī)柜,中間是性能、容量適中的,最后是性能較低但容量較高的。這樣可以根據(jù)業(yè)務(wù)的變化靈活調(diào)整,使整個(gè)平臺(tái)能夠有更好的彈性,也可以更快響應(yīng)業(yè)務(wù)部門的需求。
同時(shí)開發(fā)部門在研發(fā)平臺(tái)過程還是存在很多問題,所以決定不再沿用原來的不同模塊的開發(fā),而是用全新的開源系統(tǒng)根據(jù)內(nèi)部的需求去做,同時(shí)把中間的一些接口和通道打通,包括定制自己的措施和運(yùn)營管理的界面和平臺(tái)。幾個(gè)月的時(shí)間后Beta版上線,同時(shí)結(jié)合以前的資源基本上比較好的能夠滿足資源彈性要求比較高的這樣一些業(yè)務(wù)的需求。
2014年:虛擬機(jī)比例近1/2,將GCloud打造成全能型的混合云。2014年中推出了Gcloud 1.0正式版。Gcloud 1.0同時(shí)有三種資源模型,第一種就是前面提到的彈性集群,滿足傳統(tǒng)的性能和網(wǎng)絡(luò)要求都不高的業(yè)務(wù);第二種是為了滿足高IO性能、低延遲、高網(wǎng)絡(luò)性能需求而推出的高性能定制化的云主機(jī);第三種是滿足更多特定要求的物理機(jī)。形成一個(gè)完整的資源解決方案,GCloud被打造成全能型游戲運(yùn)營平臺(tái)。
GCloud的特點(diǎn)和優(yōu)勢(shì)
GCloud現(xiàn)在能滿足手游、頁游、端游等所有游戲的資源需求,成本低于同配置公有云虛擬機(jī),目前在GCloud上面有四十多款的端游和十多款的手游和頁游,可用性一直是99.95%+。GCloud有以下幾個(gè)特點(diǎn)和優(yōu)勢(shì):
模塊化可擴(kuò)展
高性能
高穩(wěn)定性
久經(jīng)考驗(yàn)
5年以上的穩(wěn)定運(yùn)營的經(jīng)驗(yàn),從產(chǎn)品到運(yùn)維,到現(xiàn)在已經(jīng)有50多款端游,還有30多款游戲項(xiàng)目之外的其他的應(yīng)用,完全從游戲的需求出發(fā)定制的。最具游戲支撐經(jīng)驗(yàn)?zāi)軌驖M足所有游戲業(yè)務(wù)的需求。
高靈活性
豐富的資源加優(yōu)質(zhì)網(wǎng)絡(luò)
公司所有游戲和其他業(yè)務(wù)的需求,共享統(tǒng)一的資源池
; 幾千臺(tái)常備服務(wù)器、幾百個(gè)可用機(jī)柜作為后備資源池,且根據(jù)具體需求每季度補(bǔ)充。