【編者按】由Hortonworks、Mirantis、RedHat聯(lián)合發(fā)起的開源項目Sahara3月19日正式從OpenStack孵化項目中畢業(yè),成為其核心項目。該項目旨在為OpenStack用戶提供一種簡單、快捷地部署以及管理Hadoop集群的方案,作為云計算和大數(shù)據(jù)的橋梁之一,Sahara將會推動OpenStack云平臺和Hadoop的整合,下面看OpenStack中國社區(qū)王后明的這篇文章給我們帶來詳細介紹。
以下為原文:
OpenStack Sahara(舊稱:Savanna)項目的負責(zé)人Sergey Lukjanov昨天正式宣布,Sahara從OpenStack孵化項目順利畢業(yè),將從OpenStack下一版本Juno開始作為OpenStack核心項目之一。Sahara是在2013年由領(lǐng)先的Apache Hadoop貢獻方Hortonworks公司,最大的OpenStack 系統(tǒng)集成商Mirantis公司,以及全球領(lǐng)先的開源解決方案及最新版OpenStack的最大貢獻方紅帽公司聯(lián)合發(fā)起的,致力于共同在 OpenStack上實現(xiàn)Apache Hadoop,使OpenStack用戶能夠輕松供應(yīng)和管理彈性Hadoop集群,加快Hadoop在OpenStack上的開發(fā)和部署進程。
Apache Hadoop是MapReduce技術(shù)的一種實現(xiàn),目前被各行業(yè)廣泛采用,已成為大數(shù)據(jù)處理的行業(yè)標準。Sahara項目旨在為OpenStack用戶提供一種簡單、快捷地部署以及管理Hadoop集群的方案,類似于亞馬遜Elastic MapReduce (EMR) 服務(wù)。
Sahara項目的架構(gòu)圖如下:
用戶需要給Sahara提供一些信息來建立集群,比如Hadoop版本、集群拓撲、節(jié)點硬件詳情以及一些其它的信息。在用戶提供這些參數(shù)之后,Sahara將幫助用戶在幾分鐘之內(nèi)建立起集群,同樣還可以幫助用戶根據(jù)需求對集群進行擴展(增加或者刪除工作節(jié)點)。
云計算提供基礎(chǔ)架構(gòu)平臺,大數(shù)據(jù)應(yīng)用在這個平臺上運行,這是目前公認非常高效的處理大數(shù)據(jù)的方法之一。使用Sahara方案可有效滿足如下使用場景:
1. 在OpenStack云環(huán)境中快速部署Hadoop集群;
2. 更充分地利用通用OpenStack IaaS云環(huán)境中未被利用的計算資源;
3. 與亞馬遜EMR類似,為臨時的或突發(fā)的數(shù)據(jù)分析任務(wù),提供數(shù)據(jù)分析即服務(wù)(Analytics as a Service)
OpenStack和Hadoop的融合,既最大限度提高了服務(wù)器的資源利用率,又大大降低了大數(shù)據(jù)處理的準入門檻。可以預(yù)見,作為云計算和大數(shù)據(jù)的橋梁之一,Sahara將會推動OpenStack云平臺和Hadoop的整合,逐步進入大數(shù)據(jù)處理市場,更快速地借助云計算平臺和大數(shù)據(jù)處理技術(shù)把數(shù)據(jù)轉(zhuǎn)換為商業(yè)價值。
以“云計算大數(shù)據(jù) 推動智慧中國 ”為主題的 第六屆中國云計算大會 將于5月20-23日在北京國家會議中心隆重舉辦。產(chǎn)業(yè)觀察、技術(shù)培訓(xùn)、主題論壇、行業(yè)研討,內(nèi)容豐富,干貨十足。票價優(yōu)惠,馬上 報名 !
原文鏈接:OpenStack與Hadoop的融合-恭喜OpenStack大數(shù)據(jù)項目Sahara順利畢業(yè) (責(zé)編/魏偉)