多多色-多人伦交性欧美在线观看-多人伦精品一区二区三区视频-多色视频-免费黄色视屏网站-免费黄色在线

國內最全IT社區平臺 聯系我們 | 收藏本站
阿里云優惠2
您當前位置:首頁 > 互聯網 > 九頭蛇與大象之爭,Hydra或將取代Hadoop

九頭蛇與大象之爭,Hydra或將取代Hadoop

來源:程序員人生   發布時間:2014-09-16 11:33:29 閱讀次數:2096次

【編者按】Hadoop被認為是最好的大數據分析平臺,本身就具有較好的性能,還有活躍的開源社區支持,Hadoop創始人Doug Cutting也曾預言未來Hadoop不僅僅用于大數據處理,還將成為數據平臺的系統內核,將用于在線事務處理……Hadoop的發展前景似乎一片光明,卻沒有注意到競爭者的出現,Hydra在某些方面甚至具有比Hadoop更加優越的性能,宣布開源以后,Hydra得到了越來越多的支持,未來Hydra極有可能成為Hadoop強勁的競爭對手,Datanami的主編Alex Woodie為我們帶來了詳細分析。


CSDN推薦:歡迎免費訂閱《Hadoop與大數據周刊》獲取更多Hadoop技術文獻、大數據技術分析、企業實戰經驗,生態圈發展趨勢。

以下為譯文:

Hydra(九頭蛇),分布式任務處理系統,由社交標簽服務提供商AddThis六年前開發,現已開源,就像Hadoop一樣,只是還沒有Hadoop那樣的知名度和聲勢。Hydra的創造者稱,該“多頭”平臺非常擅長處理一些大的數據任務――對非常大的數據集進行實時處理,這樣的任務恐怕會讓那只大象(Hadoop)很頭疼。

Hadoop仍然是一個儲存大量數據的優秀平臺,但很多公司面臨著另一個問題,我們將數據存儲到Hadoop之后如何去分析數據,無論是Hive還是Pig都需要方便地訪問Hadoop中的數據,才能從中獲得的價值。正如我們看到的:Hadoop用于實時分析并不合適。

Hydra是一個大數據存儲和處理平臺,由Matt Abrams和他的AddThis同事們共同開發完成。AddThis也就是過去的Clearspring,是開發Web服務器窗口小部件的公司,使訪問者可以通過Twitter、Facebook、Pintrest、Google +或者Instagram輕松共享他們的數據。


當AddThis開始逐漸擴大其業務時,它對越來越多的用戶數據漸漸感到無能為力。該公司需要一個可擴展的分布式系統,對其用戶共享的這些數據進行實時分析。那時Hadoop無法滿足AddThis的需求,所以它開發了Hydra。

那么,Hydra到底是什么?簡而言之,它是分布式的任務處理系統,可以同時支持流處理和批處理。它利用一種基于樹的數據結構來存儲和處理具有數千個節點集群的數據。它具有一個基于Linux的文件系統,這使得它可以與ext3、ext4甚至ZFS兼容;它還具有作業/集群管理組件,可以自動為集群分配新的作業和平衡已有的作業;系統還可以自動將數據備份,并自動處理節點故障。

Hydra包括很多的組件:跨異構集群處理任務的分布式作業執行系統、可網絡訪問的文件服務系統,還有本地備份及遠程備份(考慮到難以預防的節點故障)。

基于樹形結構使它可以在同一時間處理流數據并進行批處理作業。AddThis工程部門的一位成員Chris Burroughs在他1月23日的博客中首次宣布Hydra開源,還提供了對于Hydra精辟的描述:“它攝取流數據(比如日志文件),并生成聚合樹、 摘要樹或者數據轉換樹,這些樹可用來探索(小型查詢),作為機器學習的一部分(大型查詢)、或者在網站上支持實時控制臺(大量的查詢)。”

Hydra最初是用以幫助AddThis解決自身問題,供內部使用,以及為網站運營商提供服務。典型的問題包括:“上個月有多少用戶訪問網站?”以及“網站從不同國家和瀏覽器獲得訪問量分別有多大?”

AddThis繼續使用Hydra來處理其大規模的數據流量,分析其客戶得到網站的發展趨勢。AddThis可以了解人們在線分享了什么,哪些話題比較熱門。社交標簽服務被超過1300萬的網站使用,一個月有13億用戶訪問,平均每天30億訪問量產生10TB數據,現在Hydra在AddThis的上千個網絡節點上運行著。

Abrams通過郵件告訴Datanami:“我們處理大型數據集已經很長時間了,Hydra一直以來對我們都非常有用,我們覺得它以獨特的方式解決了分布式數據處理的問題。”

傳統的Hadoop面向批處理,而Hydra可以同時支持批處理和實時流處理。Abrams說:“Hydra支持的批處理主要側重流分析和增量數據處理,能夠使用樹形數據結構描述數據,對自然數據進行壓縮及高效查詢和訪問。Hydra可以從HDFS中生產和接受數據,但它在本機文件系統上完成操作,這使其可以在Hydra上靈活地使用其他服務。”

現在Hydra已經開源,Abrams希望該軟件會被更加廣泛的使用,并得到更好的發展。“這將需要一些時間,但我們相信未來我們將建成一個完善的Hydra開源社區,這樣AddThis和OS(開源)社區都可以從Hydra未來的發展中受益。在華盛頓特區已經有一些其他公司在使用Hydra了,我們很期待Hydra社區得到進一步的發展。”

2013秋天,Doug Cutting,Hadoop的創始人也是Cloudera的首席架構師感嘆Hadoop缺乏替代品――那時Cutting說:“我多么期待能有更多像Hadoop一樣的系統出現……”雖然如今Hadoop在大數據界占據了主導地位,但誰又能說它會是唯一的一個大數據分布式計算平臺?相信未來Hydra的發展不會令他失望,對于未來Hydra的發展,我想引用Cutting的另一句話:“天空才是極限。”

原文鏈接:Hadoop Alternative Hydra Re-Spawns as Open Source(編譯/毛夢琪 審校/魏偉)


以“云計算大數據 推動智慧中國”為主題的第六屆中國云計算大會將于5月20-23日在北京國家會議中心隆重舉辦。產業觀察、技術培訓、主題論壇、行業研討,內容豐富,干貨十足。票價優惠,馬上報名
生活不易,碼農辛苦
如果您覺得本網站對您的學習有所幫助,可以手機掃描二維碼進行捐贈
程序員人生
------分隔線----------------------------
分享到:
------分隔線----------------------------
關閉
程序員人生
主站蜘蛛池模板: 国产一区二区在线 |播放 | 亚洲乱码一区二区三区在线观看 | 免费jizz在线播放视频高清版 | 精品久久久久久影院免费 | 最近中文字幕大全高清在线 | 成人看片毛片免费播放器 | 多人做人爱视频在线观看 | 日本xxxx护士hd| 久久久国产一区二区三区 | 欧美精品aaa久久久影院 | 爱爱精品视频 | 欧美第一页在线观看 | 看片一区| 大番蕉尹人一线久久 | 暴力欧美娇小 videos | 国产精品久久久久无毒 | 欧美日韩国产亚洲一区二区三区 | 性xx视频| 男女爽爽无遮挡午夜视频在线观看 | 国产成人综合网亚洲欧美在线 | 欧洲成人在线视频 | 一本之道免费视频 | 最近最新中文字幕国语片 | 欧美视频三级 | 亚洲午夜伦理 | 欧美人与性动交α欧美精品 | www视频网站 | 欧美一区二区三区免费不卡 | www操操| 黄网址大全免费观看免费 | 波多野结衣一区二区在线 | 国产亚洲欧洲精品 | 国产精品免费_区二区三区观看 | 成人免费视频一区二区三区 | 欧美一区二区三区成人看不卡 | 亚洲qingse中文字幕久久 | 天堂在线视频 | 欧美黑人巨大xxxx | a毛片免费看 | 国产日韩欧美一区 | 最近新中文字幕大全高清视频 |