多多色-多人伦交性欧美在线观看-多人伦精品一区二区三区视频-多色视频-免费黄色视屏网站-免费黄色在线

國(guó)內(nèi)最全I(xiàn)T社區(qū)平臺(tái) 聯(lián)系我們 | 收藏本站
阿里云優(yōu)惠2
您當(dāng)前位置:首頁(yè) > 互聯(lián)網(wǎng) > 延遲250毫秒損失數(shù)百萬(wàn)美元,Hadoop系統(tǒng)該如何應(yīng)對(duì)實(shí)時(shí)任務(wù)

延遲250毫秒損失數(shù)百萬(wàn)美元,Hadoop系統(tǒng)該如何應(yīng)對(duì)實(shí)時(shí)任務(wù)

來(lái)源:程序員人生   發(fā)布時(shí)間:2014-09-06 15:51:18 閱讀次數(shù):2860次

【編者按】如果由于你的系統(tǒng)性能低下而造成業(yè)務(wù)處理緩慢、延遲現(xiàn)象嚴(yán)重,那你應(yīng)該認(rèn)真考慮是否該選擇一個(gè)更好的Hadoop發(fā)行版了,因?yàn)榫W(wǎng)站性能的低下已經(jīng)嚴(yán)重影響到銷售轉(zhuǎn)化率,250毫秒的延遲可能意味著幾百萬(wàn)美元的損失。不同的發(fā)行版之間有著很大的差距,如何選擇一個(gè)好的發(fā)行版,怎樣改進(jìn)現(xiàn)有的發(fā)行版,當(dāng)然低成本也是必須要考慮的問(wèn)題,MapR企業(yè)營(yíng)銷部門副總裁Michele Nemschoff為我們找到了答案。


CSDN推薦:歡迎免費(fèi)訂閱《Hadoop與大數(shù)據(jù)周刊》獲取更多Hadoop技術(shù)文獻(xiàn)、大數(shù)據(jù)技術(shù)分析、企業(yè)實(shí)戰(zhàn)經(jīng)驗(yàn),生態(tài)圈發(fā)展趨勢(shì)。

以下為譯文:

在Apache Hadoop的起步階段,主要支持類似搜索引擎的功能。如今,Hadoop已經(jīng)被數(shù)十個(gè)行業(yè)采用,它們依靠大數(shù)據(jù)計(jì)算來(lái)提升業(yè)務(wù)處理性能。政府、制造業(yè)、醫(yī)療保健、零售業(yè)和其他部門越來(lái)越多的從經(jīng)濟(jì)發(fā)展和Hadoop計(jì)算能力中受益,然而受到傳統(tǒng)企業(yè)解決方案限制的公司將會(huì)發(fā)現(xiàn)競(jìng)爭(zhēng)變得越來(lái)越殘酷。

選擇一個(gè)合適的Hadoop發(fā)行版和在業(yè)務(wù)中應(yīng)用Hadoop一樣有必要。最終,你會(huì)發(fā)現(xiàn)選擇哪種Hadoop發(fā)行版取決于主機(jī)的規(guī)格,盡管性能和擴(kuò)展性才是你應(yīng)該仔細(xì)檢查的兩個(gè)主要特性。讓我們了解一下一些具體的Hadoop性能和擴(kuò)展性要求,以及對(duì)幾個(gè)關(guān)鍵架構(gòu)的要求。

性能

企業(yè)需要擺脫傳統(tǒng)的數(shù)據(jù)庫(kù)解決方案來(lái)管理數(shù)據(jù),主要原因是為了增加原始性能并獲得可擴(kuò)展性。這可能會(huì)讓你感到驚訝,因?yàn)椴⒉皇撬袆?chuàng)建出的Hadoop分布系統(tǒng)都一樣。

在我的另一篇文章中曾講到,增加250毫秒的延遲可能會(huì)毀掉整個(gè)線上銷售的旺季,我們可以了解一下為什么性能的低下(高延遲)會(huì)讓人難以忍受。網(wǎng)站性能的遲緩會(huì)使線上的銷售轉(zhuǎn)化率下降7%,這對(duì)于流量很大的線上零售商來(lái)說(shuō)意味著數(shù)百萬(wàn)美元的損失。

正如你在下圖看到的那樣,將MapR M7版本與另一個(gè)Hadoop發(fā)行版對(duì)比,在延遲上的差別意味著性能的不同,而不同發(fā)行版之間性能差距也是驚人的。


當(dāng)你考慮Hadoop的實(shí)時(shí)應(yīng)用時(shí),比如金融安全系統(tǒng)的實(shí)時(shí)應(yīng)用,那樣對(duì)高性能增加的要求甚至更高。

要特別感謝像Hadoop這樣的技術(shù),它使金融罪犯竊取數(shù)字資產(chǎn)變得越來(lái)越難,金融服務(wù)公司比如Zions銀行現(xiàn)在已經(jīng)能夠在銀行客戶感覺(jué)到任何實(shí)質(zhì)性影響之前阻止財(cái)務(wù)欺詐。對(duì)于分析和實(shí)時(shí)數(shù)據(jù)響應(yīng)來(lái)說(shuō),高性能和可靠性很有必要,這可以阻止破壞性欺詐活動(dòng)。

擴(kuò)展性

Hadoop的另一個(gè)主要優(yōu)點(diǎn)是可擴(kuò)展性。不用通過(guò)單一的企業(yè)服務(wù)器限制數(shù)據(jù)吞吐量,Hadoop可以跨計(jì)算機(jī)集群完成對(duì)大型數(shù)據(jù)集的分布式處理,從而在商品化硬件多個(gè)部分之間采用逐個(gè)擊破的辦法消除數(shù)據(jù)上限。

這種體系結(jié)構(gòu)只是數(shù)據(jù)可擴(kuò)展性提升的起點(diǎn),還遠(yuǎn)沒(méi)有結(jié)束。關(guān)于可擴(kuò)展性,Hadoop平臺(tái)內(nèi)還有三個(gè)方面需要進(jìn)一步考慮:

文件瓶頸

Hadoop默認(rèn)的體系結(jié)構(gòu)利用單一NameNode作為剩余數(shù)據(jù)節(jié)點(diǎn)的主節(jié)點(diǎn)。因?yàn)閱蝹€(gè)NameNode,所有數(shù)據(jù)被迫進(jìn)入到一個(gè)瓶頸期,這就將Hadoop集群限制在只能有5000萬(wàn)到2億個(gè)文件。

單個(gè)NameNode的執(zhí)行情況也需要使用商業(yè)級(jí)NAS,而不是預(yù)算友好型的商品化硬件。

對(duì)于單一NameNode體系結(jié)構(gòu)有一種更好的選擇――使用分布式元數(shù)據(jù)結(jié)構(gòu)。下面提供兩種體系結(jié)構(gòu)的可視化比較:


正如你所看到的那樣,分布式元數(shù)據(jù)架構(gòu)使用的完全是商品化硬件,不僅節(jié)省了成本,它還使性能提升了10-20倍,擺脫了文件瓶頸,使文件數(shù)上限達(dá)到了10億,比單個(gè)NameNode的體系結(jié)構(gòu)在容量上提升了5000倍,這確實(shí)是很大的成功。

節(jié)點(diǎn)擴(kuò)展

Hadoop的一些較小用戶對(duì)數(shù)據(jù)存儲(chǔ)和處理并沒(méi)有太高要求,因此能夠在更少的節(jié)點(diǎn)上運(yùn)行,而有些Hadoop實(shí)現(xiàn)則可以達(dá)到了數(shù)千節(jié)點(diǎn)的規(guī)模。

這也是Hadoop可擴(kuò)展性非常出色的地方。從一個(gè)入門級(jí)大數(shù)據(jù)實(shí)現(xiàn)擴(kuò)展到具有數(shù)千個(gè)節(jié)點(diǎn)的集群很容易,按照需求增加商品化硬件可以使成本最小化,這涉及到數(shù)據(jù)處理成本以及需求增加所需投入的成本。

節(jié)點(diǎn)容量

除了節(jié)點(diǎn)的數(shù)量,考慮到物理存儲(chǔ)限制,Hadoop用戶還應(yīng)該檢查每個(gè)處理和存儲(chǔ)容量。你可以使用具有更高磁盤密度的節(jié)點(diǎn)減少總體節(jié)點(diǎn)數(shù)量,同時(shí)還能保證數(shù)據(jù)存儲(chǔ)的要求。

架構(gòu)基礎(chǔ)

Hadoop的性能和可擴(kuò)展性可以被進(jìn)一步提升,前提是你要有多架構(gòu)基礎(chǔ)分布式系統(tǒng)的思想。

減少軟件層

軟件層太多,會(huì)導(dǎo)致導(dǎo)航成本的增加,使Hadoop系統(tǒng)的性能很難得到提升。

使所有應(yīng)用程序在同一個(gè)平臺(tái)上運(yùn)行

一些Hadoop發(fā)行版可能會(huì)要求你創(chuàng)建多個(gè)實(shí)例,一個(gè)優(yōu)化執(zhí)行將使同一個(gè)環(huán)境中所有的工作負(fù)載被同時(shí)處理,這就減少了重復(fù)數(shù)據(jù)的產(chǎn)生,因此提高了可擴(kuò)展性和性能。

利用公共云平臺(tái)獲取更好的彈性和可擴(kuò)展性

一個(gè)好的發(fā)行版使你可以在自己的防火墻內(nèi)靈活地使用Hadoop以及可靠的云環(huán)境,比如亞馬遜網(wǎng)絡(luò)服務(wù)和谷歌計(jì)算引擎。

最后,選擇正確的Hadoop發(fā)行版應(yīng)符合業(yè)務(wù)需求,不僅僅考慮當(dāng)前的需求還應(yīng)考慮未來(lái)的需求。分析每個(gè)發(fā)行版的性能和可擴(kuò)展性,同時(shí)考慮架構(gòu)基礎(chǔ),這也是在組織內(nèi)成功實(shí)施和評(píng)估Hadoop的基礎(chǔ)。

原文鏈接:How To Maximize Performance and Scalability Within Your Hadoop Architecture(編譯/毛夢(mèng)琪 審校/魏偉)


以“云計(jì)算大數(shù)據(jù) 推動(dòng)智慧中國(guó)”為主題的第六屆中國(guó)云計(jì)算大會(huì)將于5月20-23日在北京國(guó)家會(huì)議中心隆重舉辦。產(chǎn)業(yè)觀察、技術(shù)培訓(xùn)、主題論壇、行業(yè)研討,內(nèi)容豐富,干貨十足。票價(jià)優(yōu)惠,馬上報(bào)名
生活不易,碼農(nóng)辛苦
如果您覺(jué)得本網(wǎng)站對(duì)您的學(xué)習(xí)有所幫助,可以手機(jī)掃描二維碼進(jìn)行捐贈(zèng)
程序員人生
------分隔線----------------------------
分享到:
------分隔線----------------------------
關(guān)閉
程序員人生
主站蜘蛛池模板: 高清欧美一区二区免费影视 | 成人性视频在线三级 | 欧美成人h版影院在线播放 欧美成人h版在线观看 | 国产欧美日韩综合在线一 | 综合婷婷丁香 | 国产成人精品视频频 | 免费精品久久久视频 | 偷拍亚洲欧美 | 欧美在线精品一区二区三区 | 亚洲国产精品第一区二区三区 | 久久久不卡| 99久久精品国产一区二区成人 | 国产h视频在线观看免费 | 香焦伊人| 久久综合中文字幕一区二区三区 | 国产成人精品无缓存在线播放 | 日本中文字幕第一页 | 伊人99在线 | 青青草原亚洲视频 | 三级做爰大爽长视频在线观看 | 日韩天天摸天天澡天天爽视频 | 国产福利在线观看永久免费 | 中文字幕视频在线 | 欧美成人在线影院 | 美女教师一级毛片 | 韩国成人毛片aaa黄 韩国春性xxxx猛交 | 久久亚洲影院 | 综合自拍亚洲综合图区美腿丝袜 | 成年人小视频在线观看 | 亚亚洲乱码一二三四区 | 欧美啊啊 | 国产高清一级毛片在线不卡 | 亚洲第一精品夜夜躁人人爽 | 夜夜狠狠 | 亚洲欧美四级在线播放 | 国产伦精品一区二区三区在线观看 | 91免费福利精品国产 | 最近的最新的中文字幕视频 | 丁香五月好婷婷深深爱 | 免费播放观看在线视频 | 亚洲产国偷v产偷v自拍自拍 |