多多色-多人伦交性欧美在线观看-多人伦精品一区二区三区视频-多色视频-免费黄色视屏网站-免费黄色在线

國內最全IT社區平臺 聯系我們 | 收藏本站
阿里云優惠2
您當前位置:首頁 > 互聯網 > spark調優經驗(待續)

spark調優經驗(待續)

來源:程序員人生   發布時間:2014-11-03 08:59:57 閱讀次數:2936次

spark調優是需要根據業務需要調劑的,其實不是說某個設置是1成不變的,就比如機器學習1樣,是在不斷的調試中找出當前業務下更優的調優配置。下面零碎的總結了1些我的調優筆記。

spark 存儲的時候存在嚴重的分配不均的現象,有幾臺機器在過渡使用, 有幾臺機器卻很少被使用,有幾臺機器緩存了幾10個上百個RDD blocks  有的機器1個RDD blocks 都沒有,這樣存儲有RDD blocks 的可以進行運算,運算的tasks 最多為該機器core數。

spark.storage.memoryFraction 分配給用于緩存RDD的內存的比例  

比如如果spark.executor.memory              30g  spark.storage.memoryFraction       0.5          則用于緩存的內存為14G 多, 默許留1些做其他用。



每個RDD blocks  的大小不1定是64兆 可能小于64兆,另外如果driver不是子節點,driver 程序運行的節點上的用于緩存的內存 ,就不會被使用。


事實上1個兩3G 的數據 需要用的緩存也最少需要兩3G,如果中間進程中還有產生RDD 且也需要緩存到內存,則需要分配更多的內存用于緩存。在緩存足夠多的情況的
更多的內存不足毛病提示(OOM) 來源于計算的時候產生的1些中間對象即計算所需要的內存。


所以分配用于緩存的內存 應當是這么算的, 比如我有10G的文件,4臺機器,則每臺機器最少2.5g緩存,如果每臺機器分配給excutor 的內存為10g ,則memoryFraction 則最少為0.25  最好配大1些,但不能太大, 太大會致使計算內存不夠。而且如果中間進程還有產生新的RDD,則需要根據實際情況調大memoryFraction。


RDD 緩存散布不均勻 是影響spark 的很大的性能之1,為何這么說?

由于有的機器分配給用于RDD 緩存的內存都用完了  ,這樣相對而言在這個機器上計算的開消也會大,有的機器緩存占用的內存很少,就算用這個機器來計算,還需要啟動Node_local 模式,這樣會影響計算的時間。


調優進程也遇到了1些問題,還沒解決,比如:
為何1個2G 的數據,默許塊大小為64M. default.parallelism 設置成100,可它總是不按這個數據來分,比如常常分成了108個blocks,影響partions個數的參數還有哪些?還有我明明有4個節點,但常常有節點被分配的RDD 和計算都很少很少,這類資源浪費的情況應當怎樣調解?

生活不易,碼農辛苦
如果您覺得本網站對您的學習有所幫助,可以手機掃描二維碼進行捐贈
程序員人生
------分隔線----------------------------
分享到:
------分隔線----------------------------
關閉
程序員人生
主站蜘蛛池模板: 黑人gay巨大| 亚洲欧洲精品成人久久曰 | 中文字幕乱码中文 | 国产亚洲精品久久久久久午夜 | 亚洲欧美日韩另类精品一区二区三区 | 99精品国产一区二区三区 | 不卡一级aaa全黄毛片 | 在线观看国产精品麻豆 | 在线免费观看h视频 | yellow中文字幕在线高清 | 国产精品一区三区 | 成人免费毛片一区二区三区 | 最新国产在线观看福利 | 国产成人精品日本亚洲语言 | 中文字幕乱码中文乱码综合 | 国产h肉在线视频免费观看 国产h视频 | 日本动漫片b站免费观看 | 91欧美一区二区三区综合在线 | 最近中文字幕无免费 | 69av在线视频| 欧美黑粗特黄午夜大片 | 国产偷v国产偷v国产 | 亚洲欧美在线精品 | 69av视频在线 | 亚洲综合精品成人 | 一级毛片视频免费观看 | 亚洲爱爱网 | 中文字幕在线精品视频入口一区 | 亚洲系列动漫卡通 | 欧美jizzjizz在线播放 | 免费男女视频 | 欧美经典剧情系列h版在线观看 | 国产72av国片精品jk制服 | 一区二区三区中文 | 欧美a网| 欧美日韩一区二区三区视频播 | 中文字幕无线码欧美成人 | 一级欧美激情毛片 | 精品国产免费人成在线观看 | 成人午夜影视全部免费看 | 欧美色视频免费高清播放 |