多多色-多人伦交性欧美在线观看-多人伦精品一区二区三区视频-多色视频-免费黄色视屏网站-免费黄色在线

國內最全IT社區(qū)平臺 聯(lián)系我們 | 收藏本站
阿里云優(yōu)惠2
您當前位置:首頁 > 互聯(lián)網 > Giraph助力Facebook打造億萬用戶間關系鏈

Giraph助力Facebook打造億萬用戶間關系鏈

來源:程序員人生   發(fā)布時間:2014-09-10 02:45:14 閱讀次數(shù):3837次

隨著Facebook用戶數(shù)的增加,Facebook希望能夠測量基本的統(tǒng)計信息和高效地計算出用戶之間的關聯(lián)性,比如用戶位置、興趣愛好之間的關聯(lián)性以及他們之間的親和力、共同好友、查找潛在好友等信息。為了實現(xiàn)這些功能,他們采用一款開源的圖論工具――Apache Giraph。該工具最早出自雅虎,后來將其捐贈給 了Apache軟件基金會。


Giraph是一個高擴展性的交互圖形處理系統(tǒng),F(xiàn)acebook對Giraph進行了改進和提升,實現(xiàn)對不同實體間的萬億個連接進行了分析。Facebook將Giraph規(guī)模化并作為其Open Graph工具的核心。Giraph的整體計算模型被運用在Facebook服務器內并行巨大的網絡圖計算。

Giraph是如何工作的? 

Giraph是基于批量同步并行模型,由哈佛大學計算機教授Leslie Valiantz在20世紀80年代開發(fā)的一類并行計算算法。BSP算法通過 一系列步驟跨多臺計算機計算,在每一小步上,每臺計算機都執(zhí)行一點計算,再把結果傳遞到其它系統(tǒng)里,這些系統(tǒng)再繼續(xù)執(zhí)行下 一個步驟。

Giraph計算的輸入是由點和直連的邊組成的圖。例如,點可以表示人,邊可以表示朋友請求。每個頂點保存一個值,每個邊也保存一個值。輸入不僅取決于圖的拓撲邏輯,也包括定點和邊的初始值。 作為一個例子,考慮這樣一個計算,查找從一個預設的初始人到社交圖譜中的任何一個人的距離。在這個計算中,邊的值是一個浮 點數(shù)表示相鄰的人之間的距離,頂點V也是一個浮點數(shù),表示從預設的頂點s到v的最短距離的上限值。預設的源頂點的初始值是0, 其它頂點的初始值是無窮大。


來自:Facebook

此外,Giraph引起大家關注的另一原因是基于Hadoop建立的,目前,很多企業(yè)都是Hadoop來部署大數(shù)據(jù)平臺,F(xiàn)acebook便是其中之一。

在Facebook使用Giraph之前,對于大規(guī)模圖形計算,人們曾使用諸如Hive和MapReduce等框架,它們可以實現(xiàn)大規(guī)模計算,但對比現(xiàn)在的計算速度,它們要慢50到100倍這樣。

發(fā)現(xiàn)人與人之間的關聯(lián)

舉一個最簡單的例子,Giraph使用手冊上例舉了一個實現(xiàn)單源最短路徑算法,一個計算方法是從所有收到的消息中計算最小的值,如果那個值節(jié)點的當前值小,那最小的那個就被接受作為頂點的值,而且值和邊的值就會沿著每一個外出的邊發(fā)送。

從邏輯上來講,任何節(jié)點之間的最短路徑一般只有該節(jié)點到其鄰居節(jié)點之間的距離。所以,基于Giraph模型,每個節(jié)點開始的第一步都是計算其最短路徑,然后通知其鄰居,如果其鄰居節(jié)點找到更短路徑,也會通知給開始節(jié)點,這樣,就很容易找到最短路徑。

在本月初,F(xiàn)acebook的一篇博客文章介紹了 Giraph是如何分配Facebook用戶數(shù)據(jù)到特定的數(shù)據(jù)庫服務器。當用戶朋友信息被存儲在同一個服務器上時,F(xiàn)acebook運行將會更高效,因為對于同樣的操作,跨服務查找的次數(shù)也會明顯減少。

Giraph為每個節(jié)點分配一個特定的設置,代表一個服務器,然后告訴其鄰居節(jié)點所在地。在每個步驟中,它隨機決定是否需要移動到另一組,與其鄰居移動的數(shù)量成正比。 

Facebook在Giraph上取得的成效

作為一個迭代的圖形處理庫,Giraph具有容錯和動態(tài)調節(jié)的功能。

在可擴展方面,F(xiàn)acebook可以在擁有上萬億連接的真實的社交圖譜上運行一個迭代的頁面排名,這一社交圖譜由各類用戶在4分鐘之內交互產生,伴隨適當?shù)乃槠占托阅苷{節(jié)。除此之外,還可以聚集Facebook每月的活躍用戶數(shù)據(jù)集,在幾分鐘內即可完成對如此大規(guī)模數(shù)據(jù)和變量的處理。

除圖譜搜索外,F(xiàn)acebook還計劃將Apache Giraph軟件用在其他任務中,例如精準廣告和數(shù)據(jù)排名。Facebook在社交領域的成功離不開其在技術領域的探索與創(chuàng)新,圖形技術的應用更是推動了Facebook的發(fā)展。

文章翻譯自:fastcolabs、gigaom

生活不易,碼農辛苦
如果您覺得本網站對您的學習有所幫助,可以手機掃描二維碼進行捐贈
程序員人生
------分隔線----------------------------
分享到:
------分隔線----------------------------
關閉
程序員人生
主站蜘蛛池模板: jiucao在线观看精品 | 黄网址免费 | 天天亚洲综合 | www日本在线观看 | 一二三四视频社区在线中文 | 磁力天堂网在线资源www | 视频一区二区精品的福利 | 波多野结衣在线观看一区二区 | 中文国产成人精品久久久 | 欧美福利视频一区在线 | 成人免费的性色视频 | 一区二区高清视频 | 国产亚洲精品美女一区二区 | 春色网站| 看黄色的网址 | 黑人又大又粗又长又深受不了 | 中文字幕精品视频在线 | 国产精品亚洲第一区二区三区 | 最新亚洲精品国自产在线观看 | 精品午夜寂寞黄网站在线 | 久久riav| aⅴ天堂网| 亚洲精品自拍区在线观看 | 欧美最猛性xxxxx图片 | 宇都宫紫苑野外中文字幕 | 欧美老人巨大xxxx做受视频 | 极品美女嫩模瑶瑶大尺度啪啪 | 欧美精品一区二区三区免费观看 | 99国产国人青青视频在线观看 | 国产成人亚洲精品91专区手机 | 一区二区三区在线免费观看视频 | 欧美韩日国产 | 中文字幕免费视频 | 精品国产一区二区三区四 | 亚洲性另类 | 国产精品中文字幕在线 | 欧美日韩激情一区二区三区 | 久久久精品456亚洲影院 | 国产高清国内精品福利99久久 | 69热在线 | 欧美日韩另类国产 |