“第六屆中國云計算大會”將于2014年5月20-23日在北京國家會議中心隆重召開。本次大會將歷時四天,內容更加精彩,預計參會者將大大超過上一屆的12000多人次。每屆中國云計算大會,都有兩院院士的精彩演講。本屆大會上,李德毅、懷進鵬、倪光南、李伯虎、楊學軍、張堯學、李未、梅宏、高文、李蘭娟等10位兩院院士將集體亮相,與廣大參會者共同把脈云計算與大數據的未來技術發展和應用方向。大會召開前夕,CSDN云計算頻道將推出“十大院士分享系列”,走近院士,走進院士們對于云計算和大數據的理解。
楊學軍,中國科學院院士, 中將軍銜。1983年7月畢業于南京通信工程學院計算機系計算機科學與技術專業本科,1991年3月在國防科學技術大學計算機系計算機科學與技術專業獲工學博士學位。歷任國防科學技術大學計算機系教授、副總工程師、總工程師,國防科學技術大學計算機學院副院長、院長,國防科學技術大學教育長、副校長,現任國防科學技術大學校長、教授、博士生導師。
第六屆中國云計算大會上,楊院士將為我們帶來精彩演講。
2013年6月,由我國自主研制的“天河二號”超級計算機出現在了全球超算TOP500的排名中,以實測速度3.386億億次位居世界第一,這也是繼2010年10月的“天河一號”系統之后我國自主研制的超級計算機第二次獲此殊榮。然而,國際超級計算領域競爭日趨激烈,為了滿足高能核物理、材料化學、生命科學等大規模應用在計算能力方面的超高需求, 高性能計算正處于從P級( 1015Flops) 向E級(1018Flops)發展的階段,世界各國都把E級計算作為下一個爭奪的高地。
高性能計算技術發展至今,其性能的進一步提升卻遇到了包括訪存、通信、可靠性、能耗、應用等五大挑戰在內的一系列問題。為此,如何定量描述上述因素對并行計算系統可擴展性的影響成為高性能計算領域亟待解決的關鍵問題之一。楊學軍院士以“可靠性墻量化研究理論”為例向我們介紹了并行計算系統可擴展性度量模型的研究成果。同時,從并行計算機體系結構、微處理器體系結構、存儲體系結構、互連技術、軟件技術、新興使能技術等方面向我們介紹我國在針對E級計算所面臨挑戰的一些對策與思考。楊學軍院士認為E級計算的挑戰正面臨五個挑戰:
● 挑戰一:訪存墻問題
訪存墻問題仍然是提升計算速度的第一大難題,處理器的處理速度和訪問速度之間的不匹配,處理器單個引腳的信號傳輸速度和引腳受限。多核處理器的出現只是提高了計算速度,不但沒有緩解訪問問題,反而使其變得更加嚴重。
● 挑戰二:通信墻問題
隨著超級計算的規模不斷增加,互聯網絡對計算性能的影響越來越大,E級計算對互聯網絡提出了更高的要求,互聯網絡已成為制約超級計算機發展的核心因素之一。
● 挑戰三:可靠性問題
可靠性:當系統性能由P級向E級擴展時,保存全局檢查點的時候可能達到甚至超過系統的MTBF!
● 挑戰四:能耗墻問題
能耗墻:ITRS估計高性能CPU的功耗將達到120~200W。世界排名第一Blue Gence的能耗達到7.8MW,如此發展下去E級系統功耗將達3.5GW,超過三峽水電站2008年平均供電能力的三分之一。
● 挑戰五:并行計算的可擴展性
上述四堵墻,嚴重制約并行計算的可擴展性,并行計算機課擴展性度量模型指導著計算機的發展。解決計算機的并行可擴展性的難點在于要素的量綱不統一,事件離散,應用千變萬化,系統、技術的千差萬別。
要素的量綱不統一,歸約到時間量綱,通過“容錯開銷”的度量,將可靠性問題的描述統一至時間量綱,進而將可靠性引入加速比公式,對可靠性墻進行量化研究。現有容錯方法都會引起可靠性墻,必須研究故障影響系統的規律,探索新的方法。
楊學軍院士表示,通用處理器+專用處理器是異構體系結構的一種解決方案。給予流處理的異構并行體系結構,大規模科學工程應用的可流化理論,大規模科學工程應用的高效流化方法。在可流化路理論和高效流化方法的基礎上提出了CPU和流處理器相結合的異構融合并行體系結構。
硬件技術的發展在緩解通信墻、可靠墻、和功耗墻的同時,加劇了編程墻,然而如果能解決編程墻問題和底層框架優化技術,就可以緩解了訪問墻及通信墻問題。
【走近院士】系列全部文章
【走近院士】懷進鵬:全球的計算模式可能重新形成
【走近院士】李德毅:大數據是連接虛擬和現實世界的橋梁
【走近院士】倪光南:自主研發,從制造轉向創造
【走近院士】李未:實現云服務的有效方法是群體軟件工程
【走近院士】張堯學:基于透明計算的云操作系統 (責編/仲浩)