近來,超算競賽在推進應用和培養人才方面的獨特價值和巨大作用已經得到超算專家、用戶和教育界人士的高度認可。為提高競賽的精彩程度并考察參賽學生的綜合能力,ASC、ISC和SC三大超算競賽主辦方在各自的賽題設計方面都進行了精心設計。如ASC14設計了參賽隊在全球最快超級計算機天河2號實戰演練并行優化行業應用的賽題并設置了e Prize獎,而在剛剛在德國舉行的ISC14超算競賽也設計了一道頗具特色的神秘應用賽題。
今年6月在德國萊比錫舉行的ISC14超算競賽上,競賽組委會現場公布了本次競賽的神秘應用賽題規則,即要求參賽隊現場重新構建各自的超算系統,要求在20分鐘之內運行出給定的Quantum Espresso算例的正確結果,成功完成任務且運行過程中功耗值最小的隊伍獲滿分,其余成功運行出結果的隊伍按和第一名功耗比例給分,沒有完成任務的隊伍零分。這道神秘應用賽題規則強調超算系統在運算作業和時間限定情況下要求盡可能優化運行功耗,充分體現了對超算實際應用性能功耗比的重視。這種神秘應用的競賽規則是首次在國際性超算競賽采用,極大的考驗了各參賽隊伍對超算系統構建的掌控能力、應用性能與功耗優化的平衡設計,以及團隊協作和臨場應變能力,成為本次ISC14超算競賽的最受關注賽題。
開源量子分子動力學計算軟件Quantum Espresso是擴展性較好的計算密集型應用,隨著硬件資源的增加會加快計算,但同時也會使得功耗增加。該項賽題的難點在于,優化QE算例計算速度并非越快越好,而是要盡可能的平衡計算資源及應用運行參數,做到既能在規定時間內完成運算,也能在運行過程中的功耗值穩定并盡可能小。因此,為了降低功耗,除了減少使用的計算資源(減少CPU核數甚至節點數),也需要對計算平臺進行“瘦身”,減掉平臺中不必要的功耗消耗,如拆除平臺上的GPU加速卡,拆除多余的內存條,甚至在散熱條件允許的情況下拆除平臺上的風扇等。同時,評分依據的是整個運行過程的峰值功耗,因此計算過程中功耗穩定沒有起伏也是很重要的,這點可以通過應用的計算分配,控制負載平衡,以降低功耗峰值。
經過緊張的準備和角逐,南非高性能計算中心參賽隊以最低1700W的峰值功耗成功運行作業獲得了本題的滿分16分,來自中國的清華大學參賽隊和上海交通大學參賽隊分別以以峰值功耗2400W和2700W成功運行作業分別獲得11.33分和10.07分,他們成為本次11支參賽隊中唯一成功完成本賽題的3支隊伍,出乎意料的是其他8只參賽隊因為各種原因出錯最終都抱憾未能完成這道神秘賽題。
南非高性能計算中心參賽隊 清華大學參賽隊 上海交通大學參賽隊
清華大學隊長李凱威在談及這段參賽經歷時表示,這道神秘應用賽題非常有意思也極具挑戰性,這道題檢驗了整個團隊的綜合能力水平,不僅包括系統的設計優化和硬件的穩定性,還有對應用的理解力以及靈活應變的臨場發揮能力,才有可能在充滿不確定性的神秘應用中挑戰成功。他表示,ISC和ASC超算大賽從目標上都很明確,不僅考察參賽隊伍超算知識的全面性、理解力和創造性,有著共同的應用優化訴求,而且強調實際動手能力來檢驗對超算知識的靈活掌握。
據了解,上海交通大學和清華大學的參賽隊伍此前在ASC14超算競賽中分別獲得總冠軍和應用創新獎,在ASC競賽期間需要獨立完成整套超算系統的動手搭建和調優排錯;南非參賽隊也是從參與了南非國家超算競賽的隊員選拔而成,由此可以明顯看出,這些隊員此前經歷過的實際參賽動手經驗為此次ISC14競賽中取得好成績打下了良好基礎。
新規則的ISC14神秘應用頗有些“七步成詩”的味道,這種檢驗“即興發揮”能力的比賽形式,也使超算大賽成為超算人才培養的“實戰課堂”,這種創新賽題體現出超算競賽對人才知識掌握的實際動手靈活應用能力的重視,值得在超算競賽中進一步推廣。