算力賦能科研和一流人才培養(yǎng)
2024-04-11 21:41:35教育部陽光高考信息平臺(tái)
數(shù)據(jù)和算法在科學(xué)研究乃至整個(gè)社會(huì)發(fā)展中正發(fā)揮著越來越重要的作用。到2025年底,全國范圍內(nèi)普惠易用、綠色安全的綜合算力基礎(chǔ)設(shè)施體系將初步成型,這將成為“數(shù)智化”轉(zhuǎn)型的基石。
近日,OpenAI發(fā)布的文本生成視頻模型Sora引爆全球。可以預(yù)料,大算力和AI融合將會(huì)在未來幾十年誕生巨量的新知識(shí)和數(shù)字資源,甚至可能超過歷史所有知識(shí)總和。
作為高校管理者、科研工作者,這不得不讓我們反思,高水平大學(xué)作為一流學(xué)科建設(shè)及拔尖人才培養(yǎng)最重要的場所,發(fā)展新階段的算力賦能顯得尤為重要。
數(shù)據(jù)和算法驅(qū)動(dòng)的科研模式正加速發(fā)展
2007年,數(shù)據(jù)庫專家吉姆·格雷做了著名的演講“科學(xué)方法的一次革命”。吉姆·格雷是1998年的圖靈獎(jiǎng)得主,在演講中,他提出科學(xué)研究的范式將從之前的實(shí)驗(yàn)范式、理論范式和仿真范式這三種范式,發(fā)展到數(shù)據(jù)密集型的科學(xué)發(fā)現(xiàn)。此后,隨著海量數(shù)據(jù)成為新的科學(xué)研究基礎(chǔ)設(shè)施,構(gòu)造基于數(shù)據(jù)的、開放協(xié)同的研究與創(chuàng)新模式,已逐漸成為科學(xué)發(fā)現(xiàn)的重要領(lǐng)域。
2012年,基于深度神經(jīng)網(wǎng)絡(luò)算法AlexNet的出色表現(xiàn),以機(jī)器學(xué)習(xí)為手段的數(shù)據(jù)分析和處理成為科學(xué)研究的新熱點(diǎn)。其中,AlphaFlod是最具代表性的工作之一。AlphaFold2在國際生物信息學(xué)蛋白質(zhì)結(jié)構(gòu)預(yù)測程序大賽中得分超過90分,被認(rèn)為是計(jì)算生物學(xué)領(lǐng)域的一項(xiàng)重大成就,也是朝著解決生物學(xué)界持續(xù)數(shù)十年之久的重大挑戰(zhàn)邁進(jìn)的一大步。諾貝爾獎(jiǎng)獲得者、結(jié)構(gòu)生物學(xué)家文卡·拉馬克里希南稱這一結(jié)果為“蛋白質(zhì)折疊問題上的驚人進(jìn)展”,并認(rèn)為“它將從根本上改變生物學(xué)研究”。
近年來,AI4Science的概念逐漸流行,并被認(rèn)為是科學(xué)研究的第五范式,即使用人工智能開發(fā)新的科學(xué)發(fā)現(xiàn)工具。AI4Science已經(jīng)被認(rèn)為是代表機(jī)器學(xué)習(xí)和自然科學(xué)領(lǐng)域最激動(dòng)人心的前沿方向之一。2023年11月,卡內(nèi)基梅隆大學(xué)的研究團(tuán)隊(duì)在《自然》雜志上發(fā)表了基于GPT-4的自動(dòng)化AI系統(tǒng)Coscientist,它能夠自主計(jì)劃、設(shè)計(jì)和執(zhí)行人類發(fā)明的化學(xué)反應(yīng)。盡管還存在一定的爭議,但以大模型為引擎的科研正在迅速成為各學(xué)科當(dāng)下最有前景的方向之一。
算力已成為高?蒲泻桶渭馊瞬排囵B(yǎng)的核心要素之一
從過去10多年的發(fā)展可以看出,算力已逐漸成為科學(xué)發(fā)現(xiàn)的重要基礎(chǔ),而且其重要性還在加速提升,甚至在一定程度上成為科學(xué)研究最重要的基礎(chǔ)設(shè)施之一。通用計(jì)算、智能計(jì)算、超級(jí)計(jì)算構(gòu)建的融合算力中心在高校學(xué)科發(fā)展中,發(fā)揮了不可替代的作用,已經(jīng)成為名副其實(shí)的科研創(chuàng)新基座之一,其重要性也愈發(fā)凸顯。
用大模型打造新的研究范式正成為潮流,但是這些都建立在大量計(jì)算資源需求的基礎(chǔ)上。雖然OpenAI沒有公布相關(guān)數(shù)據(jù),但根據(jù)業(yè)界的推測,GPT-3175B模型需要355個(gè)GPU年,即全球最快的一塊GPU運(yùn)行355年的運(yùn)算量,單次訓(xùn)練運(yùn)行成本為460萬美元。而作為升級(jí)版,GPT-4的參數(shù)規(guī)模比GPT-3大10倍以上。據(jù)稱,GPT-4的訓(xùn)練成本約為6300萬美元。美國麻省理工學(xué)院斥資10億美元建設(shè)全球第一個(gè)計(jì)算學(xué)院——蘇世民計(jì)算學(xué)院,學(xué)生不僅學(xué)計(jì)算機(jī),還學(xué)計(jì)算數(shù)學(xué)、計(jì)算物理、計(jì)算化學(xué)等基于計(jì)算的專業(yè)交叉課程。上海交大網(wǎng)絡(luò)信息中心將最初的單核串行程序代碼性能進(jìn)行優(yōu)化,高效的聲子玻爾茲曼輸運(yùn)方程算法通過上海交大高性能計(jì)算中心,并行計(jì)算效率最高提升了1.8萬倍。
高校站在科學(xué)研究和人才培養(yǎng)的第一線,這兩項(xiàng)任務(wù)在創(chuàng)新研究和基礎(chǔ)設(shè)施需求等方面是相通的。高水平的科學(xué)研究需要拔尖人才,而如果沒有參與高水平的科學(xué)研究,所謂的“人才”也難以被稱為拔尖人才。隨著科研對(duì)算力的需求越來越大,拔尖人才培養(yǎng)同樣需要更多的算力來支持?梢灶A(yù)見,算力指標(biāo)將很快成為衡量高校人才培養(yǎng)能力的一個(gè)重要方面。
超大規(guī)模的算力需求需要新的建設(shè)模式
對(duì)于高校來說,很多時(shí)候需要定制化的本地計(jì)算,多學(xué)科主流應(yīng)用需要進(jìn)行頻繁的效率測試與個(gè)性化調(diào)優(yōu),因此在多數(shù)情況下無法直接使用商用算力。
目前國內(nèi)高校的算力建設(shè)大多完全依靠自身投入,僅有少數(shù)高校借助國家超算中心的建設(shè),形成較高的算力資源。即便如此,高校僅憑自身力量能夠滿足的算力需求依然十分有限。
由此可見,無論是科研還是拔尖人才培養(yǎng),僅依靠高校自身提供算力的模式將越來越力不從心。為適應(yīng)新的形勢,高校的算力建設(shè)需要新的模式。一種模式是,上海市乃至長三角高校之間互聯(lián)互通,形成算力池,共享共用;另一種模式是,高校與企業(yè)聯(lián)合共建算力,通過打通算力調(diào)度,一方面企業(yè)將算力提供給學(xué)校支持科研和人才培養(yǎng),另一方面高校也能夠通過產(chǎn)學(xué)研合作,為企業(yè)的算力賦能,形成算力附加值。
加強(qiáng)高校校級(jí)算力建設(shè)以應(yīng)對(duì)未來挑戰(zhàn)
基于上述思路,上海大學(xué)已經(jīng)開始了這方面的嘗試和探索。學(xué)校早在多年前就確定了包括“五朵金花”(微電子、人工智能、生物醫(yī)藥、新能源、量子科技),“五大陣地”(城市社會(huì)治理、考古與文保、新海派文化、藝術(shù)技術(shù)、數(shù)字經(jīng)濟(jì)與管理)在內(nèi)的“五五戰(zhàn)略”發(fā)展規(guī)劃,并于2019年就策劃啟動(dòng)了新一輪自有算力的建設(shè)。學(xué)校自主建設(shè)的算力有力地推動(dòng)了“五五戰(zhàn)略”的發(fā)展,但是依然難以滿足各學(xué)科及人才培養(yǎng)對(duì)算力指數(shù)級(jí)增長的需求。
在這一背景下,學(xué)校聯(lián)合企業(yè)共建了“自強(qiáng)5000”一期共享算力平臺(tái),學(xué)?烧{(diào)用的算力超過2000張GPU加速卡,整體算力規(guī)模已經(jīng)躋身國內(nèi)高校前列。通過學(xué)校統(tǒng)一身份平臺(tái)為所有師生開通自強(qiáng)5000算力統(tǒng)一調(diào)度服務(wù)平臺(tái),有力支撐學(xué)校的科學(xué)研究和人才培養(yǎng),同時(shí)也為學(xué)校應(yīng)對(duì)未來的挑戰(zhàn)做好充足的準(zhǔn)備。
上海大學(xué)堅(jiān)持校級(jí)算力平臺(tái)一體化統(tǒng)籌建設(shè),學(xué)校信息化工作辦公室成立專門的算力中心,推動(dòng)專業(yè)超算人才隊(duì)伍建設(shè),更好地做好超算運(yùn)營服務(wù),經(jīng)過一年多運(yùn)行已經(jīng)取得明顯成效。本次教育部本科教育教學(xué)審核評(píng)估,有專家建議在學(xué)校高水平大學(xué)建設(shè)過程中,面向全校的本科生全覆蓋開設(shè)AI、超算等新一代信息技術(shù)素養(yǎng)相關(guān)課程,提升本科生、研究生數(shù)據(jù)處理和AI素養(yǎng)能力水平,推進(jìn)算力+課程、算力+大賽、算力+科研融合課程。
未來2-3年內(nèi),上海大學(xué)除了在高水平大學(xué)建設(shè)過程中加強(qiáng)算力建設(shè)外,也將進(jìn)一步加強(qiáng)算力應(yīng)用生態(tài)建設(shè),并繼續(xù)加強(qiáng)校企合作,探索出上大特色的算力建設(shè)模式和場景應(yīng)用,進(jìn)一步將算力建好、用好,為學(xué)校高水平大學(xué)建設(shè)奠定扎實(shí)的算力基礎(chǔ)。
此外,學(xué)校還將充分利用上海教育城域網(wǎng)與各高;ヂ(lián)互通,搭建共享算力網(wǎng)和算力池,全面提升全市高校算力能力水平,賦能一流人才培養(yǎng)。