以ChatGPT為代表的的新興AI應(yīng)用帶動(dòng)了算力需求“爆發(fā)式”增長(zhǎng),算力短缺的矛盾也變得越發(fā)突出。
在2023世界人工智能大會(huì)期間,算力成為了不少?gòu)臉I(yè)者熱議的話題。
(資料圖)
在WAIC現(xiàn)場(chǎng),第一財(cái)經(jīng)記者走訪看到,圍繞著服務(wù)器的展臺(tái),參訪嘉賓們?cè)囍霭蹇?,或者隔著罩子詢?wèn)“這塊是不是國(guó)產(chǎn)的?”
“服務(wù)器訂單排到了幾個(gè)月之后,今年的單子確實(shí)不愁了。”一位服務(wù)器廠商告訴第一財(cái)經(jīng),甚至公司的路演活動(dòng)都新增了“人氣”。
算力向下扎根于數(shù)據(jù),向上支撐著算法,是驅(qū)動(dòng) AGI發(fā)展的核心動(dòng)力之一。今日畢馬威與聯(lián)想集團(tuán)聯(lián)合發(fā)布的《普慧算力開(kāi)啟新計(jì)算時(shí)代》報(bào)告(下文簡(jiǎn)稱“報(bào)告”)測(cè)算,預(yù)計(jì)到2025年,我國(guó)算力核心產(chǎn)業(yè)規(guī)模將不低于4.4萬(wàn)億元,算力關(guān)聯(lián)產(chǎn)業(yè)規(guī)??蛇_(dá)24萬(wàn)億元,算力有望崛起為國(guó)家數(shù)字經(jīng)濟(jì)藍(lán)圖中繼電子信息制造業(yè)和軟件業(yè)之后的又一超級(jí)賽道。
從業(yè)者迫切需要算力
放眼全球,算力已成為各國(guó)科技戰(zhàn)略布局重點(diǎn)。報(bào)告顯示,當(dāng)前,美、中、歐、日基本穩(wěn)居全球算力產(chǎn)業(yè)規(guī)模前四,美、中兩國(guó)處在領(lǐng)先地位,各國(guó)算力投資或補(bǔ)貼計(jì)劃均超千億。
此外,對(duì)比中美兩國(guó)細(xì)分算力規(guī)模來(lái)看,中國(guó)的智能算力規(guī)模已經(jīng)超過(guò)美國(guó)60%,這主要得益于人工智能模型訓(xùn)練算力需求快速增長(zhǎng),中國(guó)不斷加快以智能計(jì)算中心為代表的智能算力基礎(chǔ)設(shè)施建設(shè)。公開(kāi)資料顯示,截至2023年2月,中國(guó)投入運(yùn)營(yíng)和在建的人工智能計(jì)算中心已達(dá)23個(gè)。結(jié)合IDC預(yù)測(cè)來(lái)看,2021-2026年中國(guó)智能算力規(guī)模年復(fù)合增長(zhǎng)率有望達(dá)到523%。
即便規(guī)模如此巨大,大模型火了之后,依然難以滿足國(guó)內(nèi)對(duì)算力的需求。
深度學(xué)習(xí)出現(xiàn)之前,用于AI訓(xùn)練的算力增長(zhǎng)大約每20個(gè)月翻一番,基本符合摩爾定律;深度學(xué)習(xí)出現(xiàn)之后,用于AI訓(xùn)練的算力大約每6個(gè)月翻一番;2012年后,全球頭部AI模型訓(xùn)練算力需求更是加速到每3-4個(gè)月翻一番,即平均每年算力增長(zhǎng)幅度達(dá)到驚人的10倍:目前大模型發(fā)展如火如荼,訓(xùn)練算力需求有望擴(kuò)張到原來(lái)的10到100倍,算力需求的指數(shù)級(jí)增長(zhǎng)曲線將更加陡峭。
AI從業(yè)者迫切需要算力。
一位大模型從業(yè)者告訴記者,英偉達(dá)A100芯片的價(jià)格已經(jīng)從原來(lái)的6萬(wàn)元左右一路漲至12萬(wàn)元。
AMD全球副總裁唐曉蕾此前接受第一財(cái)經(jīng)采訪時(shí)說(shuō):“我相信對(duì)計(jì)算能力的需求,將會(huì)是未來(lái)十年對(duì)所有人的挑戰(zhàn)?!?/p>
還有從業(yè)者稱,中國(guó)目前在追趕 GPT3.5的團(tuán)隊(duì)在10個(gè)左右,算力將在未來(lái)贏家和產(chǎn)業(yè)發(fā)展格局的形成中起到關(guān)鍵作用。
“算力供給增速明顯難以滿足指數(shù)式爆發(fā)的需求,儲(chǔ)備算力成為各行各業(yè)的必要舉動(dòng)?!?畢馬威中國(guó)數(shù)字化賦能主管合伙人張慶杰今日對(duì)媒體表示。
如何打破算力瓶頸,業(yè)界正在努力。例如在世界人工智能大會(huì)上,華為輪值董事長(zhǎng)胡厚崑就談道,華為的算力基礎(chǔ)設(shè)施構(gòu)建正在加速,例如,華為最大的AI計(jì)算集群在深圳“鵬城云腦”二期,算力是1000P規(guī)模,2024年三期會(huì)達(dá)到16000P規(guī)模水平。而聯(lián)想集團(tuán)副總裁陳振寬表示,大模型訓(xùn)練對(duì)于算力的要求極高,算力需求也因此開(kāi)始迸發(fā)式增長(zhǎng),聯(lián)想集團(tuán)ISG全球AI基礎(chǔ)設(shè)施業(yè)務(wù)未來(lái)三年將追加投資10億美元,加速全球企業(yè)的AI部署。
不過(guò),算力不僅面臨供需失衡的問(wèn)題,同時(shí)也意味著巨大的成本投入。以構(gòu)建GPT-3為例,OpenAl數(shù)據(jù)顯示,滿足GPT3算力需求至少要上萬(wàn)顆英偉達(dá)GPUA100,一次模型訓(xùn)練總算力消耗約3.640PF-davs(即每秒一千萬(wàn)億次計(jì)算,運(yùn)行3.640天),成本超過(guò)1200萬(wàn)美元,這還不包括模型推理成本和后續(xù)升級(jí)所需的訓(xùn)練成本。
畢馬威在報(bào)告中還指出算力發(fā)展面臨著巨大的挑戰(zhàn),體現(xiàn)為傳統(tǒng)計(jì)算架構(gòu)缺乏并行管理架構(gòu)、效率低、能耗高,已然無(wú)法適應(yīng)爆發(fā)式增長(zhǎng)的算力需求和愈發(fā)復(fù)雜的計(jì)算任務(wù)。
尤其在實(shí)際商業(yè)環(huán)境中,大部分企業(yè)選擇根據(jù)業(yè)務(wù)場(chǎng)景、數(shù)據(jù)類型、支出成本選擇合適的計(jì)算架構(gòu),如何就新型計(jì)算架構(gòu)的技術(shù)路線、標(biāo)準(zhǔn)體系達(dá)成行業(yè)共識(shí)成為必答題。
算力緊缺不能“治標(biāo)不治本”
“在算力供不應(yīng)求的現(xiàn)實(shí)情況下,傳統(tǒng)計(jì)算架構(gòu)正失去競(jìng)爭(zhēng)力,必須探索新的計(jì)算模式。” 畢馬威首席經(jīng)濟(jì)學(xué)家康勇表示,當(dāng)前算力正由終端計(jì)算等需求驅(qū)動(dòng)的“被動(dòng)式”發(fā)展,轉(zhuǎn)向促進(jìn)AI大模型訓(xùn)練、實(shí)現(xiàn)通用人工智能、超越經(jīng)典計(jì)算等代表的“主動(dòng)式”發(fā)展。新硬件、新架構(gòu)競(jìng)相涌現(xiàn),現(xiàn)有芯片、操作系統(tǒng)、應(yīng)用軟件等都可能被推翻重來(lái)。
盡管各行業(yè)的算力需求各有千秋,但落腳點(diǎn)均在“普慧”。報(bào)告預(yù)計(jì),未來(lái)算力發(fā)展趨勢(shì)將具備兩大特征:數(shù)字經(jīng)濟(jì)的基礎(chǔ)設(shè)施和通用人工智能的核心動(dòng)力。因此,算力將在兩個(gè)關(guān)鍵維度上加速發(fā)展:普適(Inclusive)與智慧(Intelligent)。
普慧算力意味著,算力要成為像電力一樣的公共資源,本質(zhì)上是站在使用者的角度上,讓算力更好用。
在普適方面,科技巨頭不斷加碼算力進(jìn)行大模型訓(xùn)練的同時(shí),大量中小型企業(yè)因資金和技術(shù)限制被攔在門(mén)檻之外,但業(yè)界預(yù)計(jì),在大模型走向場(chǎng)景化、實(shí)用化的過(guò)程中,將會(huì)形成“大模型+小模型”的產(chǎn)業(yè)生態(tài),即大型企業(yè)負(fù)責(zé)搭建底層通用大模型,中小型企業(yè)在大模型的基礎(chǔ)上搭建面向特定任務(wù)場(chǎng)景的小模型,相較大模型而言,小模型訓(xùn)練的資金投入更低,因此,服務(wù)此類企業(yè)小模型訓(xùn)練需求的算力增量仍然可觀。
阿里云全球商業(yè)副總裁黃海清在世界人工智能大會(huì)上提到了讓算力更普惠的話題,他認(rèn)為,智算中心并不是簡(jiǎn)單把配置先進(jìn)制程芯片的服務(wù)器連接起來(lái)就能實(shí)現(xiàn)高性能算力,一個(gè)很關(guān)鍵的指標(biāo)就是如何降低算力的損耗。
張慶杰則認(rèn)為,想要破解算力的結(jié)構(gòu)性短缺困局,不能目光短淺,需要從算力、算法和數(shù)據(jù)三個(gè)方面進(jìn)行相應(yīng)的提升和優(yōu)化。
“需求大是真的,但還有一種可能是在算法領(lǐng)域,算法不夠優(yōu)化,帶給算力的壓力就更大。還有數(shù)據(jù)清洗及其標(biāo)簽的質(zhì)量也非常重要,百萬(wàn)級(jí)參數(shù)訓(xùn)練出來(lái)未必比千萬(wàn)級(jí)或者上億級(jí)的訓(xùn)練效果差?!?/p>
而從算力的布局來(lái)考慮,張慶杰認(rèn)為在區(qū)域和行業(yè)上不盡相同”。在他看來(lái),制造行業(yè)有望成為“普慧”算力最大的潛在市場(chǎng)。
他以冠捷科技為例,該公司想要推進(jìn)智能化質(zhì)檢取代傳統(tǒng)人力質(zhì)檢,但AI質(zhì)檢模型訓(xùn)練需要大量生產(chǎn)現(xiàn)場(chǎng)數(shù)據(jù),還需要融合大量從業(yè)人員的知識(shí)經(jīng)驗(yàn),以及要補(bǔ)充邊緣算力等。聯(lián)想在提供邊緣硬件設(shè)備的基礎(chǔ)上,為冠捷科技提供了機(jī)器視覺(jué)算法和Edge AI小樣本算法,并將自適應(yīng)技術(shù)加入算法中,對(duì)不良風(fēng)險(xiǎn)進(jìn)行分析、預(yù)測(cè)預(yù)警、回溯,通過(guò)軟硬件一體化的解決方案,底層算力得以更加動(dòng)態(tài)精準(zhǔn)地滿足場(chǎng)景化需求。
“無(wú)論是從普適性,還是智能化發(fā)展的需求和速度上,制造業(yè)是排在第一位的。對(duì)于算力的服務(wù)商來(lái)說(shuō),在接下來(lái)的3-5年里重點(diǎn)去瞄著制造業(yè)未來(lái)可期。”張慶杰說(shuō)。
除了制造業(yè)之外,他還指出,汽車有望成為下一代移動(dòng)智能計(jì)算終端,軟件定義汽車的發(fā)展趨勢(shì)要求算力實(shí)現(xiàn)智能升級(jí);金融行業(yè)則要求接入廣泛且靈活的安全算力;至于醫(yī)療和教育的算力需求,當(dāng)前還在醞釀階段,當(dāng)“普慧”算力降本后有望迎來(lái)爆發(fā)。