首頁IT—正文
如何提升智效同時解決能耗難題?AI迎來“大考”
2024年06月03日 11:10 來源:中青報·中青網(wǎng)

  1.05萬億千瓦時(kW·h)!

  這是國際能源署(International Energy Agency,以下簡稱“IEA”)日前發(fā)布的《電力2024》報告中,對2026年全球數(shù)據(jù)中心的最高總用電量作出的預(yù)測。1千瓦時就是1度電,“超過1萬億度電”,根據(jù)報告的估算,這些電量大約是整個日本全年的用電量。

  數(shù)據(jù)中心、智算中心等算力基礎(chǔ)設(shè)施是人工智能(AI)的數(shù)據(jù)中樞和算力載體。隨著AI尤其是生成式人工智能(AIGC)和大模型技術(shù)的快速發(fā)展,算力需求激增,AI的能耗問題也越來越受到關(guān)注。在近段時間舉行的多場國際會議上,一些科技巨頭紛紛表達(dá)了對AI發(fā)展帶來的能耗問題的擔(dān)憂。

  如何在提升智效的同時解決能耗難題,對AI行業(yè)來說,是一場“大考”。

  AI在推理階段的耗能不容忽視

  討論AI耗能的問題,不可避免地要談到AI大語言模型(以下簡稱“大模型”)。

  “生成式人工智能是當(dāng)前AI技術(shù)發(fā)展的重點(diǎn)!彬v訊研究院資深專家王鵬在接受中青報·中青網(wǎng)記者采訪時說。他表示,當(dāng)前,生成式人工智能技術(shù)的基礎(chǔ)就是以數(shù)據(jù)和算力堆疊為標(biāo)志的大模型,其訓(xùn)練和應(yīng)用需要大量的算力支持,“算力背后則是算力基礎(chǔ)設(shè)施耗電所帶來的巨大電能需求”。

  全國政協(xié)委員、中國科學(xué)院計(jì)算技術(shù)研究所研究員張?jiān)迫赋,大模型的參?shù)和數(shù)據(jù)規(guī)模越大,其智能效果就越好。在大模型中,“Scaling Laws”(規(guī)模效應(yīng))意味著當(dāng)參數(shù)和數(shù)據(jù)規(guī)模大到一定程度時,大模型的智能表現(xiàn)將出現(xiàn)躍升,也就是“智能涌現(xiàn)”!澳壳拔覀冞沒看到‘智能涌現(xiàn)’的上限在哪。”

  “一般來說,參數(shù)量越大,大模型的算力消耗就越大,其消耗的電能就越多!蓖貔i表示,因?yàn)檫沒達(dá)到上限,以O(shè)penAI為代表的人工智能公司在“Scaling Laws”的驅(qū)使下,還在持續(xù)增加大模型的參數(shù)和數(shù)據(jù)規(guī)模,以求實(shí)現(xiàn)通用人工智能(AGI)的目標(biāo),造成短期內(nèi)算力需求和電能需求的巨大提升。

  “因?yàn)镚PT-3有1750億個參數(shù),訓(xùn)練用到了1024張英偉達(dá)A100芯片,所以業(yè)內(nèi)將其稱為‘千卡千參’!鄙虦萍贾悄墚a(chǎn)業(yè)研究院院長田豐說,目前GPT-4、GPT-5等大模型都達(dá)到了“萬卡萬參”的規(guī)模,且訓(xùn)練模型所用芯片也從英偉達(dá)A100更新到英偉達(dá)H100、B200,“參數(shù)量的激增將導(dǎo)致能耗顯著增加”。

  除了模型訓(xùn)練以外,AI在推理階段的耗能也不容忽視!巴评砑创竽P晚憫(yīng)用戶需求的過程”,張?jiān)迫榻B,大模型單次響應(yīng)用戶需求的耗電量并不大,“但隨著用戶規(guī)模的增加,耗電量也將不斷累積并增大!

  近日,源自美國的一則“如果將10萬塊英偉達(dá)H00芯片部署在同一地區(qū)進(jìn)行模型訓(xùn)練,會導(dǎo)致電網(wǎng)崩潰”的新聞引起社會關(guān)注。

  多位專家在接受記者采訪時表示,AI導(dǎo)致電網(wǎng)崩潰的原因在于,大模型的訓(xùn)練是階段性的工作,所用到的算力要集中在一個數(shù)據(jù)中心里,在有限時空范圍內(nèi)進(jìn)行大模型訓(xùn)練,會給局部電網(wǎng)帶來非常大的用電負(fù)荷。

  “穩(wěn)定的電網(wǎng)系統(tǒng)中突然出現(xiàn)巨大負(fù)荷擾動,會對電網(wǎng)的穩(wěn)定和安全產(chǎn)生影響。”張?jiān)迫赋,隨著大模型參數(shù)和數(shù)據(jù)規(guī)模的進(jìn)一步增加,AI的能耗問題將越來越突出,尤其是對于電力供應(yīng)緊張的國家和地區(qū)!伴L遠(yuǎn)來看,AI推理過程的耗能將越來越大;短期內(nèi),大模型訓(xùn)練的能耗則是最大的AI能耗增量!

  在王鵬看來,與家庭用電量相比,AI的耗電量顯得很大,但其在社會總用電量中的占比依然很小,“還遠(yuǎn)沒有達(dá)到制造業(yè)用電的數(shù)量級”。

  解決方案:技術(shù)創(chuàng)新與新能源

  根據(jù)美國機(jī)構(gòu)Uptime Institute的預(yù)測,到2025年,AI相關(guān)業(yè)務(wù)在全球數(shù)據(jù)中心用電量中的占比將從2%增加到10%;到2030年,智能計(jì)算的年耗電量將占全球發(fā)電總量的5%。

  “解決能耗問題,是AI技術(shù)發(fā)展的重要前提!碧镓S對記者說,雖然目前AI的能源消耗還不至于引起大范圍“電荒”,但隨著AI的大規(guī)模應(yīng)用,未來可能發(fā)生AI“缺電”的情況,需要尋找合適的解法,讓有限的電力能源可以容納更大的算力規(guī)模。

  通過研究和實(shí)踐,人們對AI的了解逐漸增強(qiáng),一系列解法隨之而來。從需求角度看,優(yōu)化大模型架構(gòu)、提升芯片效率和算力效率等,被認(rèn)為是降低AI能耗的有效途徑。

  張?jiān)迫硎,首先,可以設(shè)計(jì)AI模型訓(xùn)練的專用芯片,其效率相較GPU(圖形處理器,現(xiàn)常用于AI計(jì)算)提升了10倍以上;其次,可以優(yōu)化AI模型的參數(shù),很多小模型僅有幾十億的參數(shù)量,但已經(jīng)實(shí)現(xiàn)了和大模型一樣的效果;此外,還可以通過對推理過程進(jìn)行優(yōu)化壓縮,設(shè)計(jì)專用推理芯片,進(jìn)一步降低AI推理階段的能耗。

  “大模型變小模型,目前降低能耗效果最好!睆?jiān)迫晕④?月底發(fā)布的自研小尺寸AI模型Phi-3為例介紹。據(jù)了解,Phi-3模型目前有3個版本,其中Phi-3 mini是一個擁有38億參數(shù)的語言模型,可部署在手機(jī)上,根據(jù)實(shí)驗(yàn)和測試結(jié)果,其性能已經(jīng)可以與GPT-3.5等大模型相媲美。

  在能源供應(yīng)方面,訴諸多樣化的新能源供給、依靠國家進(jìn)行宏觀調(diào)控與規(guī)劃等舉措,將有助于解決AI能耗問題。天使投資人、資深人工智能專家郭濤對記者表示,當(dāng)前,新能源,包括太陽能、風(fēng)能、水能等可再生能源,正逐漸成為數(shù)據(jù)中心的最佳能源選擇。“如果沒有足夠的可再生能源來滿足AI能耗的增長,可能會導(dǎo)致對化石燃料的依賴加劇,從而對環(huán)境造成負(fù)面影響。此外,數(shù)據(jù)中心還可以通過智能算法來優(yōu)化能源使用效率,實(shí)現(xiàn)AI與電網(wǎng)的協(xié)同發(fā)展!

  不少人工智能公司已經(jīng)開始關(guān)注新能源。2021年,OpenAI首席執(zhí)行官山姆·奧爾特曼向核聚變初創(chuàng)公司Helion Energy投入3.75億美元;2024年3月,亞馬遜云服務(wù)公司(AWS)收購美國賓夕法尼亞州一座數(shù)據(jù)中心園區(qū),據(jù)了解,該園區(qū)就是從鄰近的核電站獲取電力。

  “解決AI耗能問題涉及到算力、電力等多個系統(tǒng)的協(xié)調(diào)與配合!蓖貔i指出,一方面,要從AI本身去降低能耗,包括優(yōu)化算法、降低模型參數(shù)、提高計(jì)算性能等;另一方面,整個能源系統(tǒng)也要積極響應(yīng)AI的能耗需求。

  “源網(wǎng)荷儲”一體化考慮

  新能源或?qū)⒊蔀榻鉀QAI耗能問題的一把“鑰匙”,這正好與我國此前提出的“東數(shù)西算”工程相契合。

  國家能源局的數(shù)據(jù)顯示,2023年,我國可再生能源新增裝機(jī)3.05億千瓦,占全國新增發(fā)電裝機(jī)的82.7%,占全球新增裝機(jī)的一半;全國可再生能源發(fā)電量近3萬億千瓦時,接近全社會用電量的1/3。目前,我國已建成全球規(guī)模最大的電力供應(yīng)系統(tǒng)和清潔發(fā)電體系,其中青海、內(nèi)蒙古、寧夏等西北部地區(qū)則是清潔能源的“富礦”。

  2021年,我國提出實(shí)施“東數(shù)西算”工程,引導(dǎo)數(shù)據(jù)中心向西部資源豐富地區(qū)聚集,推動當(dāng)?shù)財(cái)?shù)據(jù)中心走向低碳、綠色、可持續(xù),同時滿足東部地區(qū)的算力需求。2022年2月,內(nèi)蒙古、貴州、甘肅等8地啟動建設(shè)國家算力樞紐節(jié)點(diǎn),10個國家數(shù)據(jù)中心集群被寫入工程總體“規(guī)劃”,“‘東數(shù)西算’工程全面啟動”。

  “大模型時代,‘東數(shù)西算’工程將對全國的電力需求和算力需求起到重要的宏觀調(diào)控作用!睆?jiān)迫A(yù)計(jì),未來將會有越來越多的大型算力中心或智算中心選址我國西部地區(qū),“東數(shù)西訓(xùn)”(即東部地區(qū)的AI大模型,在西部地區(qū)進(jìn)行訓(xùn)練——記者注)將成為AI與新能源協(xié)調(diào)發(fā)展的典型場景。但他強(qiáng)調(diào),推動新能源更好地賦能AI發(fā)展,儲能是一個需要解決的問題。

  “大規(guī)模儲能的建設(shè)決定了新能源是否能更好地滿足算力需求!碧镓S也同意張?jiān)迫挠^點(diǎn)。田豐指出,包括光電、風(fēng)電等在內(nèi)的新能源,具有間歇性發(fā)電的特點(diǎn),需要依靠儲能系統(tǒng)將多發(fā)的電及時存儲起來,削峰調(diào)谷,以保證電網(wǎng)的供需平衡。

  國家能源局的最新數(shù)據(jù)顯示,截至2024年一季度末,我國已建成投運(yùn)的新型儲能項(xiàng)目累計(jì)裝機(jī)規(guī)模達(dá)到3530萬千瓦,同比增長超過210%,其中10萬千瓦以上的儲能電站超5成,呈現(xiàn)集中式、大型化的發(fā)展趨勢。

  在儲能的建設(shè)上,王鵬著重強(qiáng)調(diào)了新能源汽車的分布式儲能能力。“隨著電池充放電次數(shù)和壽命不斷提高,數(shù)億輛電車?yán)梅骞入妰r差來儲能并反向回供電網(wǎng),基本可以實(shí)現(xiàn)零成本用車甚至盈利,同時也能解決電網(wǎng)的調(diào)峰問題!

  此外,王鵬還認(rèn)為要重新思考“數(shù)據(jù)網(wǎng)”和“電力網(wǎng)”的分布式聯(lián)動與微觀布局協(xié)同。他指出,為滿足短期內(nèi)快速增長的人工智能推理算力需求,除了在西部可再生能源豐富的地區(qū)布局大型算力中心,實(shí)現(xiàn)“東數(shù)西算”;也需要考慮在東部需求側(cè)的數(shù)據(jù)中心和算力中心附近,積極布局分布式可再生能源,如與城鄉(xiāng)建筑、農(nóng)業(yè)設(shè)施等結(jié)合的分布式BIPV(光伏建筑一體化)、光儲直柔一體化等!岸疫要‘源網(wǎng)荷儲’一體化考慮,盡可能通過微電網(wǎng)實(shí)現(xiàn)就地峰谷平衡,減少棄風(fēng)棄光!

  “這需要電價政策、基礎(chǔ)設(shè)施建設(shè)、政策支持和用戶行為等多方面的配合。”在王鵬看來,整個算力網(wǎng)絡(luò)、輸電網(wǎng)絡(luò)、分布式能源網(wǎng)絡(luò),與車輛(充電)網(wǎng)絡(luò)的高度耦合,或許是解決我國未來AI能耗問題的關(guān)鍵。

  “在考慮投入和產(chǎn)出算總賬的情況下,AI實(shí)際上進(jìn)一步提高了社會的生產(chǎn)效率,降低了能耗!碧镓S認(rèn)為,AI作為新質(zhì)生產(chǎn)力正在賦能經(jīng)濟(jì)社會發(fā)展,如今的AI大模型已經(jīng)成為重要的基礎(chǔ)科研設(shè)施,其訓(xùn)練中的投入,最終將為全社會帶來新質(zhì)生產(chǎn)力的紅利。

  目前,在AI大模型的訓(xùn)練成本中,能源消耗成本的占比已經(jīng)超過一半。田豐說,從基礎(chǔ)科研的角度看,要繼續(xù)加大對AI技術(shù)的投資,“現(xiàn)在是奮起直追的時候,不應(yīng)該自束手腳”。具體到AI耗能方面,他建議,可以給予大模型訓(xùn)練一定的能源支持政策。

  中青報·中青網(wǎng)見習(xí)記者 賈驥業(yè) 記者 朱彩云 來源:中國青年報

編輯:孫婷婷