在算力基礎設施高質量發(fā)展2025年目標時間表的大政策背景下,我國生成式人工智能(AIGC)服務和大模型產業(yè)生態(tài)發(fā)展現(xiàn)狀如何?通用大模型和行業(yè)大模型產業(yè)發(fā)展的核心競爭力到底是什么?在產業(yè)數字化進程中,國產大模型的“千模大戰(zhàn)”狀態(tài)會持續(xù)多久?
想要回答上述問題,我們可以從剛剛在遼寧沈陽閉幕的中國計算機大會(CNCC2023)上尋找答案。作為中國計算機學會主辦的計算機領域級別高、規(guī)模大的高端學術會議,CNCC今年以“發(fā)展數字基礎設施,支撐數字中國建設”為主題,在130個技術論壇和20余場專題活動中,有近30場活動都對近來火熱的人工智能與大模型做了深層次解析。記者在同期舉辦的“超智融合AI大模型應用落地發(fā)展,高效計算新范式”專題論壇中,找到了一些可以回答這些問題的觀點和建議。
算力、算法、數據——AIGC技術發(fā)展與安全并重
“無算力、不模型”。自生成式人工智能服務(AIGC)和GPT大模型訓練爆火后,圍繞算力、算法和數據相關的討論此起彼伏,中文語境下的國產大模型應用更是呈現(xiàn)出“千模大戰(zhàn)”的狀態(tài)。
今年,我國先后出臺了《生成式人工智能服務管理暫行辦法》和《算力基礎設施高質量發(fā)展行動計劃》,對AIGC技術與產業(yè)發(fā)展背后的算力基礎設施做了詳細規(guī)劃。其中,《行動計劃》從計算力、運載力、存儲力以及應用賦能四個方面提出了到2025年算力基礎設施發(fā)展的量化指標,計算力方面,算力規(guī)模超過300EFLOPS,智能算力占比達到35%;存儲力方面,存儲總量超過1800EB,先進存儲容量占比達到30%以上。
智能算力是上述專題活動探討的主題。圍繞人工智能大模型算法優(yōu)化以及應用落地過程中面臨的現(xiàn)實問題,來自中國科學院、中國信息通信研究院、中國人民大學、北京超級云計算中心等產學研用機構的嘉賓共同討論了技術應用、人才培養(yǎng)、行業(yè)創(chuàng)新、內容安全等焦點話題。
“人工智能大模型在業(yè)務訓練過程中從推理、問答、檢測到描述,重點在于解決連續(xù)性問題?!敝袊嗣翊髮W高瓴人工智能學院教授、博導盧志武表示,通用大模型在文本、圖片、音視頻等多模態(tài)內容生成能力上還存在許多需要解決的問題,“從多圖理解、物體定位、OCR等業(yè)務功能上,多模態(tài)大模型對于任務預訓練和數據指令微調等都需要完善升級,在應用場景落地時,如何通過大模型訓練去解決用戶的多元化復雜需求非常重要?!?/p>
“數據對于大模型的訓練和應用來說是至關重要的,現(xiàn)在大模型需要的數據是用哪些數據和指令集類型來讓大模型具備什么樣的能力。本質上它是一個多樣性和覆蓋面的研究性問題,這與記憶學習和深度學習的數據有所區(qū)別?!敝袊茖W院自動化所副研究員孔慶超認為,人工智能大模型在國內的發(fā)展仍需要投入研發(fā)力量,行業(yè)大模型在不同行業(yè)的應用探索是否一定會產生成果,這就需要通過大量的算法去做邏輯推理,例如,金融行業(yè)大模型是否有更多算法來支持生成投資決策參考意見,這樣的大模型是否具備迭代和學習等能力,都需要做充足的預訓練和技術研發(fā)。
專家指出,數據、算法和算力是新型信息基礎設施的重要組成部分,算力基礎設施呈現(xiàn)多元泛在、智能敏捷、安全可靠、綠色低碳等特征,對于助推產業(yè)轉型升級、賦能科技創(chuàng)新進步等具有重要意義。在生成式人工智能技術方面,打造并完善算力、數據和算法三位一體的協(xié)同應用生態(tài),通用大模型和行業(yè)大模型都在做應用“減法”,讓大模型從“玩具”到“工具”轉變。讓技術落地、讓成果產生價值、讓服務匹配業(yè)務,這或許就是人們正在討論的大模型未來生態(tài)。
中國科學院計算機網絡信息中心人工智能部副主任王玨認為,國產大模型在應用落地和業(yè)務適配方面,關鍵在于數據清洗。“我們也在嘗試各種模型,無論是準確度還是計算效率,面臨的挑戰(zhàn)就是國產開源大模型的穩(wěn)定性,這方面我們做了很多工作,通過文獻數據促進各學科科研發(fā)展。同時,讓國產大模型好用也是我們的研究方向?!?/p>
“人工智能、大數據、云計算等新一代信息技術加速了大模型的發(fā)展。通用或行業(yè)大模型研究訓練離不開大量的算力支撐。”并行科技董事長陳健博士認為,從產業(yè)發(fā)展的角度來看,算力是工業(yè)產品,行業(yè)大模型訓練對于算力的需求需要找準方向才好發(fā)力。
技術、應用、生態(tài)——提升大模型準確率與效率
大模型應用對于高頻次的算力資源需求,往往與大模型升級迭代的多元場景應用能力建設息息相關。當前、中文語境下的大模型生態(tài)還面臨哪些問題,交叉學科人才培養(yǎng)合作機制和產業(yè)鏈上下游能為大模型帶來哪些深層次變革?在接受記者提問時,多位嘉賓也談到了目前大模型所提供服務過程中亟待解決的一些行業(yè)性問題。
早期AIGC技術的發(fā)展,從各個鏈條和語義理解上產生了大量的大模型內容生成的“幻覺”問題,即“一本正經的胡說八道”。在中國信息通信研究院融創(chuàng)中心主任田輝看來,新興技術的行業(yè)應用一定是需要產學研用結合才能健康的狀態(tài),“AIGC技術的分工角色更細,產業(yè)應用的開發(fā)、部署和應用都是需要產業(yè)鏈共同合作。如大模型的二次開發(fā),迭代升級、運維服務等領域的人才培養(yǎng)機制,都需要細分與合作?!?/p>
AIGC技術產業(yè)進入“千模大戰(zhàn)”狀態(tài)后,最終我們所依靠的核心競爭力是什么?業(yè)內人士認為,AIGC技術產業(yè)的發(fā)展方向或路徑是從人工智能技術升級方面,提升大模型的理解、生成、邏輯推理和記憶等核心基礎能力;在場景應用落地方面,強化大模型的學習能力,提升生成服務準確率和效率;在行業(yè)生態(tài)建設方面,提升大模型的智能化水平和生態(tài)應用空間,打造成為輔助決策的實操性工具。
“北京超級云計算中心采用超算架構模式構建智能算力資源,將分布在國內的各大算力中心資源進行整合,可以最大限度地利用現(xiàn)有資源,降低因空閑資源浪費而產生的損失。同時也可以有效滿足人工智能大模型訓練對算力的高頻次需求?!北本┏壴朴嬎阒行膮堑辖榻B說,以超級計算機為代表的超算架構能夠提供更加全面高效的并行計算能力,為大模型訓練處理提供算力服務支持,實現(xiàn)更高效的模型訓練以及更好的預測準確度。
王玨表示,行業(yè)大模型的發(fā)展離開算力就會拉大行業(yè)差距?!白屗懔Y源能更好地去跑這些大模型,保持其精度或者泛化能力不變,提升大模型訓練的速度和效率,能夠真正并盡快在大模型訓練上實現(xiàn)全棧國產化,這是研究的熱點。”
“希望大模型的行業(yè)應用發(fā)展看到有百花齊放的生態(tài),但需要關注的是低水平重復工作的問題。無論是數量還是類型,大模型的產品或商業(yè)形態(tài)還有很多探索空間?!碧镙x認為,AIGC技術的發(fā)展最終的落地在于內容服務?!叭绾翁嵘郎蚀_率和效率,誰的平臺投入的力量足夠,大模型訓練的速度和效率,以及應用適配更強,誰就能突破成功?!?/p>
北疆新聞:內蒙古自治區(qū)重點新聞網站(客戶端),內蒙古出版集團新華報業(yè)中心旗下國家互聯(lián)網新聞信息采編發(fā)布服務一類資質網站(客戶端)。
北疆新聞版權與免責聲明:
一、凡本站中注明“來源:北疆新聞”的所有文字、圖片和音視頻,版權均屬北疆新聞所有,轉載時必須注明“來源:北疆新聞”,并附上原文鏈接。
二、凡來源非北疆新聞的新聞(作品)只代表本網傳播該消息,并不代表贊同其觀點。
如因作品內容、版權和其它問題需要同本網聯(lián)系的,請在見網后30日內進行,聯(lián)系郵箱:bjwmaster@163.com。
版權聲明:北疆新聞版權所有,未經書面授權,不得轉載或建立鏡像,違者依法必究。 本站違法和不良信息舉報電話:15648148811蒙ICP備16001043號-1
Copyright © 2016- 北疆新聞網 All Rights Reserved互聯(lián)網新聞信息服務許可證:15120200009-1蒙公網安備:15010502001245