問題:
近年來,中美大模型發展差距加大,國內人工智能大模型領域競爭日趨激烈,用好北京人工智能資源優勢、加速人工智能大模型產業發展,面臨5個迫切需要解決的實際困難。一是高端復合型人才不足。數據顯示,全球頂級AI研究員工作所在地,美國占60%,中國僅占11%。盡管北京人工智能人才高度聚集,但符合產業發展的復合型人才仍然緊缺。二是缺少高質量的中文數據集。目前已上線的中文數據集整體數量和質量與英文數據集相差巨大,相當一部分內容非常陳舊。三是算力成本居高不下。國產芯片算力集群不足以支撐較大規模的模型訓練,即便使用較小規模參數的模型,國產芯片訓練成本仍為使用英偉達等算力基礎設施的2.5倍以上。四是大模型應用場景少且監管嚴苛。大模型應用不充分,政府部門、企業出于各種原因對大模型應用的接受度和認可度不高,應用場景開放不夠。大模型應用需要準備大量材料以通過“雙新評估”,費時耗力,已通過評估的基礎模型服務場景改變算法及算法備案流程繁瑣,導致大部分模型應用僅聚焦企業內部使用,市場化應用不足。
分析:
一是人才方面,大模型應用涉及跨學科、跨文理多個領域,高端復合型人才難以滿足產業發展需要。二是中文數據集建設方面,國內外基礎大模型參數數據集主要以英文為主,大模型中文語料庫建設及語料庫訓練運用面臨困難,需要政府統籌。三是算力方面,大模型企業需要迅速獲得大量低成本、高效能的算力,而非芯片本身。盡管北京市已投建部分算力中心,但因工程化能力不足等問題,難以支撐較大參數的基礎模型訓練,需要企業付出較高成本進行算力工程化調試并處理訓練中的適配問題,大幅提升了訓練成本。四是應用場景方面,政府公共服務部門、國有企業對大模型等新技術應用、數據安全保密等存在顧慮,開放大模型場景意愿不強。許多傳統企業還處于信息化、數字化初期,對大模型的應用接受度和認知度不高。基礎模型通過網信辦“雙新評估”需要準備大量材料,初創企業很難有足夠的人手和專業力量投入。利用已通過評估的基礎模型服務場景,通常需要進行算法調優,如應用在面向公眾的場景中,必須對每一次算法改變進行算法備案,流程繁瑣。
建議:
一是加強人工智能領域人才支持。支持民營企業AI人才參與國家重大科技專項、重點研發計劃等頂層設計和執行,并支持民營企業AI專家參與國家杰出青年科學基金、長江學者獎勵計劃。對于符合條件的高端AI人才,實行優先落戶政策,提供稅收優惠,保障子女就學、家人就醫等,解決人才后顧之憂。
二是加大產業規劃引導力度。通過算力券等補貼方式,降低企業使用優質算力成本。采用弱知識產權、數據安全技術等方式推動數據開放共享,推動公共數據資源開放利用。加快構建統一的公共數據開放基礎制度規范,擴大面向AI產業的公共數據供給范圍,支持龍頭企業牽頭制定數據標注規則和數據標注質量評估體系,加快構建中文高質量數據集。
三是開放應用場景,加速產業發展。推動相關部門、國有企業加速開放場景。為民營大模型創新企業提供資金和政策支持。優化審批流程,為大模型技術產品和服務進入市場提供快速通道。鼓勵企業探索訂閱服務、按使用量付費、技術許可等多樣化商業模式。支持服務業、文化類企業加速應用基礎大模型、研發應用行業模型和企業專屬模型,通過“用模型”反哺技術創新。
四是穩慎推進監管,留足創新空間。在人工智能領域統籌發展與安全,審慎出臺規制型政策,為創新留足時間和空間。對處于發展初期的AI大模型技術和應用,結合其技術特征和發展規律,在監管模式上更注重事中、事后監管,對應用場景風險較低的新技術新應用,以行業自律等方式予以治理,留出更多試錯、容錯空間,保護企業投資意愿和創新活力。