編輯《證券時報》 周春媚
走進位于深圳前海的博大數據智能計算中心,一座方形、藍白相間的建筑尤為引人注目。在這個智能計算中心的機房里,一排排的智能計算機柜排列整齊,服務器運行迅速,進行了復雜的數據分析和計算任務。
“作為一家綜合計算能力服務提供商,我們在自己的計算能力集群上部署了DeepSeek-R1 博達數據副總裁白旭告訴《證券時報》編輯:“671B全版本供客戶使用,通過直接向用戶提供人工智能模型,在市場上創造計算能力需求,從而推動我們智能計算中心高密度機柜和計算能力服務的銷售。”。
隨著國內大型DeepSeek模型的普及,近年來,來自各行各業的許多公司宣布部署DeepSeek模型,應用程序端的計算能力需求爆發。業內人士表示,DeepSeek通過降低人工智能應用程序的門檻,將計算能力需求從“培訓主導”轉變為“推理主導”。面對新的行業變化,智能計算中心需要加快轉型,從簡單的計算能力提供商轉變為專業服務提供商,提供覆蓋整個計算能力生命周期的專業服務,提高計算能力資源的利用效率。
Deepseek部署熱潮
驅動對計算能力的需求增加
最近,企業部署DeepSeek的熱情仍然很高。《證券時報》編輯注意到,許多上市公司密集宣布,DeepSeek模型的相關部署已經完成。
例如,2月18日,海看股份在互動平臺上表示,公司已部署接入DeepSeek模型,如自主開發的人工智能智能審計平臺,并對自己的平臺進行微調和優化。同日,卓創信息還發布消息稱,DepSeek系列大型模型的本地化部署已經完成,基于DepSeek-R1模型,采用蒸餾技術,努力打造大宗商品行業的大型模型。
“DeepSeek的一個重要意義是推廣普通公眾的人工智能科學。各行各業的人都知道這個大模型,并試圖使用它。這種集中的訪問和使用推動了計算能力需求的爆發。”中浩新英解決方案架構師顧立成在接受《證券時報》編輯采訪時表示,自今年春節以來,許多客戶一直在詢問公司智能計算中心和DepSeek的適應情況。”目前,我們的智能計算中心已經能夠運行各種蒸餾版本的DepSeek模型,性能非常好。”顧立成說。
作為一個開源模型,DeepSeek以其高性能、低成本的優勢,大大降低了人工智能應用的門檻,正成為許多下游人工智能應用公司和終端制造商部署人工智能模型的首選。以不久前正式訪問DeepSeek-R1模型的智能芽為例,公司是一家科技創新信息服務提供商,公司技術負責人告訴《證券時報》編輯,DeepSeek開發的開源模型,確實可以幫助企業減少早期開發投資,特別是可以節省高基礎設施試錯成本。
編輯在接受采訪時了解到,企業的需求不僅是本地化部署DeepSeek大模型,還有很多公司會根據自己的行業數據定制開發DeepSeek大模型,培訓垂直模型或構建專業應用。
“給我留下深刻印象的是一家律師事務所。客戶希望我們能幫助他們利用自己的行業數據定制Depseek,并在自己的專業領域建立智能應用程序。目前,我們正在與合作伙伴合作,努力滿足客戶的需求。”白旭表示,Depseek有助于加快國內企業的數字化轉型。由于人工智能應用場景(如智能審批、數字雙胞胎)的擴展,對高密度機柜和邊緣計算設備的需求將大大增加。
從“訓練主導”到“推理主導”
國產算力芯片廠家迎利好
培訓成本低,這是Deepseek不同于其他大型模型的核心優勢。雖然Deepseek沒有披露R1模型的確切培訓成本,但根據V3模型發表時發表的論文,V3培訓成本僅為557.6萬美元,約為Meta開源大模型培訓成本的十分之一。
根據編輯的采訪,大型模型主要分為兩個階段:培訓和推理。培訓是指使用大量數據來培訓大型模型,通常需要高計算能力和存儲資源;推理是指將培訓模型應用于實際任務,如提問和生成文本、識別圖片和視頻。
“傳統的大型模型訓練就像吞噬計算能力的黑洞。單一訓練的成本往往是數千萬美元的巨額投資,建立了只有科技巨頭才能克服的技術障礙。計算能力軍備競賽加劇了全球GPU資源競爭,形成了基礎模型研發的高度集中模式。”上海經義工業數學智能研究所副院長沈佳慶告訴《證券時報》,DepSeek打破了這一既定的秩序,將促進計算能力需求的重新分層。過去,高度集中的訓練計算能力需求將開始擴散到應用程序端的推理計算能力需求。
“早在去年年初,我們就預測,智能計算中心的計算能力需求結構將從‘訓練主導’轉向‘推理主導’。大型模型培訓后,應該有用、有用、易于使用。DepSeek成功地做到了這一點,從而爆炸了。”白旭表示,目前,國內計算能力芯片制造商與國內OEM(原設備制造商)制造商合作推出了DepSeek一體機,國內主要云平臺也推出了DepSeek模型服務,大大降低了大型模型應用的使用門檻。
除了推動推理芯片需求的增長外,DeepSeek對國內計算能力芯片制造商的好處也來自于技術層面。顧立成告訴編輯,在DeepSeek推出之前,國內大型模型正處于“百花齊放”的狀態。作為人工智能芯片設計和國內計算能力硬件平臺解決方案提供商,中浩芯英涉及大量的大型模型適應需求。隨著國內大型模型的逐步關注,我們將加快計算能力硬件平臺和軟件大型模型國內解決方案的定型和市場化。”顧立成說。
事實上,自1月底以來,從云基礎設施服務提供商到國內計算能力芯片制造商,DeepSeek模型正在全面適應。在云基礎設施服務提供商方面,華為云、騰訊云、阿里巴巴云、百度云等主流云制造商已宣布,DepSeek相關模型已上架,供開發商部署調用。中國移動、中國電信、中國聯通三大基礎電信企業也全面接入DepSeek。國內芯片公司也“聞風而動”。據《證券時報》編輯的不完整統計,天數智能芯片、摩爾線程、海光信息、云天勵飛、懸崖技術、綏遠技術、穆西、昆侖芯片等10多家國內芯片公司已宣布適應DepSeek模型服務。
從提供算力到專業服務
智能計算中心迎接轉型機遇
DeepSeek的崛起引起了人們對未來計算能力需求的廣泛關注。近年來,計算能力板塊和二級市場相關股票也出現了較大波動。
沈佳慶認為,短期內,由于Deepseek降低了培訓成本,培訓環節對大規模計算能力的需求會下降,從而將資源投入到具體解決方案的研發中。“但從中長期來看,Deepseek將增加推理和微調的計算能力需求,并應用原來用于培訓環節的部分閑置計算能力;第二,它將刺激基本的大型模型加速迭代,對計算能力的需求可能會增加。”沈佳慶說。
業內人士普遍認為,DeepSeek將對智能計算中心構成長期積極影響。然而,在DeepSeek帶來“繁榮”之前,該行業對各地積極建設和蓬勃發展的智能計算中心存在疑問。據編輯采訪,近年來,由于人工智能產業的蓬勃發展,全國掀起了智能計算中心規劃建設的熱潮,大大小小的智能計算中心如雨后春筍般遍布全國。最近,國際數據公司(IDC)根據浪潮信息聯合發布的《中國人工智能計算能力發展評估報告》,2024年中國智能計算能力規模同比增長74.1%,顯示了中國在智能計算領域的巨大投資。
然而,一些智能計算中心存在利用率低、供需不匹配的問題。沈佳慶分析說,從供應方面看,為響應國家和地方產業規劃的政策導向,加上政府鼓勵、電信、IT軟硬件等國有企業和大型民營企業,堅持“適度先進”的原則,開展大規模智能計算中心建設,導致市場供應井噴;從需求方面看,雖然市場需求增長,但沒有明顯的井噴。”首先,國內軟硬件在效率和應用方面仍存在差距,應用效果低于預期;第二,在產業發展初期,技術還不成熟,企業應從理性的角度考慮產品或服務的多種因素,相對謹慎。”沈佳慶說。
計算能力閑置困擾著中國的許多智能計算中心,而Deepseek可能有助于緩解這個問題。”就像移動互聯網的普及一樣,當大型模型真正成為人們習慣使用的工具時,它就會爆發出非常巨大的計算能力需求。”顧立成說,提前布局智能計算中心,以確保當需求真正爆發時,智能計算中心能夠承受這種“飛濺的流量”。
對于智能計算中心來說,DeepSeeek也帶來了新的發展方向和機遇。據白旭介紹,智能計算中心的產品模式不再局限于提供高密度機柜和計算能力服務,而是可以直接部署模型應用于企業。
“智能計算中心應該從簡單的硬件建設轉向新的發展階段,主要是提供專業的服務。”沈佳慶認為,計算能力也是智能計算中心從基礎資源到生產力工具的市場機遇,真正成為普遍應用。”通過提供覆蓋整個計算能力生命周期的專業服務,與產業鏈中不同的主體合作,提供計算能力調度、計量、優化、微調、包裝、維護、二次開發等解決方案,將有效促進計算能力服務在各行各業的滲透和應用,擴大整個計算能力中心的市場需求。”沈佳慶說。
本文僅供讀者參考,任何人不得將本文用于非法用途,由此產生的法律后果由使用者自負。
如因文章侵權、圖片版權和其它問題請郵件聯系,我們會及時處理:tousu_ts@sina.com。
舉報郵箱: Jubao@dzmg.cn 投稿郵箱:Tougao@dzmg.cn
未經授權禁止建立鏡像,違者將依去追究法律責任
大眾商報(大眾商業報告)并非新聞媒體,不提供任何新聞采編等相關服務
Copyright ©2012-2023 dzmg.cn.All Rights Reserved
湘ICP備2023001087號-2