全部比賽
籃球比賽
籃球錄像
籃球新聞
CBA
西甲
意甲
歐冠
電競
世界杯
更多
- 球隊
- 專題
- CCTV5
- CCTV5+
- 亞冠
- 全部頻道
- 全部賽事

DeepSeek被稱為AI界拼多多,，訓練2個月僅花費了557.6萬美元,！

來源：360直播 2025-01-28 16:45:42

1月28日訊據(jù)錢江晚報報道，此次DeepSeek-V3在AI行業(yè)引發(fā)關(guān)注,，關(guān)鍵的原因在于——超低的預訓練成本,。

“預訓練”是AI大模型學習中的一種方法,，指的是通過海量的數(shù)據(jù)，訓練一個大模型,。訓練時需要大量的數(shù)據(jù)和算力支持,，每次迭代可能耗資數(shù)百萬至數(shù)億美元。

官方技術(shù)論文披露,，DeepSeek-V3在預訓練階段僅使用2048塊GPU訓練了2個月,，且只花費557.6萬美元,。這個費用是什么概念？

據(jù)報道,，GPT-4o的模型訓練成本約為1億美元,。簡單粗暴地說，這相當于DeepSeek-V3比同等性能的AI大模型,，降了十幾倍的成本,。

早在2024年5月，深度求索發(fā)布DeepSeek-V2時,，就曾因給模型的定價太過于便宜,，開啟了中國大模型的價格戰(zhàn)，被稱之為“AI界的拼多多”,。

undefined

“相比于說它是‘拼多多’,，它更像小米，貼近成本定價,，并且自產(chǎn)自銷,。”馬千里認為,，訓練成本比較低的原因,，離不開深度求索團隊自研的架構(gòu)和算力，他們自身的算力儲備可以與大廠比肩,，并且更注重底層的模型,。

“ChatGPT走的是大參數(shù)、大算力,、大投入的路子,，DeepSeek-V3的路徑用了更多的巧思，依托數(shù)據(jù)與算法層面的優(yōu)化創(chuàng)新,，從而高效利用算力,，實現(xiàn)較好的模型效果?！瘪R千里說道,。

林書豪湖人比賽視頻 nbanba 中超直播車五星體育直播網(wǎng) cba錄像虎撲nba直播

相關(guān)閱讀

季中轉(zhuǎn)會期就剩最后一周！5月5號后BLG只能從自由人二隊里面補強

不敵WBG,，iG發(fā)布返圖：希望這場警鐘能變奏成此后凱歌的序曲

泡泡瑪特港股大漲超10%創(chuàng)股價歷史新高,，總市值2593億港元

官方公布LPL第四周最佳陣容：369、Kanavi,、Scout,、Taeyoon、ON

LPL官方主持阿芙曬照：微博哥真猛哇！??！

報道稱蘋果將推出20周年紀念版iPhone：折疊款+全面屏，2027發(fā)布

KPL女主持人靈兒曬照：這肩膀好白,！

當教練這點責任不敢擔朱開：教練要起到表率作用,！應該主動攬責

看不懂Bsyy：Daeny的BP我也滿頭問號他肯定是有帶隊的能力的

爆料人談Uzi停播：傳統(tǒng)直播平臺賺不到大錢，月收20w+就算頭部

熱門標簽

熱門錄像

查看全部>

04月29日NBA季后賽西部首輪G4火箭勇士全場錄像

04月28日NBA季后賽東部首輪G4凱爾特人魔術(shù)全場錄像

04月26日NBA季后賽西部首輪G3湖人森林狼全場錄像

04月26日NBA季后賽東部首輪G3步行者雄鹿全場錄像

04月25日NBA季后賽東部首輪G3尼克斯活塞全場錄像

04月23日NBA季后賽西部首輪G2森林狼湖人全場錄像

04月22日NBA季后賽西部首輪G2快船掘金全場錄像

04月21日CBA季后賽14決賽G4北控北京全場錄像

04月21日NBA季后賽東部首輪G1熱火騎士全場錄像

04月19日NBA附加賽6獨行俠灰熊全場錄像

DeepSeek被稱為AI界拼多多,，訓練2個月僅花費了557.6萬美元,！

相關(guān)閱讀

熱門標簽

熱門新聞