DeepSeek“鲇魚效應” 2025年大模型價格戰(zhàn)或將持續(xù)

lulan 2025-03-04 新聞 60 次瀏覽 0個評論

本報記者曲忠芳北京報道

“性價比”是商業(yè)社會中的制勝法寶之一，從消費電子到零售服務，從傳統(tǒng)制造業(yè)到互聯(lián)網(wǎng)經濟，高性價比在撬動市場、贏得用戶方面屢試不爽。而如今，在“規(guī)模法則”（Scaling Law）主導下、“大力出奇跡”的大模型“燒錢”競賽中，來自中國杭州的大模型初創(chuàng)企業(yè)深度求索（DeepSeek）憑借高性價比迅速出圈，被冠以“AI界的拼多多”稱號，吸引了國內外的廣泛關注。

截至1月10日，深度求索的最新大模型產品DeepSeek V3已發(fā)布并開源半個月之久，如同“鲇魚”般給原本卡在“瓶頸”中的全球大模型市場注入了新的活力，《》記者通過采訪業(yè)內人士，希望深度探討DeepSeek這條“鲇魚”將攪起市場的哪些變化。

“AI界的拼多多”驗證新思路？

DeepSeek被冠以“AI界的拼多多”稱號，主要是因為它極高的性價比，與拼多多在電商領域以高性價比著稱的模式相似。有趣的是，在DeepSeek V3生成的“自我介紹”中也使用了這一稱謂。

深度求索公司創(chuàng)立于2023年7月，是由中國量化私募公司“幻方量化”創(chuàng)始人梁文峰創(chuàng)立，2024年5月推出了第二代開源模型DeepSeek V2，到2024年12月26日又推出最新的開源模型DeepSeek V3。DeepSeek官網(wǎng)顯示，在多項基準測試——涵蓋英語、中文、數(shù)學、代碼等結果中，DeepSeek V3的成績超過了阿里的千問“Qwen2.5-72B”、Meta公司的Llama3.1-405B等開源模型，而且與OpenAI的GPT-4o、Anthropic公司的Claude3.5-Sonnet兩大閉源模型的表現(xiàn)也不相上下。更為重要的是，DeepSeek方面披露，其訓練成本僅為557.6萬美元和2000塊英偉達H800 GPU（圖形處理器）。

與之形成鮮明對比的是，據(jù)斯坦福大學HAI研究院發(fā)布的《2024年人工智能指數(shù)報告》預估，OpenAI于2023年3月發(fā)布的GPT-4模型訓練成本約在7800萬美元，同年發(fā)布的谷歌Gemini Ultra的計算成本花費預估為1.91億美元。據(jù)Meta官方信息，2024年7月面世的開源模型Llama3.1-405B，訓練使用了1.6萬塊英偉達H100 GPU。超級富豪埃隆·馬斯克同樣曾在2024年7月宣布建立孟菲斯超級AI集群，使用10萬個英偉達 H100 GPU。另據(jù)美國媒體報道，GPT-4o的訓練成本約在1億美元，GPU數(shù)量預計在萬個級別；而Claude3.5-Sonnet的訓練成本或略低于1億美元，使用的GPU數(shù)量推測為數(shù)千至上萬個。從這些直觀的數(shù)據(jù)對比中不難看出，DeepSeek大幅度降低了模型訓練和推理成本。

關于DeepSeek如何實現(xiàn)高性價比的問題，本報記者咨詢了數(shù)名來自高校、企業(yè)的技術專家，他們做出了一些專業(yè)技術方面的解釋，涉及多頭潛在注意力機制（MLA架構）、稀疏專家混合模型（MoE）架構、FP8混合精度訓練、數(shù)據(jù)蒸餾與算法優(yōu)化等。簡單來說，DeepSeek沒有“堆砌算力”，而是在算力限制下轉而探索效率優(yōu)先的途徑。

“DeepSeek V3出現(xiàn)后，對于一些中小型團隊來說是有利的?！币晃粯I(yè)內人士如是說道。近兩年來，規(guī)模法則被視為大模型發(fā)展的黃金定律，大模型的性能指數(shù)與模型參數(shù)、數(shù)據(jù)量、算力的增加正相關，因此全球范圍內呈現(xiàn)一場“大力出奇跡”的競賽。然而，隨著模型規(guī)模的不斷膨脹，規(guī)模法則的邊際效益逐漸遞減。一方面，超大規(guī)模模型的訓練成本高昂，算力需求呈幾何級數(shù)增長；另一方面，數(shù)據(jù)質量和模型架構的優(yōu)化空間有限，導致性能提升逐漸趨緩。在這種趨勢下，大模型日漸成為巨頭與資本的游戲，直到DeepSeek驗證了大模型性能提升的新思路。

深度科技研究院院長張孝榮指出，DeepSeek的“出圈”是對其在大模型技術上的突破和創(chuàng)新的認可，其通過優(yōu)化算法和工程實踐，實現(xiàn)了高性能與低成本的平衡，為大模型的發(fā)展提供了新的思路和可能性，降低了大模型對先進算力的依賴程度。DeepSeek為整個行業(yè)的發(fā)展注入了活力，也對大模型的技術路徑和工程實踐產生了積極影響，推動了高效訓練、輕量化模型和工程優(yōu)化。

價格戰(zhàn)或持續(xù)，AI加速普惠落地

“DeepSeek加速了AI和大數(shù)據(jù)技術的普及，有望使更多企業(yè)和開發(fā)者能夠接觸并應用這些技術。同時，也迫使競爭對手重新評估定價，這可能引發(fā)行業(yè)內的價格戰(zhàn)，推動整體價格下降，使更多企業(yè)能夠采用先進技術?！睆埿s說道。

事實上，早在DeepSeek V2發(fā)布開源之時，深度求索這條“鲇魚”引發(fā)了2024年國產大模型的第一波降價熱潮，參與其中的包括智譜AI等大模型初創(chuàng)公司以及字節(jié)跳動、阿里巴巴、百度、騰訊等科技大廠。其中，智譜AI公司CEO張鵬此前接受本報記者采訪時回應稱，降價并非出于市場壓力，而是因為技術的進步帶來了成本的降低，由此讓利給用戶，同時也是為了更好地拓展市場。深度求索創(chuàng)始人梁文峰在接受媒體記者采訪時也表示：“我們不是有意成為一條‘鲇魚’，只是不小心成了一條‘鲇魚’。我們只是按照自己的步調來做事，然后核算成本定價。原則是不貼錢，也不賺取暴利，在成本之上稍微有點利潤?！?/p>

到了2024年年底，即在DeepSeek V3發(fā)布前后，國產大模型在2024年的第二波降價潮再起。2024年12月中旬，字節(jié)跳動旗下豆包大模型率先更新價格，豆包視覺理解模型的輸入價格為0.003元/千tokens，相比行業(yè)平均價格降低了85%。按照這一價格，1元錢可以處理284張720ppi的圖片。抖音集團副總裁李亮稱，此次降價不是“價格戰(zhàn)”，而是豆包大模型在算法、軟件工程和硬件方案上進行了大量優(yōu)化，有效降低了成本，目前的定價仍能保持可觀的毛利。而DeepSeek官方信息顯示，最新的DeepSeek V3輸入價格為0.5元/百萬tokens，輸出價格最低為8元/百萬tokens，遠低于Claude3.5-Sonnet、GPT-4o等。

在海外社交媒體中，DeepSeek的高性價比已引起了大模型競爭對手的高度關注，而在國內市場，記者從多位消息人士處了解到，國產大模型廠商也在密切關注DeepSeek的訓練方案，盡管還沒有公開的動作，但一個行業(yè)性的共識在于，算力堆砌或許仍能“大力出奇跡”，但同時在數(shù)據(jù)質量、訓練模式、架構優(yōu)化方面仍有可挖掘的創(chuàng)新空間，大模型正在加速朝著普惠落地的方向前進。

謙詢智庫創(chuàng)始合伙人龔斌指出，其他大模型廠商或許會通過技術追趕和資源投入快速跟進，不排除復制甚至超越DeepSeek高性價比優(yōu)勢的可能性，DeepSeek能否持續(xù)建立起優(yōu)勢壁壘還有待觀瞻。另有業(yè)內人士提到，DeepSeek開發(fā)過程中利用已有的模型進行訓練，也存在一些漏洞。

除此之外，學術委員、DCCI-未來智庫與FutureLabs-未來實驗室首席專家胡延平發(fā)文提醒道，盡管DeepSeek V3在效率和性能上表現(xiàn)出色，但“不宜過高評價”其創(chuàng)新性。在他看來，該模型的成功主要依賴于已有技術的有效整合，如合成數(shù)據(jù)、知識蒸餾等，而缺乏底層原理的創(chuàng)新，呈現(xiàn)的是“又一次是我們一直最擅長的性價比”?！癉eepSeek V3能不能持續(xù)有流量不太好說?！?/font>

關于AI大模型未來價格的進一步下降、商業(yè)化應用，以及深度求索公司后續(xù)的發(fā)展，本報記者將持續(xù)關注報道。

（編輯：吳清審核：李正豪校對：顏京寧）

轉載請注明來自浙江中液機械設備有限公司 ，本文標題：《DeepSeek“鲇魚效應” 2025年大模型價格戰(zhàn)或將持續(xù)》

lulan 403篇文章站點微博

每一天，每一秒，你所做的決定都會改變你的人生！

發(fā)表評論取消回復

評論列表（暫無評論，60人圍觀）參與討論

還沒有評論，來說兩句吧...

? 2025年4月 ?
一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

super_admin管理員

最新文章

文章歸檔

網(wǎng)站收藏

DeepSeek“鲇魚效應” 2025年大模型價格戰(zhàn)或將持續(xù)

發(fā)表評論取消回復

還沒有評論，來說兩句吧...

最近發(fā)表

友情鏈接

文章目錄

super_admin管理員

最新文章

文章歸檔

網(wǎng)站收藏

DeepSeek“鲇魚效應” 2025年大模型價格戰(zhàn)或將持續(xù)

石家莊賓馳招聘信息最新，石家莊賓馳最新招聘信息通知

勝南廠房出租最新信息，專業(yè)解讀與全面指南，勝南廠房出租最新信息解讀與租賃指南

長青創(chuàng)客最新招聘信息，長青創(chuàng)客招聘啟事

上海確診最新消息詳情，全面解讀與應對建議，上海最新確診病例詳解，全面解讀及應對建議

最新的太空站視頻解說，最新太空站視頻解說，探索宇宙的新篇章

武漢開料工最新招聘，武漢開料工職位火熱招聘中

今天疫情的最新信息，成安縣疫情防控形勢分析，成安縣疫情最新信息及防控形勢分析報告

全站最新消息新聞，揭示科技前沿，引領時代潮流，科技前沿揭秘，引領時代潮流的最新消息新聞站

79456濠江論壇2024年147期資料_揭秘,警惕虛假宣傳-浙江中液機械設備有限公司

香港特馬資料王中王_揭秘,警惕虛假宣傳-浙江中液機械設備有限公司

新澳門天天開好彩大全生日_揭秘,警惕虛假宣傳-浙江中液機械設備有限公司

22324濠江論壇一肖一碼_揭秘,警惕虛假宣傳-浙江中液機械設備有限公司

新澳天天開獎資料大全正版_揭秘,警惕虛假宣傳-浙江中液機械設備有限公司

2025新奧一碼一肖一特_揭秘,警惕虛假宣傳-浙江中液機械設備有限公司

2024新澳門正版免費_揭秘,警惕虛假宣傳-浙江中液機械設備有限公司

澳門一碼一肖一待一中今晚一_揭秘,警惕虛假宣傳-浙江中液機械設備有限公司

發(fā)表評論取消回復

還沒有評論，來說兩句吧...

最近發(fā)表

友情鏈接

文章目錄

石家莊賓馳招聘信息最新，石家莊賓馳最新招聘信息通知

勝南廠房出租最新信息，專業(yè)解讀與全面指南，勝南廠房出租最新信息解讀與租賃指南

長青創(chuàng)客最新招聘信息，長青創(chuàng)客招聘啟事

上海確診最新消息詳情，全面解讀與應對建議，上海最新確診病例詳解，全面解讀及應對建議

最新的太空站視頻解說，最新太空站視頻解說，探索宇宙的新篇章

武漢開料工最新招聘，武漢開料工職位火熱招聘中

今天疫情的最新信息，成安縣疫情防控形勢分析，成安縣疫情最新信息及防控形勢分析報告

全站最新消息新聞，揭示科技前沿，引領時代潮流，科技前沿揭秘，引領時代潮流的最新消息新聞站

還沒有評論，來說兩句吧...