DeepSeek官網(wǎng)顯示,2月9日,DeepSeek-V3 API服務(wù)的45天優(yōu)惠價(jià)格體驗(yàn)期已結(jié)束,從2月9日開始將調(diào)整為新的價(jià)格:每百萬輸入tokens 0.5元(緩存命中)/2元(緩存未命中),每百萬輸出tokens 8元。
在優(yōu)惠期,DeepSeek-V3的輸入token費(fèi)用在緩存命中的情況下是每百萬0.1元,緩存未命中時(shí)為每百萬1元;輸出token的費(fèi)用則是每百萬2元。
而在2月9日價(jià)格調(diào)整后,輸入token費(fèi)用統(tǒng)一變?yōu)槊堪偃f2元,不管緩存是否命中;緩存未命中時(shí)的價(jià)格翻倍,漲幅為100%;輸出token費(fèi)用漲至每百萬8元,漲幅為300%。
據(jù)報(bào)道,有分析稱,優(yōu)惠體驗(yàn)期是一種常見的市場(chǎng)推廣策略,在優(yōu)惠期內(nèi)吸引了大量用戶嘗試和使用DeepSeek-V3的API服務(wù),積累了用戶基礎(chǔ)和市場(chǎng)口碑。現(xiàn)在優(yōu)惠期滿,API價(jià)格如期恢復(fù)上調(diào)。
專家分析,DeepSeek提價(jià)之后,公有云價(jià)格競(jìng)爭(zhēng)壓力減小,同時(shí)API性價(jià)比下降后利好企業(yè)本地化部署。由于DeepSeek-V3優(yōu)惠期價(jià)格相較云廠商具有極高的性價(jià)比,價(jià)格恢復(fù)后云廠商價(jià)格競(jìng)爭(zhēng)壓力顯著下降。此外,由于API價(jià)格相較優(yōu)惠期上調(diào)2~4倍不等,部分企業(yè)或更傾向于選擇本地化部署,利好企業(yè)側(cè)算力需求與容災(zāi)備份需求。
成本降低打開的市場(chǎng)空間
據(jù)報(bào)道,伴隨DeepSeek爆火而來的,是業(yè)內(nèi)對(duì)其技術(shù)路線的研究和探討,以及由于成本降低打開的巨大市場(chǎng)空間。
Meta首席執(zhí)行官馬克·扎克伯格(Mark Zuckerberg)指出,開源在一開始并不占據(jù)很高優(yōu)勢(shì),向外界開放可以更大程度推動(dòng)產(chǎn)業(yè)鏈標(biāo)準(zhǔn)化,由此拉動(dòng)產(chǎn)業(yè)鏈共同參與推動(dòng)降低成本、優(yōu)化能力?!皝碜灾袊?guó)的新競(jìng)爭(zhēng)對(duì)手DeepSeek,我認(rèn)為他們顯示出,即將有一個(gè)全球化的開源標(biāo)準(zhǔn)——這是我們正在談?wù)摰氖虑橹??!?/p>
亞馬遜首席執(zhí)行官Andy Jassy指出,“我們秉持一種信念,即幾乎所有大型生成式人工智能應(yīng)用都會(huì)使用多種模型類型,而且不同客戶會(huì)針對(duì)不同類型的工作負(fù)載使用不同模型,那么你就要盡可能多地提供前沿模型讓客戶選擇。我們正通過Amazon Bedrock這類服務(wù)來實(shí)現(xiàn)。這就是為什么我們迅速行動(dòng),確保DeepSeek模型能在Bedrock和SageMaker平臺(tái)上使用?!?/p>
Arm首席執(zhí)行官Rene Haas指出,DeepSeek無論是V3還是R1模型,都是基于行業(yè)前沿模型的基礎(chǔ)上,進(jìn)行了大量創(chuàng)意性工作來搭建,由此讓推理更為高效。“實(shí)話說我認(rèn)為很棒?!彼m(xù)稱,因?yàn)檫@將推動(dòng)行業(yè)發(fā)展走向更為高效,降低成本從而可以更好擴(kuò)大整體計(jì)算需求。
谷歌首席執(zhí)行官Sundar Pichai也認(rèn)為,DeepSeek是一個(gè)了不起的團(tuán)隊(duì),“回顧過去三年來的發(fā)展,會(huì)發(fā)現(xiàn)用于AI推理的支出比例相比AI訓(xùn)練一直在增加。這是件好事,因?yàn)橥评盹@然可以支持企業(yè)獲得良好的投資回報(bào)率(即加速推動(dòng)應(yīng)用落地)。”
他指出,推理使用成本將不斷下降,使更多用例變得可行,“機(jī)會(huì)空間要多大就有多大(as big as it comes),這就是為什么我們?cè)诔掷m(xù)投資以期迎接這一時(shí)刻?!?/p>
AI投資的走向
AI在推理側(cè)的需求在快速發(fā)展早已是事實(shí),只是DeepSeek用更低成本實(shí)現(xiàn)。乍一看來,與財(cái)報(bào)季前后美股科技巨頭動(dòng)輒提出數(shù)百億美元的AI投入顯得差異巨大。
在業(yè)績(jī)會(huì)期間,關(guān)于AI投資的走向就備受關(guān)注。綜合來看,巨頭們?nèi)匀粓?jiān)持對(duì)AI基礎(chǔ)設(shè)施的投資,也強(qiáng)調(diào)了對(duì)推理側(cè)投資力度的價(jià)值——即面向應(yīng)用領(lǐng)域探索的投資重要性不容忽視。
亞馬遜首席執(zhí)行官Andy Jassy仔細(xì)分析道,過去幾周里,人們會(huì)做出一種假設(shè):如果能夠降低AI投資中任何一種技術(shù)組件的成本——主要指推理成本——就可以減少在技術(shù)方面的總體支出。
“但實(shí)際情況并非如此,我們?cè)谠朴?jì)算領(lǐng)域經(jīng)歷過類似情形。”他指出,在2006年推出亞馬遜云服務(wù)(AWS)時(shí),提供的S3存儲(chǔ)服務(wù)價(jià)格是每千兆字節(jié)15美分、計(jì)算服務(wù)每小時(shí)10美分,當(dāng)然現(xiàn)在價(jià)格已經(jīng)低得多。
“隨著技術(shù)發(fā)展,人們?cè)J(rèn)為企業(yè)在基礎(chǔ)設(shè)施技術(shù)上的支出會(huì)大幅減少。但實(shí)際情況是,企業(yè)在每單位基礎(chǔ)設(shè)施上的花費(fèi)確實(shí)會(huì)大幅降低,但隨后,他們會(huì)對(duì)之前因成本過高而從未嘗試的新項(xiàng)目產(chǎn)生興趣,想著還能搭建些什么,最終往往總體支出會(huì)大幅增加?!彼仓赋觯w看,推理成本將顯著降低,這對(duì)客戶和公司業(yè)務(wù)都將是積極影響。
Meta首席財(cái)務(wù)官Susan Li也表示,公司仍然致力于針對(duì)AI訓(xùn)練和推理進(jìn)行基礎(chǔ)設(shè)施相關(guān)投資?!耙?yàn)槟壳斑€不十分明晰我們到底需要什么,例如不知道我們的推理用途到底有多廣泛——這是我們競(jìng)爭(zhēng)優(yōu)勢(shì)的真正來源。所以,我們也很興奮,因?yàn)槿杂锌臻g在推進(jìn)更有效地運(yùn)行這些工作負(fù)載。”
她重申,當(dāng)前正處于AI資本支出的早期階段,還無法完全確定未來整體格局將如何演變。有資格談?wù)摰氖?,GenAI將有許多全新、更簡(jiǎn)單的方法,來豐富生態(tài)系統(tǒng),這顯然對(duì)應(yīng)用程序家族(the Family of Apps)的體驗(yàn)有很大幫助。
“我仍然認(rèn)為,隨著時(shí)間的推移,從服務(wù)質(zhì)量和服務(wù)規(guī)模角度看,大力投資資本支出和基礎(chǔ)設(shè)施將是一個(gè)戰(zhàn)略優(yōu)勢(shì)?!盨usan Li說道。
根據(jù)Meta拆解,2025年針對(duì)AI基礎(chǔ)設(shè)施的投入主要涵蓋三方面:其中大部分將用于GPU部署,此外對(duì)構(gòu)建更高容量的網(wǎng)絡(luò)能力、光傳輸能力等也將持續(xù)。
“我認(rèn)為現(xiàn)在確定長(zhǎng)期資本密度還為時(shí)過早。因?yàn)橐紤]的因素很多,包括底層模型的進(jìn)步速度、效率;Gen AI產(chǎn)品的用例方向;一代硬件創(chuàng)新帶來了哪些性能和效率提升等?!盨usan Li表示。
可以從一個(gè)案例對(duì)此進(jìn)行解讀。關(guān)于AI/MR眼鏡品類,多家硅谷大廠其實(shí)已經(jīng)投入多年。即便根據(jù)Meta最新財(cái)報(bào),其Reality Labs(虛擬現(xiàn)實(shí)實(shí)驗(yàn)室)仍然巨虧50億美元,但近兩年來在該領(lǐng)域風(fēng)靡全球,甚至帶火AI終端發(fā)展新一輪周期的產(chǎn)品,Quest系列和Ray-Ban Meta也都出自其手。由此不能忽視在AI應(yīng)用探索過程中需要投入的前期成本。
從一個(gè)行業(yè)的正常發(fā)展邏輯來說,先行者往往會(huì)需要投入更多進(jìn)行摸索,導(dǎo)致后來者在成本方面會(huì)有一些優(yōu)勢(shì)。只是DeepSeek的出現(xiàn)讓這種差異對(duì)比明顯,但并不能由此就認(rèn)為巨頭們對(duì)AI的投資就完全屬于“浪費(fèi)”,只是可能會(huì)存在一些可及性和有效性的問題。(來源:21世紀(jì)經(jīng)濟(jì)報(bào)道)