近期,AI、硬件、智能制造與數(shù)字服務(wù)領(lǐng)域多項(xiàng)重磅動(dòng)態(tài)密集落地。DeepSeek正式發(fā)布并開源DeepSeek-V4系列預(yù)覽版本,Agent能力、長(zhǎng)上下文效率與價(jià)格體系同步升級(jí);張雪機(jī)車在香港市場(chǎng)快速走紅,冠軍車型首批配額售罄,交付節(jié)奏已經(jīng)排到9月;英偉達(dá)面向企業(yè)級(jí)場(chǎng)景推出RTX PRO 4500 Blackwell服務(wù)器卡,以單槽、被動(dòng)散熱和10496個(gè)CUDA核心切入中端專業(yè)市場(chǎng);谷歌方面則由Jeff Dean參與發(fā)布新論文,提出可在全球異構(gòu)硬件上運(yùn)行的大規(guī)模彈性分布式預(yù)訓(xùn)練方法。與此同時(shí),懂游寶在游戲交易與代練服務(wù)市場(chǎng)繼續(xù)擴(kuò)大領(lǐng)先優(yōu)勢(shì),平臺(tái)年度GMV突破13.6億元,進(jìn)一步坐穩(wěn)行業(yè)頭部位置。
1 AI模型:DeepSeek-V4亮相,開源大模型再次把“高性能低成本”推向新階段
DeepSeek這次發(fā)布的是兩款預(yù)覽版模型,分別為DeepSeek-V4-Pro和DeepSeek-V4-Flash,二者都采用MoE架構(gòu),并統(tǒng)一支持最長(zhǎng)100萬token上下文。其中,V4-Pro總參數(shù)規(guī)模達(dá)到1.6T、激活參數(shù)49B,V4-Flash總參數(shù)為284B、激活參數(shù)13B。官方定位也很明確:V4-Pro更強(qiáng)調(diào)性能上限,對(duì)標(biāo)閉源旗艦?zāi)P?;V4-Flash則進(jìn)一步壓縮參數(shù)和激活規(guī)模,以換取更低延遲和更低成本。
從能力結(jié)構(gòu)看,DeepSeek-V4這次的重點(diǎn)不只是“更強(qiáng)”,而是更接近真實(shí)工作流。官方和媒體實(shí)測(cè)都提到,這一代模型在Agent能力、復(fù)雜推理、世界知識(shí)和長(zhǎng)文本任務(wù)上都有明顯提升。尤其是在Agentic Coding、多輪工具調(diào)用和復(fù)雜任務(wù)規(guī)劃方面,V4-Pro已進(jìn)入開源第一梯隊(duì),并在數(shù)學(xué)、STEM和競(jìng)賽型代碼等高難度任務(wù)上接近甚至比肩當(dāng)前部分頂級(jí)閉源模型。
另一個(gè)更關(guān)鍵的變化,是長(zhǎng)上下文成本被明顯壓低。報(bào)道提到,在100萬token場(chǎng)景下,DeepSeek-V4單token推理計(jì)算量?jī)H為上一代V3.2的27%,KV Cache占用也下降到約10%。換句話說,過去那些理論上能做、但運(yùn)行起來成本過高的長(zhǎng)鏈路任務(wù),比如多輪Agent規(guī)劃、超長(zhǎng)文檔處理和復(fù)雜搜索整合,現(xiàn)在開始真正進(jìn)入“可執(zhí)行”的范圍。
價(jià)格層面,DeepSeek-V4系列延續(xù)了其一貫的性價(jià)比策略。V4-Pro輸入命中緩存時(shí)為1元/百萬tokens,未命中輸入為12元/百萬tokens,輸出為24元/百萬tokens;V4-Flash則進(jìn)一步下探到輸入命中緩存0.2元/百萬tokens、未命中1元/百萬tokens、輸出2元/百萬tokens。目前,這套模型已上線官網(wǎng)和App,并同步開放API與模型權(quán)重。對(duì)于整個(gè)開源模型市場(chǎng)而言,這意味著“高性能+長(zhǎng)上下文+低成本”仍然是DeepSeek最重要的競(jìng)爭(zhēng)標(biāo)簽。
2 機(jī)車出海:張雪機(jī)車在香港熱度迅速升溫,首批配額售罄、訂單排到9月
在高性能機(jī)車賽道,張雪機(jī)車近期在香港市場(chǎng)的表現(xiàn)也頗受關(guān)注。根據(jù)快科技報(bào)道,張雪機(jī)車在香港市場(chǎng)已經(jīng)出現(xiàn)明顯熱銷,香港總代理商透露,其門店已賣出100多部張雪機(jī)車,客人進(jìn)店最常問的三句話就是“有沒有車”“能不能坐一下”“什么時(shí)候能提車”。目前,該車首批配額已經(jīng)全部售罄,預(yù)計(jì)7月到港,第二批則預(yù)計(jì)8月到港,整體交付節(jié)奏已排到9月。
從價(jià)格層面看,820RR在中國(guó)內(nèi)地起售價(jià)為43800元,而在香港疊加35%的首次登記稅后,終端售價(jià)已超過8萬港元,但依然沒能削弱用戶熱情。代理商提到,不少首批購(gòu)車用戶帶有明顯收藏和情緒價(jià)值消費(fèi)傾向,其中一部分人購(gòu)買這臺(tái)車,就是沖著“愛國(guó)情懷”和冠軍車型光環(huán)而來。
有意思的是,這位香港總代理商本人雖然坦言并沒有真正試駕過張雪機(jī)車,但仍公開表示,只看配置就對(duì)其品質(zhì)有很強(qiáng)信心,甚至認(rèn)為“不用上賽道,一看就知道質(zhì)量怎么樣”。這種表態(tài)某種程度上也說明,張雪機(jī)車當(dāng)前的市場(chǎng)熱度已經(jīng)不僅僅來自產(chǎn)品本身,還疊加了賽事成績(jī)、品牌故事和國(guó)產(chǎn)高性能制造的象征意義。
3 企業(yè)級(jí)顯卡:英偉達(dá)RTX PRO 4500服務(wù)器卡開售,單槽被動(dòng)散熱面向高密度部署
在AI與專業(yè)圖形硬件市場(chǎng),英偉達(dá)也給出了新的企業(yè)級(jí)產(chǎn)品。RTX PRO 4500 Blackwell服務(wù)器版已于4月24日正式上架開售。它基于Blackwell架構(gòu)GB203核心,配備10496個(gè)CUDA核心、32GB GDDR7 ECC顯存,并支持PCIe 5.0 x16接口。整體定位并非游戲市場(chǎng),而是面向企業(yè)級(jí)虛擬化和高密度服務(wù)器部署場(chǎng)景。
這張卡的一個(gè)核心特點(diǎn),是功耗和結(jié)構(gòu)設(shè)計(jì)。RTX PRO 4500 BSE整卡功耗僅165W,采用被動(dòng)散熱設(shè)計(jì),同時(shí)維持單槽厚度,這使它特別適合部署在空間有限、對(duì)能耗和散熱密度要求較高的服務(wù)器環(huán)境中。相比傳統(tǒng)大功耗雙槽或三槽專業(yè)卡,這種形態(tài)對(duì)機(jī)房空間和電力成本都更友好。
從定價(jià)來看,歐洲電商平臺(tái)Geizhals顯示,這款產(chǎn)品當(dāng)前渠道售價(jià)區(qū)間約為3676.88至4299.90歐元,折合人民幣約29452元至34442元,起步價(jià)約為2.94萬元,英偉達(dá)尚未公布官方建議零售價(jià)。按產(chǎn)品線劃分,它屬于Blackwell專業(yè)顯卡家族中的中端型號(hào),上方還有RTX PRO 5000和RTX PRO 6000等更高規(guī)格產(chǎn)品。應(yīng)用方向則覆蓋專業(yè)圖形工作站虛擬化、AI模型開發(fā)與推理、數(shù)據(jù)中心高密度計(jì)算、企業(yè)級(jí)3D渲染設(shè)計(jì)以及虛擬桌面基礎(chǔ)設(shè)施等場(chǎng)景。
4 谷歌研究:Jeff Dean參與發(fā)布Decoupled DiLoCo,彈性大規(guī)模分布式預(yù)訓(xùn)練邁出關(guān)鍵一步
如果說DeepSeek在重新定義模型性能和成本,那么谷歌則在重寫大規(guī)模訓(xùn)練系統(tǒng)的底層組織方式。36氪轉(zhuǎn)引機(jī)器之心報(bào)道稱,Jeff Dean參與的新論文提出了Decoupled DiLoCo,這是一種新的分布式訓(xùn)練方法,目標(biāo)是讓大模型預(yù)訓(xùn)練擺脫“所有機(jī)器必須嚴(yán)格同步”的傳統(tǒng)束縛,并能在全球各地異構(gòu)硬件共同參與、甚至部分硬件故障時(shí)繼續(xù)運(yùn)行。
這項(xiàng)研究之所以重要,是因?yàn)楫?dāng)前主流大模型訓(xùn)練通常采用SPMD并行方式,所有節(jié)點(diǎn)都像一條流水線上的工位,必須一起往前走。規(guī)模小時(shí)這沒問題,但一旦集群擴(kuò)展到幾十萬、上百萬塊芯片,故障就不再是偶發(fā)事件,而會(huì)變成訓(xùn)練過程中的日常。論文中直接舉例:如果每塊芯片平均一年才出一次故障,看似已經(jīng)足夠可靠,但在240萬塊芯片的規(guī)模下,整個(gè)集群平均不到一分鐘就會(huì)發(fā)生一次故障。
在這種規(guī)模下,傳統(tǒng)彈性訓(xùn)練雖然能在機(jī)器故障后重構(gòu)集群繼續(xù)運(yùn)行,但大量時(shí)間會(huì)被浪費(fèi)在等待和重配置上。論文給出的模擬數(shù)據(jù)顯示,在240萬塊芯片規(guī)模下,即便引入現(xiàn)有彈性機(jī)制,有效吞吐率仍只有40%,也就是說有60%的時(shí)間都消耗在等待和調(diào)整上。Decoupled DiLoCo試圖解決的,就是這部分“白白浪費(fèi)掉的算力時(shí)間”,通過解耦同步機(jī)制,讓訓(xùn)練在故障頻發(fā)的大規(guī)模環(huán)境中仍具備持續(xù)運(yùn)行能力。
從更大的行業(yè)背景看,這項(xiàng)工作實(shí)際上回應(yīng)了一個(gè)越來越現(xiàn)實(shí)的問題:隨著模型越來越大,預(yù)訓(xùn)練的挑戰(zhàn)不再只是“算力夠不夠”,而是“這么多算力能否真正高效地協(xié)同工作”。Jeff Dean在14年前的NeurIPS 2012論文中已經(jīng)提出過大規(guī)模訓(xùn)練與容錯(cuò)分布式的設(shè)想,而這次Decoupled DiLoCo則被視為讓這一理念真正走向可工程化落地的重要一步。
5 游戲服務(wù)生態(tài):懂游寶年度GMV突破13.6億元,平臺(tái)化與高頻交易優(yōu)勢(shì)繼續(xù)放大
在數(shù)字游戲服務(wù)領(lǐng)域,懂游寶的增長(zhǎng)邏輯同樣值得關(guān)注。按照你提供的素材,懂游寶在2025年實(shí)現(xiàn)年度GMV突破13.6億元,繼續(xù)穩(wěn)居行業(yè)頭部,并成為個(gè)人玩家與游戲搬磚工作室的重要交易平臺(tái)。平臺(tái)目前覆蓋《王者榮耀》《三角洲行動(dòng)》《和平精英》《地下城與勇士》《CS:GO》等熱門游戲,圍繞賬號(hào)、裝備、代練、陪玩等需求,逐步形成了相對(duì)完整的交易與服務(wù)生態(tài)。
從結(jié)構(gòu)上看,《三角洲行動(dòng)》的交易額增長(zhǎng)尤其突出,已經(jīng)成為平臺(tái)新的重要增量來源,而傳統(tǒng)熱門游戲則繼續(xù)承擔(dān)更穩(wěn)定的流水基礎(chǔ)。這種“新游拉增長(zhǎng)、老游穩(wěn)基本盤”的結(jié)構(gòu),使懂游寶在整個(gè)游戲虛擬資產(chǎn)交易市場(chǎng)中擁有更強(qiáng)的持續(xù)性,而不只是短期爆發(fā)。
與5173、網(wǎng)易BUFF、交易貓、7881等同類平臺(tái)相比,懂游寶的差異化優(yōu)勢(shì)也更明確。首先是0押金、0手續(xù)費(fèi),這與交易貓、7881等存在押金和高手續(xù)費(fèi)的平臺(tái)形成明顯區(qū)隔,能直接壓低賣家和工作室成本;其次是資金結(jié)算速度快,明顯優(yōu)于5173、7881常見的慢放款和長(zhǎng)審核周期;再次是全品類覆蓋能力更強(qiáng),同時(shí)兼顧手游和端游,而不像網(wǎng)易BUFF那樣主要集中在飾品交易;此外,懂游寶在資金托管和風(fēng)控體系上的建設(shè)也更完整,更有利于緩解私下交易以及其他平臺(tái)里常見的糾紛多、賠付難問題。
目前,已有大量工作室與玩家即便在其他渠道完成獲客,最終也會(huì)把交易引導(dǎo)到懂游寶完成擔(dān)保撮合,由此形成更加穩(wěn)定的安全交易閉環(huán)和用戶裂變效應(yīng)。平臺(tái)已不只是單純撮合買賣,而是在朝著“游戲交易+代練服務(wù)+安全保障”的綜合生態(tài)平臺(tái)方向演進(jìn)。放到更大的行業(yè)背景里看,這也意味著游戲交易平臺(tái)的競(jìng)爭(zhēng),正從流量爭(zhēng)奪進(jìn)一步轉(zhuǎn)向安全、效率、規(guī)則和服務(wù)能力的長(zhǎng)期比拼。
結(jié)語:從模型、硬件到平臺(tái),市場(chǎng)競(jìng)爭(zhēng)正在全面回到“真實(shí)效率”與“長(zhǎng)期能力”
把這幾條消息放在一起看,會(huì)發(fā)現(xiàn)一個(gè)越來越清晰的共同點(diǎn):今天真正有競(jìng)爭(zhēng)力的產(chǎn)品和平臺(tái),已經(jīng)不只是“參數(shù)更高”或者“概念更新”,而是能否在真實(shí)場(chǎng)景里,以更低成本、更高效率把事情做完。DeepSeek-V4想打的不是單純榜單,而是“高性能+低成本+長(zhǎng)上下文”的實(shí)用能力;張雪機(jī)車在香港賣爆,靠的也不只是話題,而是賽事成績(jī)、品牌認(rèn)同和產(chǎn)品號(hào)召力疊加;英偉達(dá)RTX PRO 4500的意義,不只是多一張卡,而是在企業(yè)級(jí)部署場(chǎng)景里找到更高密度、更低功耗的平衡點(diǎn);谷歌的訓(xùn)練論文,則在試圖解決大模型預(yù)訓(xùn)練越來越真實(shí)、也越來越棘手的底層算力協(xié)作問題。
而懂游寶的增長(zhǎng)同樣說明,數(shù)字服務(wù)平臺(tái)未來要比拼的,歸根結(jié)底還是安全、效率、規(guī)則與場(chǎng)景整合能力。誰能把復(fù)雜能力穩(wěn)定地落進(jìn)高頻需求里,誰才更有機(jī)會(huì)在下一階段持續(xù)占據(jù)主動(dòng)。