AGI 被賦予太多期待。在企業(yè)數(shù)字化的敘事里,它常被描繪為終極解方:自動運(yùn)維、自主決策、無人干預(yù)。但若剝離修辭,回到邏輯起點(diǎn),一個事實(shí)清晰如刃:AGI 的能力,嚴(yán)格受限于其所...
2025年末Meta宣布裁減 AI 部門約600名員工,其中包括華裔科學(xué)家田淵棟。隨后,田淵棟在一次訪談中坦誠地總結(jié)了自己的心路歷程和思考感悟,在AI圈引發(fā)了不少共鳴。我想說...
SDN的又一篇總結(jié),Communications of the ACM再次發(fā)布 Nick和Jeniffer 聯(lián)袂長文,估計是要跟大統(tǒng)領(lǐng)要經(jīng)費(fèi),只是川建國第二任期下還能要到嗎。...
不久前,我買了一本菊花廠25年9月份新出版的IPv6隨路遙測的書。雖然早前就知曉IPv6具備遙測能力,但親眼看到書中描述的體系化復(fù)雜度與標(biāo)準(zhǔn)化進(jìn)度時,依然感到震驚。傳統(tǒng)網(wǎng)絡(luò)測...
近期火爆的兩篇論文,每個網(wǎng)絡(luò)工程師都應(yīng)該深讀,均聚焦“規(guī)模化+高效化”但側(cè)重點(diǎn)不同。? DeepSeek?V3 提出 MLA 機(jī)制減少注意力通信開銷,并通過低精度和均衡...
4.3 資源高效預(yù)填充與混合并行和微批次 預(yù)填充階段負(fù)責(zé)處理輸入提示以生成初始 KV 緩存,對首令牌時間(TTFT)和系統(tǒng)吞吐量有顯著影響。鑒于其通常是計算密集型特性,在預(yù)填...
摘要 大語言模型(LLM)的迅速擴(kuò)展揭示了當(dāng)前硬件架構(gòu)在內(nèi)存容量、計算效率和互聯(lián)帶寬方面的關(guān)鍵限制。DeepSeek-V3 在 2,048 張 NVIDIA H800 GPU...
2024年,谷歌在SIGCOMM發(fā)表論文《A Decentralized SDN Architecture for the WAN》,宣告集中控制模式在谷歌SDWAN的終結(jié),...
甚至到目前為止,向控制平面注入更復(fù)雜的算法仍然是網(wǎng)絡(luò)技術(shù)研究領(lǐng)域的主流方向,只不過控制的基石從分布式控制切換到了集中控制,控制的載體從路由器轉(zhuǎn)移到了服務(wù)器,而控制的算法也無可...
這個五一期間的一個高速塌陷新聞引起了我的注意,據(jù)紅星新聞報道,災(zāi)害事故發(fā)生后,有博主在社交媒體平臺建立的“梅龍高速塌陷”專題中提到,“當(dāng)時,高德導(dǎo)航救了我,它提示前方發(fā)生事故...
摘要 隨著數(shù)據(jù)中心中應(yīng)用程序?qū)W(wǎng)絡(luò)延遲和帶寬越來越敏感,例如AI/ML/HPC工作負(fù)載和基于RDMA的應(yīng)用程序,在高動態(tài)變化的流量模式下,僅依賴端到端信號進(jìn)行擁塞控制、流量調(diào)...