
1. 人工智能技術(shù)
1.1. 人工智能是引領(lǐng)未來的新興戰(zhàn)略技術(shù),是驅(qū)動新一輪科技革命和產(chǎn)業(yè)變革的重要力量
1.2. 2024年,語言大模型、多模態(tài)模型、智能體和具身智能等領(lǐng)域不斷出現(xiàn)突破性創(chuàng)新,或推動人工智能邁向通用智能初始階段
2. 大模型技術(shù)
2.1. AI大模型的縮放定律(Scaling Law)依然有效。在語言大模型領(lǐng)域,多維度能力持續(xù)進化,主要體現(xiàn)在上下文窗口長度的擴展、知識密度的提升及推理能力的優(yōu)化
2.2. 在多模態(tài)領(lǐng)域,多模態(tài)模型從早期的子任務(wù)模型組合轉(zhuǎn)向端到端的跨模態(tài)統(tǒng)一特征表示,實現(xiàn)了原生多模態(tài)支持
2.3. 交叉模態(tài)融合處理能力正成為研究熱點
2.4. 谷歌公司聚焦AI模型能力升級,推出多模態(tài)推理模型
2.4.1. 大模型訓(xùn)練框架ASPIRE,可增強AI模型的選擇性預(yù)測能力
-
2.4.2. DeepMind研究部門發(fā)布了關(guān)于訓(xùn)練人工智能模型的最新算法JEST
2.4.2.1. EST算法首先創(chuàng)建一個較小的人工智能模型,對來自極高品質(zhì)來源的數(shù)據(jù)進行質(zhì)量分級,按品質(zhì)對批次數(shù)據(jù)進行排序
2.4.2.2. 將該分級與更大的、品質(zhì)較低的數(shù)據(jù)集進行比較
2.4.2.3. 小型JEST模型確定最適合訓(xùn)練的批次,然后根據(jù)小型模型的結(jié)果訓(xùn)練大型模型
2.4.2.4. 與其他方法相比,JEST算法訓(xùn)練模型的效果提升了13倍
2.4.3. 首個多模態(tài)推理模型Gemini 2.0Flash Thinking,可展現(xiàn)推理步驟
2.5. OpenAI公司推出文生視頻AI模型Sora,同步提升推理大模型性能
2.5.1. Sora可以根據(jù)用戶的文本提示創(chuàng)建逼真的視頻
2.5.2. 名為GPT-4o的生成式AI大模型具有更強大的多模態(tài)理解與生成能力
2.5.3. o1系列人工智能模型,著重增強了推理能力,專注于復(fù)雜任務(wù)推理,能在科學(xué)、編程和數(shù)學(xué)等領(lǐng)域解決比以往模型更難的問題
2.5.4. “思路鏈”的推理技術(shù),可將復(fù)雜問題分解為更小的邏輯步驟
2.6. Meta公司發(fā)布多款視覺大模型,重視視覺處理與元宇宙體驗提升
-
2.6.1. AI視覺模型SceneScript,可快速建立3D場景
- 2.6.1.1. SceneScript能夠高效且輕量地建立室內(nèi)3D模型,只需要數(shù)千字節(jié)的內(nèi)存即可生成清晰且完整的幾何形狀,并且相關(guān)形狀數(shù)據(jù)具有可解釋性,用戶可以輕松閱讀和編輯這些數(shù)據(jù)表示
-
2.6.2. 開源模型SAM2,并將其分割能力擴展到了視頻領(lǐng)域
- 2.6.2.1. 可幫助用戶更快地標注視覺數(shù)據(jù),用于訓(xùn)練計算機視覺系統(tǒng),包括自動駕駛汽車中使用的系統(tǒng),并能以創(chuàng)造性的方式,在實時視頻中選擇對象并與之互動
-
2.6.3. AI視頻生成器Movie Gen,可生成帶有聲音的高清視頻
- 2.6.3.1. 可用于剪輯現(xiàn)有片段,改變風(fēng)格和轉(zhuǎn)場效果,或添加以前不存在的內(nèi)容
-
2.6.4. Meta Motivo的人工智能新模型,有望增強元宇宙體驗
- 2.6.4.1. 可以控制一個類似人類的數(shù)字代理動作,并使其以更逼真、更像人類的方式進行運動,解決了數(shù)字化身中常見的身體控制問題
2.7. Anthropic公司發(fā)布Claude3系列AI大模型,趕超谷歌和OpenAI
2.7.1. Claude3系列AI大模型,性能優(yōu)異
2.7.2. Claude3 Haiku、Claude3 Sonnet和Claude3 Opus,可提供不同程度的智能、速度和成本選擇,以滿足各種人工智能應(yīng)用需求
2.7.3. Opus、Sonnet和Haiku更少拒絕回答接近系統(tǒng)安全限制的提示詞
2.7.4. AI智能體,可使用計算機做復(fù)雜任務(wù)
2.8. 微軟公司拓展AI模型競爭賽道,向輕量級與多元應(yīng)用邁進
-
2.8.1. 輕量級AI模型Phi-3 Mini,可在手機上運行
- 2.8.1.1. Phi-3 Mini是微軟擬發(fā)布的三款小語言模型(SLM)中的第一款,Phi-3 Mini的可測量參數(shù)為38億個,其前一版本是微軟研究院于2023年年底發(fā)布的Phi-2模型,該模型具備27億個可測量參數(shù)
-
2.8.2. 首個大規(guī)模大氣基礎(chǔ)模型Aurora,可用于預(yù)測和減輕極端天氣影響
2.8.2.1. 即使在數(shù)據(jù)稀缺地區(qū)或極端天氣情況下,該模型也能出色地完成各種預(yù)測任務(wù)
2.8.2.2. 與如今數(shù)值預(yù)報系統(tǒng)界的SOTA相比,其計算速度提高了約5000倍
-
2.8.3. 名為Correction的工具,可以自動修改人工智能生成的錯誤文本
2.8.3.1. Correction首先標記可能存在錯誤的文本,然后通過將文本與事實來源進行比較來核實事實
2.8.3.2. 利用小語言模型和大語言模型將輸出與基礎(chǔ)文檔對齊
2.8.3.3. 有望提高人工智能的準確性,但沒有從根本原理上避免“模型幻覺”的產(chǎn)生
2.9. 英偉達公司加快搭建AI平臺,致力于學(xué)習(xí)框架和軟件的優(yōu)化
2.9.1. Nemotron-4 340B(3400億個參數(shù))系列模型
-
2.9.2. 名為權(quán)重分解低秩適應(yīng)(DoRA)的新微調(diào)方法
2.9.2.1. DoRA增強了LoRA的學(xué)習(xí)能力和穩(wěn)定性,而不會引入任何額外的推理開銷
2.9.2.2. DoRA在各種大語言模型(LLM)和視覺語言模型(VLM)上表現(xiàn)出顯著的性能改善
2.9.2.3. 在常識推理任務(wù)中,DoRA的表現(xiàn)優(yōu)于LoRA
2.9.2.4. DoRA在多輪基準測試、圖像/視頻文本理解和視覺指令調(diào)整任務(wù)中表現(xiàn)出更好的結(jié)果
3. 具身智能
3.1. 具身智能(Embodied Intelligence)是一種基于物質(zhì)實體進行感知、決策和行動的智能系統(tǒng),其核心在于通過智能體與環(huán)境的動態(tài)交互來實現(xiàn)認知與行為的高度融合
3.2. 是實現(xiàn)通用人工智能(AGI)的重要路徑之一
3.3. 加利福尼亞大學(xué)伯克利分校開源大型機器人操控基準,可應(yīng)對復(fù)雜自主操控任務(wù)
-
3.3.1. 智能機器人實驗室(RAIL)開源大型機器人操控基準(FMB)
3.3.1.1. 創(chuàng)新設(shè)計、多樣化任務(wù)、大型數(shù)據(jù)集和模仿學(xué)習(xí)基線
3.3.1.2. 單物體多步驟操控任務(wù)和多物體多步驟操控任務(wù)
3.4. 英偉達公司發(fā)布人形機器人通用基礎(chǔ)模型項目GR00T,旨在進一步推動其在機器人和具身智能方面的突破
3.4.1. 人形機器人通用基礎(chǔ)模型項目GR00T,旨在進一步推動其在機器人和具身智能方面的突破
3.4.2. 能夠理解自然語言,并通過觀察人類行為來模仿人類動作
3.4.3. 其能快速學(xué)習(xí)協(xié)調(diào)各種技能,具備更好的靈活性,以適應(yīng)現(xiàn)實世界并與之互動
3.5. 北京人形機器人創(chuàng)新中心發(fā)布全球首個純電驅(qū)擬人奔跑全尺寸人形機器人
- 3.5.1. 該機器人采用了成本更低的純電驅(qū)技術(shù),配備多個視覺感知傳感器,配備每秒550萬億次浮點運算的算力,并配備高精度的慣性測量單元和3D視覺傳感器,以解決基本運動控制問題,還配備了高精度的六維力傳感器以提供精確的力量反饋
3.6. 北京大學(xué)發(fā)布機器人多模態(tài)大模型RoboMamba,可賦予機器人端到端的推理和操縱能力
3.6.1. RoboMamba通過將視覺編碼器與高效的狀態(tài)空間語言模型Mamba集成,構(gòu)建了一個全新的多模態(tài)大模型,使其具備對視覺常識任務(wù)和機器人相關(guān)任務(wù)的推理能力
3.6.2. 提升推理與操作能力;提升泛化能力;增強視覺與語言理解能力;降低訓(xùn)練成本與資源消耗
3.7. Figure公司發(fā)布號稱“地球上最先進的人形機器人”Figure 02
3.7.1. 將人體形態(tài)的靈活性與先進的人工智能相結(jié)合,能夠?qū)W習(xí)并進行自我糾正,可在商業(yè)應(yīng)用中執(zhí)行各種任務(wù)
3.7.2. 通過與OpenAI合作訓(xùn)練的定制AI模型,F(xiàn)igure 02實現(xiàn)了與人類進行實時的語音對話
3.7.3. 為了方便在工業(yè)環(huán)境中實操,F(xiàn)igure 02采用集成布線,將電源和計算通信所需的全部線纜,都內(nèi)封并隱藏在機器人軀干和肢體中,以增強可靠性和更緊密的封裝,從而保護其免受外部環(huán)境干擾,距離向工業(yè)用戶銷售量產(chǎn)人形機器人的目標又近了一步
3.8. 挪威研究團隊研發(fā)出一款新型基于AI技術(shù)的機器人,可操縱柔性物體
3.8.1. 基于AI技術(shù)的機器人Bifrost,可利用其觸覺能力對柔軟且可塑性強的物體進行排序
3.8.2. 通過讓機器人執(zhí)行與實際任務(wù)類似的操作對其進行訓(xùn)練,從而提高機器人的泛化能力
3.9. 蘋果公司開發(fā)出以“自我為中心”的人形機器人感知系統(tǒng),避障率與計算效率顯著提升
-
3.9.1. 人形機器人感知系統(tǒng)ARMOR
3.9.1.1. 該系統(tǒng)軟硬件協(xié)同,不僅增強了機器人“空間意識”,實現(xiàn)動態(tài)防碰撞,同時計算效率也大幅提升
3.9.1.2. 硬件方面,ARMOR通過在機器人手臂上安裝小型智能深度傳感器,為機器人提供幾乎完整的環(huán)境視圖,解決了傳統(tǒng)機器人感知中的盲點和遮擋問題
3.9.1.3. 軟件方面,基于Transformer的AI驅(qū)動ARMOR-Policy可學(xué)習(xí)人類動作,幫助機器人動態(tài)規(guī)劃行動
4. 軍事AI戰(zhàn)略布局與應(yīng)用
4.1. 涉及指揮控制系統(tǒng)、無人作戰(zhàn)平臺、核武器等方面
4.2. 有利于實現(xiàn)智能預(yù)測、智能決策、多智能體協(xié)同、情報分析等目標
4.3. Scale AI公司測試與評估大語言模型
4.4. 成立人工智能特別工作組,以幫助其識別具有潛力的AI技術(shù)并全面應(yīng)用
4.5. 發(fā)布新的人工智能戰(zhàn)略
4.5.1. 全面了解人工智能可提供解決方案的具體任務(wù)問題
4.5.2. 提高現(xiàn)役人員的人工智能技能和知識
4.5.3. 實現(xiàn)可靠、快速和有效的人工智能解決方案
4.5.4. 為人工智能項目建立政策、管理和溝通渠道
4.5.5. 加強合作伙伴關(guān)系,促進知識、資源和技術(shù)的交流
4.6. 網(wǎng)絡(luò)防御測試自動化工具
4.6.1. 基于人工智能技術(shù)的“自主滲透測試”(APT)平臺,可用于測試網(wǎng)絡(luò)防御能力
4.6.2. 該平臺將向國防供應(yīng)商提供用于加快對內(nèi)部資產(chǎn)的滲透測試,發(fā)現(xiàn)問題,實施緩解措施,并確認有效修復(fù)可識別的漏洞
4.6.3. 人工智能驅(qū)動的滲透測試可以讓安全研究人員更廣泛地評估其系統(tǒng)中的漏洞,并持續(xù)監(jiān)控網(wǎng)絡(luò)是否存在漏洞
4.7. 將AI應(yīng)用于情報數(shù)據(jù)集
4.7.1. 利用人工智能處理海量數(shù)據(jù),以應(yīng)對數(shù)據(jù)量挑戰(zhàn)
4.7.2. 旨在改進處理、刻畫和分發(fā)(Processing,Exploitation and Dissenmination,PED)流程,通過多情報數(shù)據(jù)融合和機器學(xué)習(xí)模型集成來減輕分析師的負擔(dān)
4.7.3. 關(guān)鍵在于使用軍事數(shù)據(jù)訓(xùn)練算法,確保其在機密環(huán)境中的可靠性,同時構(gòu)建可信的人工智能和機器學(xué)習(xí)生態(tài)系統(tǒng),以檢測模型漂移并進行調(diào)整
4.7.4. 盡管技術(shù)不會取代人類士兵,特別是在瞄準和決策領(lǐng)域,但道德原則將貫穿算法應(yīng)用,以輔助分析師快速識別威脅,提升作戰(zhàn)效率
4.8. Anthropic、Palantir及亞馬遜公司展開合作,將為美國情報和國防機構(gòu)提供AI服務(wù)
4.8.1. 旨在將Claude集成到Palantir平臺上,并利用AWS的云托管服務(wù)
4.8.2. 該環(huán)境托管在AWS基礎(chǔ)設(shè)施上,適用于處理對國家安全至關(guān)重要的數(shù)據(jù)
4.8.3. 快速處理大量復(fù)雜數(shù)據(jù)、提升數(shù)據(jù)驅(qū)動的洞察力、更有效地識別趨勢、簡化文件審查和準備工作、輔助決策但保留官員的決策權(quán)
4.9. 設(shè)立AI快速能力小組,以加速尖端AI在國防領(lǐng)域的部署