讀2025世界前沿技術(shù)發(fā)展報告04人工智能技術(shù).png

1. 人工智能技術(shù)

1.1. 人工智能是引領(lǐng)未來的新興戰(zhàn)略技術(shù)，是驅(qū)動新一輪科技革命和產(chǎn)業(yè)變革的重要力量

1.2. 2024年，語言大模型、多模態(tài)模型、智能體和具身智能等領(lǐng)域不斷出現(xiàn)突破性創(chuàng)新，或推動人工智能邁向通用智能初始階段

2. 大模型技術(shù)

2.1. AI大模型的縮放定律（Scaling Law）依然有效。在語言大模型領(lǐng)域，多維度能力持續(xù)進化，主要體現(xiàn)在上下文窗口長度的擴展、知識密度的提升及推理能力的優(yōu)化

2.2. 在多模態(tài)領(lǐng)域，多模態(tài)模型從早期的子任務(wù)模型組合轉(zhuǎn)向端到端的跨模態(tài)統(tǒng)一特征表示，實現(xiàn)了原生多模態(tài)支持

2.3. 交叉模態(tài)融合處理能力正成為研究熱點

2.4. 谷歌公司聚焦AI模型能力升級，推出多模態(tài)推理模型

2.4.1. 大模型訓(xùn)練框架ASPIRE，可增強AI模型的選擇性預(yù)測能力
2.4.2. DeepMind研究部門發(fā)布了關(guān)于訓(xùn)練人工智能模型的最新算法JEST
- 2.4.2.1. EST算法首先創(chuàng)建一個較小的人工智能模型，對來自極高品質(zhì)來源的數(shù)據(jù)進行質(zhì)量分級，按品質(zhì)對批次數(shù)據(jù)進行排序
- 2.4.2.2. 將該分級與更大的、品質(zhì)較低的數(shù)據(jù)集進行比較
- 2.4.2.3. 小型JEST模型確定最適合訓(xùn)練的批次，然后根據(jù)小型模型的結(jié)果訓(xùn)練大型模型
- 2.4.2.4. 與其他方法相比，JEST算法訓(xùn)練模型的效果提升了13倍
2.4.3. 首個多模態(tài)推理模型Gemini 2.0Flash Thinking，可展現(xiàn)推理步驟

2.5. OpenAI公司推出文生視頻AI模型Sora，同步提升推理大模型性能

2.5.1. Sora可以根據(jù)用戶的文本提示創(chuàng)建逼真的視頻
2.5.2. 名為GPT-4o的生成式AI大模型具有更強大的多模態(tài)理解與生成能力
2.5.3. o1系列人工智能模型，著重增強了推理能力，專注于復(fù)雜任務(wù)推理，能在科學(xué)、編程和數(shù)學(xué)等領(lǐng)域解決比以往模型更難的問題
2.5.4. “思路鏈”的推理技術(shù)，可將復(fù)雜問題分解為更小的邏輯步驟

2.6. Meta公司發(fā)布多款視覺大模型，重視視覺處理與元宇宙體驗提升

2.6.1. AI視覺模型SceneScript，可快速建立3D場景
- 2.6.1.1. SceneScript能夠高效且輕量地建立室內(nèi)3D模型，只需要數(shù)千字節(jié)的內(nèi)存即可生成清晰且完整的幾何形狀，并且相關(guān)形狀數(shù)據(jù)具有可解釋性，用戶可以輕松閱讀和編輯這些數(shù)據(jù)表示
2.6.2. 開源模型SAM2，并將其分割能力擴展到了視頻領(lǐng)域
- 2.6.2.1. 可幫助用戶更快地標注視覺數(shù)據(jù)，用于訓(xùn)練計算機視覺系統(tǒng)，包括自動駕駛汽車中使用的系統(tǒng)，并能以創(chuàng)造性的方式，在實時視頻中選擇對象并與之互動
2.6.3. AI視頻生成器Movie Gen，可生成帶有聲音的高清視頻
- 2.6.3.1. 可用于剪輯現(xiàn)有片段，改變風(fēng)格和轉(zhuǎn)場效果，或添加以前不存在的內(nèi)容
2.6.4. Meta Motivo的人工智能新模型，有望增強元宇宙體驗
- 2.6.4.1. 可以控制一個類似人類的數(shù)字代理動作，并使其以更逼真、更像人類的方式進行運動，解決了數(shù)字化身中常見的身體控制問題

2.7. Anthropic公司發(fā)布Claude3系列AI大模型，趕超谷歌和OpenAI

2.7.1. Claude3系列AI大模型，性能優(yōu)異
2.7.2. Claude3 Haiku、Claude3 Sonnet和Claude3 Opus，可提供不同程度的智能、速度和成本選擇，以滿足各種人工智能應(yīng)用需求
2.7.3. Opus、Sonnet和Haiku更少拒絕回答接近系統(tǒng)安全限制的提示詞
2.7.4. AI智能體，可使用計算機做復(fù)雜任務(wù)

2.8. 微軟公司拓展AI模型競爭賽道，向輕量級與多元應(yīng)用邁進

2.8.1. 輕量級AI模型Phi-3 Mini，可在手機上運行
- 2.8.1.1. Phi-3 Mini是微軟擬發(fā)布的三款小語言模型（SLM）中的第一款，Phi-3 Mini的可測量參數(shù)為38億個，其前一版本是微軟研究院于2023年年底發(fā)布的Phi-2模型，該模型具備27億個可測量參數(shù)
2.8.2. 首個大規(guī)模大氣基礎(chǔ)模型Aurora，可用于預(yù)測和減輕極端天氣影響
- 2.8.2.1. 即使在數(shù)據(jù)稀缺地區(qū)或極端天氣情況下，該模型也能出色地完成各種預(yù)測任務(wù)
- 2.8.2.2. 與如今數(shù)值預(yù)報系統(tǒng)界的SOTA相比，其計算速度提高了約5000倍
2.8.3. 名為Correction的工具，可以自動修改人工智能生成的錯誤文本
- 2.8.3.1. Correction首先標記可能存在錯誤的文本，然后通過將文本與事實來源進行比較來核實事實
- 2.8.3.2. 利用小語言模型和大語言模型將輸出與基礎(chǔ)文檔對齊
- 2.8.3.3. 有望提高人工智能的準確性，但沒有從根本原理上避免“模型幻覺”的產(chǎn)生

2.9. 英偉達公司加快搭建AI平臺，致力于學(xué)習(xí)框架和軟件的優(yōu)化

2.9.1. Nemotron-4 340B（3400億個參數(shù)）系列模型
2.9.2. 名為權(quán)重分解低秩適應(yīng)（DoRA）的新微調(diào)方法
- 2.9.2.1. DoRA增強了LoRA的學(xué)習(xí)能力和穩(wěn)定性，而不會引入任何額外的推理開銷
- 2.9.2.2. DoRA在各種大語言模型（LLM）和視覺語言模型（VLM）上表現(xiàn)出顯著的性能改善
- 2.9.2.3. 在常識推理任務(wù)中，DoRA的表現(xiàn)優(yōu)于LoRA
- 2.9.2.4. DoRA在多輪基準測試、圖像/視頻文本理解和視覺指令調(diào)整任務(wù)中表現(xiàn)出更好的結(jié)果

3. 具身智能

3.1. 具身智能（Embodied Intelligence）是一種基于物質(zhì)實體進行感知、決策和行動的智能系統(tǒng)，其核心在于通過智能體與環(huán)境的動態(tài)交互來實現(xiàn)認知與行為的高度融合

3.2. 是實現(xiàn)通用人工智能（AGI）的重要路徑之一

3.3. 加利福尼亞大學(xué)伯克利分校開源大型機器人操控基準，可應(yīng)對復(fù)雜自主操控任務(wù)

3.3.1. 智能機器人實驗室（RAIL）開源大型機器人操控基準（FMB）
- 3.3.1.1. 創(chuàng)新設(shè)計、多樣化任務(wù)、大型數(shù)據(jù)集和模仿學(xué)習(xí)基線
- 3.3.1.2. 單物體多步驟操控任務(wù)和多物體多步驟操控任務(wù)

3.4. 英偉達公司發(fā)布人形機器人通用基礎(chǔ)模型項目GR00T，旨在進一步推動其在機器人和具身智能方面的突破

3.4.1. 人形機器人通用基礎(chǔ)模型項目GR00T，旨在進一步推動其在機器人和具身智能方面的突破
3.4.2. 能夠理解自然語言，并通過觀察人類行為來模仿人類動作
3.4.3. 其能快速學(xué)習(xí)協(xié)調(diào)各種技能，具備更好的靈活性，以適應(yīng)現(xiàn)實世界并與之互動

3.5. 北京人形機器人創(chuàng)新中心發(fā)布全球首個純電驅(qū)擬人奔跑全尺寸人形機器人

3.5.1. 該機器人采用了成本更低的純電驅(qū)技術(shù)，配備多個視覺感知傳感器，配備每秒550萬億次浮點運算的算力，并配備高精度的慣性測量單元和3D視覺傳感器，以解決基本運動控制問題，還配備了高精度的六維力傳感器以提供精確的力量反饋

3.6. 北京大學(xué)發(fā)布機器人多模態(tài)大模型RoboMamba，可賦予機器人端到端的推理和操縱能力

3.6.1. RoboMamba通過將視覺編碼器與高效的狀態(tài)空間語言模型Mamba集成，構(gòu)建了一個全新的多模態(tài)大模型，使其具備對視覺常識任務(wù)和機器人相關(guān)任務(wù)的推理能力
3.6.2. 提升推理與操作能力；提升泛化能力；增強視覺與語言理解能力；降低訓(xùn)練成本與資源消耗

3.7. Figure公司發(fā)布號稱“地球上最先進的人形機器人”Figure 02

3.7.1. 將人體形態(tài)的靈活性與先進的人工智能相結(jié)合，能夠?qū)W習(xí)并進行自我糾正，可在商業(yè)應(yīng)用中執(zhí)行各種任務(wù)
3.7.2. 通過與OpenAI合作訓(xùn)練的定制AI模型，F(xiàn)igure 02實現(xiàn)了與人類進行實時的語音對話
3.7.3. 為了方便在工業(yè)環(huán)境中實操，F(xiàn)igure 02采用集成布線，將電源和計算通信所需的全部線纜，都內(nèi)封并隱藏在機器人軀干和肢體中，以增強可靠性和更緊密的封裝，從而保護其免受外部環(huán)境干擾，距離向工業(yè)用戶銷售量產(chǎn)人形機器人的目標又近了一步

3.8. 挪威研究團隊研發(fā)出一款新型基于AI技術(shù)的機器人，可操縱柔性物體

3.8.1. 基于AI技術(shù)的機器人Bifrost，可利用其觸覺能力對柔軟且可塑性強的物體進行排序
3.8.2. 通過讓機器人執(zhí)行與實際任務(wù)類似的操作對其進行訓(xùn)練，從而提高機器人的泛化能力

3.9. 蘋果公司開發(fā)出以“自我為中心”的人形機器人感知系統(tǒng)，避障率與計算效率顯著提升

3.9.1. 人形機器人感知系統(tǒng)ARMOR
- 3.9.1.1. 該系統(tǒng)軟硬件協(xié)同，不僅增強了機器人“空間意識”，實現(xiàn)動態(tài)防碰撞，同時計算效率也大幅提升
- 3.9.1.2. 硬件方面，ARMOR通過在機器人手臂上安裝小型智能深度傳感器，為機器人提供幾乎完整的環(huán)境視圖，解決了傳統(tǒng)機器人感知中的盲點和遮擋問題
- 3.9.1.3. 軟件方面，基于Transformer的AI驅(qū)動ARMOR-Policy可學(xué)習(xí)人類動作，幫助機器人動態(tài)規(guī)劃行動

4. 軍事AI戰(zhàn)略布局與應(yīng)用

4.1. 涉及指揮控制系統(tǒng)、無人作戰(zhàn)平臺、核武器等方面

4.2. 有利于實現(xiàn)智能預(yù)測、智能決策、多智能體協(xié)同、情報分析等目標

4.3. Scale AI公司測試與評估大語言模型

4.4. 成立人工智能特別工作組，以幫助其識別具有潛力的AI技術(shù)并全面應(yīng)用

4.5. 發(fā)布新的人工智能戰(zhàn)略

4.5.1. 全面了解人工智能可提供解決方案的具體任務(wù)問題
4.5.2. 提高現(xiàn)役人員的人工智能技能和知識
4.5.3. 實現(xiàn)可靠、快速和有效的人工智能解決方案
4.5.4. 為人工智能項目建立政策、管理和溝通渠道
4.5.5. 加強合作伙伴關(guān)系，促進知識、資源和技術(shù)的交流

4.6. 網(wǎng)絡(luò)防御測試自動化工具

4.6.1. 基于人工智能技術(shù)的“自主滲透測試”（APT）平臺，可用于測試網(wǎng)絡(luò)防御能力
4.6.2. 該平臺將向國防供應(yīng)商提供用于加快對內(nèi)部資產(chǎn)的滲透測試，發(fā)現(xiàn)問題，實施緩解措施，并確認有效修復(fù)可識別的漏洞
4.6.3. 人工智能驅(qū)動的滲透測試可以讓安全研究人員更廣泛地評估其系統(tǒng)中的漏洞，并持續(xù)監(jiān)控網(wǎng)絡(luò)是否存在漏洞

4.7. 將AI應(yīng)用于情報數(shù)據(jù)集

4.7.1. 利用人工智能處理海量數(shù)據(jù)，以應(yīng)對數(shù)據(jù)量挑戰(zhàn)
4.7.2. 旨在改進處理、刻畫和分發(fā)（Processing，Exploitation and Dissenmination，PED）流程，通過多情報數(shù)據(jù)融合和機器學(xué)習(xí)模型集成來減輕分析師的負擔(dān)
4.7.3. 關(guān)鍵在于使用軍事數(shù)據(jù)訓(xùn)練算法，確保其在機密環(huán)境中的可靠性，同時構(gòu)建可信的人工智能和機器學(xué)習(xí)生態(tài)系統(tǒng)，以檢測模型漂移并進行調(diào)整
4.7.4. 盡管技術(shù)不會取代人類士兵，特別是在瞄準和決策領(lǐng)域，但道德原則將貫穿算法應(yīng)用，以輔助分析師快速識別威脅，提升作戰(zhàn)效率

4.8. Anthropic、Palantir及亞馬遜公司展開合作，將為美國情報和國防機構(gòu)提供AI服務(wù)

4.8.1. 旨在將Claude集成到Palantir平臺上，并利用AWS的云托管服務(wù)
4.8.2. 該環(huán)境托管在AWS基礎(chǔ)設(shè)施上，適用于處理對國家安全至關(guān)重要的數(shù)據(jù)
4.8.3. 快速處理大量復(fù)雜數(shù)據(jù)、提升數(shù)據(jù)驅(qū)動的洞察力、更有效地識別趨勢、簡化文件審查和準備工作、輔助決策但保留官員的決策權(quán)

4.9. 設(shè)立AI快速能力小組，以加速尖端AI在國防領(lǐng)域的部署

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

讀2025世界前沿技術(shù)發(fā)展報告04人工智能技術(shù)

讀2025世界前沿技術(shù)發(fā)展報告04人工智能技術(shù)

1. 人工智能技術(shù)

2. 大模型技術(shù)

3. 具身智能

4. 軍事AI戰(zhàn)略布局與應(yīng)用

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

讀2025世界前沿技術(shù)發(fā)展報告04人工智能技術(shù)

1. 人工智能技術(shù)

2. 大模型技術(shù)

3. 具身智能

4. 軍事AI戰(zhàn)略布局與應(yīng)用

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av