可以操作windows的ai工具合集

有不少可以操作Windows系統(tǒng)的AI工具,能夠?qū)崿F(xiàn)打開筆記本(此處假設(shè)是打開筆記本電腦或筆記本應(yīng)用程序)等操作,以下是相關(guān)介紹:

  • Microsoft Copilot:集成于Windows 11系統(tǒng),可通過點(diǎn)擊任務(wù)欄圖標(biāo)、按鍵盤上的Copilot鍵或說“Hey, Copilot”來啟動。它能在用戶授權(quán)下代表用戶執(zhí)行操作,可通過語音指令讓它打開應(yīng)用程序,例如說“打開筆記本電腦”(若電腦支持相關(guān)語音喚醒及操作功能)或“打開記事本”等,也能進(jìn)行系統(tǒng)設(shè)置調(diào)整、文件搜索等多種操作。
  • Windows-Use:一個(gè)開源自動化代理框架,通過橋接大型語言模型與Windows API,可實(shí)現(xiàn)打開應(yīng)用程序、點(diǎn)擊按鈕、輸入文本等操作。安裝后,可利用代碼或命令行來執(zhí)行任務(wù),如使用controller.open_application("notepad")代碼或windows-use "打開記事本并輸入文本"命令來打開記事本并輸入內(nèi)容。
  • Windows-MCP:由CursorTouch團(tuán)隊(duì)開源,是輕量級MCP服務(wù)器。安裝在Windows 7-11任意版本后,大語言模型能通過它原生調(diào)用Windows API??蓪?shí)現(xiàn)打開/關(guān)閉應(yīng)用、鼠標(biāo)點(diǎn)擊、鍵盤輸入等操作,如可一句話讓AI打開Spotify播放歌單,延遲僅1.5-2.3秒,日常辦公完全可用。
  • self-operating-computer:一個(gè)允許多模態(tài)模型操控電腦的框架,支持Windows等多種操作系統(tǒng),整合了GPT-4o、Gemini Pro Vision等模型,支持文本指令和語音控制兩種輸入方式。通過該框架,可利用AI模型的視覺理解和操作規(guī)劃能力,實(shí)現(xiàn)打開應(yīng)用程序等操作,例如通過語音指令讓其打開相關(guān)程序。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容