企業(yè)實訓|AI大模型在運維領域的應用——某金融科技集團

11月27日和28日深圳,TsingtaoAI研發(fā)團隊為某金融科技集團的研發(fā)團隊交付AI大模型在運維領域的應用主題實訓。本實訓專為運維專業(yè)人士設計,旨在深入探討大模型技術在現(xiàn)代IT運維管理中的應用與實踐。本實訓從大模型技術的基礎知識出發(fā),逐步引導學員了解其在自動化運維、智能監(jiān)控、日志分析、性能優(yōu)化和故障排錯等方面的具體應用。

實訓內容豐富,結合理論與實踐案例,詳細解析大模型技術如何解決運維中的高并發(fā)、海量數(shù)據(jù)處理和復雜故障診斷等挑戰(zhàn)。通過案例分析,學員將學習到如何在實際工作中部署和利用大模型,提升運維效率,保障系統(tǒng)穩(wěn)定性,并為企業(yè)節(jié)省成本。

實訓不僅涵蓋了技術層面的深入講解,還包括團隊技能培養(yǎng)、項目管理策略和未來趨勢的前瞻性討論。通過互動環(huán)節(jié),學員將有機會與同行交流心得,共同探討大模型在各自領域的應用潛力。本課程適合希望在運維領域保持競爭力的資深工程師和團隊領導者,幫助他們在大模型時代中把握先機,引領變革。

實訓目標

● 理解大模型技術及其在運維中的應用價值

● 掌握大模型在不同運維場景下的具體實施方法

● 學習如何通過大模型提升運維效率和系統(tǒng)穩(wěn)定性


實訓對象

企業(yè)對象:互聯(lián)網企業(yè)基礎設施、IT部門、運維團隊,傳統(tǒng)企業(yè)的IT部門、運維部門

學員對象:業(yè)務運維工程師、資源管理工程師、IDC運維工程師、開發(fā)工程師、研發(fā)架構師、基礎架構師、技術管理者


實訓大綱(2天):

第一天 上午:大模型及智能運維AIOps技術通用認知

1. AIOps的演進過程:從規(guī)則到統(tǒng)計算法、到大模型賦能智能化運維

2. 大模型的在運維領域的階段應用及案例

3. RAG相關技術和知識庫基礎,及快速演示,及初步優(yōu)化

4. 智能體技術入門、Agent/A2A/MCP協(xié)議初步講解

5. 運維專家的隱性知識轉化為可執(zhí)行的推理流程


第一天 下午:構建運維知識庫

基于大模型的知識庫工作原理及多模態(tài)信息轉化為知識信息的方法

6. 企業(yè)的運維知識庫構建

A.企業(yè)運維知識分類、及采集整理成為知識庫

B.CMDB元數(shù)據(jù)及配置項信息整理成為知識庫的方法及案例

C.運維文檔/架構圖等文檔轉為知識庫

D.預案SOP文檔知識如何有效轉為知識庫

E.運維元數(shù)據(jù)轉化為知識庫

F.基于運維故障報告的根因推薦

G.工程師運維經驗如何轉化為運維知識并入庫的方法

H.案例:基于Deepseek構建企業(yè)運維知識庫及智能問答

7. 動態(tài)知識庫:大模型使用動態(tài)變化的運維數(shù)據(jù)知識

A.把變更記錄轉化為知識庫

B.組織整理監(jiān)控指標成為知識庫

C.運維日志轉為知識,并在故障定位中應用

D.故障處理討論記錄、操作日志導入大模型知識庫

E.知識迭代:知識庫的應用與反饋、產生新知識入庫

8. 構建運維知識庫的難點與挑戰(zhàn)問題


第二天 上午:

● 通過DeepSeek 進行故障智能診斷與根因定位

● SRE進行故障定位的方法和實踐

● 大模型 如何協(xié)助 RCA 推理,多輪推理與工具調用的協(xié)同

● 基于大模型構建關聯(lián)多源數(shù)據(jù)的知識圖譜

● 在故障定位時如何利用運維知識庫,及基于置信度的異常判斷

● 案例:診斷某系統(tǒng)中斷,定位到數(shù)據(jù)庫配置錯誤。

● 實踐:對模擬事件進行 RCA,生成分析報告。

● 運維的應用場景案例:復雜問題排查:

Java故障診斷案例,MCP結合日志分析進行故障診斷

操作系統(tǒng)OS:系統(tǒng)內核故障深度根因分析


第二天 下午:

● 大模型在運維中的應用場景和案例

● 大模型在日常問題分析應用

● 運維管理:運維日常工作報告、運維故障報告整理

● 大模型 for 運維專業(yè)崗位賦能,DBA、系統(tǒng)專家、網絡專家

● 大模型在運維開發(fā)中的應用

● 從0到1設計和實現(xiàn)RAG智能體應用

● 需求分析與邊界定義

● 技術棧選型

● 數(shù)據(jù)采集(覆蓋運維核心場景)

● 數(shù)據(jù)預處理

● 知識庫部署

● 運維如何用好大模型提示詞

● 運維領域的Prompt工程及實操

● Prompt工程及調優(yōu)技巧

● IT 運維任務的提示示例:日志分析、故障排查,常見錯誤及避免方法

● 實踐 設計并優(yōu)化提示,用于分析樣本日志文件,驗證輸出準確性。


部分實訓課件

實訓技術專家

張老師 AI運維資深技術專家

泰健科技CTO,《SRE原理與實踐:構建高可靠性互聯(lián)網應用》作者。

曾任虎牙資深運維專家和架構師,擁有20年軟件開發(fā)、架構、運維、SRE經驗。歷任項目研發(fā)負責人、SRE負責人、架構師,事故管理委員會委員、基礎保障部架構師委員會委員。

為虎牙基于微服務架構的直播業(yè)務、音視頻業(yè)務、海外直播業(yè)務建立了穩(wěn)定性保障體系,在混合多云架構、可觀測性、預案、變更管控、AIOps等SRE領域有深入研究和豐富經驗。多次擔任虎牙“英雄聯(lián)盟全球總決賽直播”穩(wěn)定性保障負責人。

同時,他也是中國信通院分布式系統(tǒng)穩(wěn)定性實驗室高級技術專家,參與編寫了信通院《信息系統(tǒng)穩(wěn)定性保障能力建設指南》?!哆\維前線》一書的聯(lián)合作者。多次參與GOPS、MSUP/EE、GDevops、Takintalks技術大會分享。


孫老師 AI運維技術專家

資深云原生架構專家,擁有20年IT從業(yè)經驗,深耕金融科技與AI運維領域。曾任職IBM和華為等知名企業(yè),為多家大型銀行和保險公司提供核心系統(tǒng)支持。近年來專注于云原生轉型和平臺工程,在AI與運維結合方面具有豐富實戰(zhàn)經驗。

通過公眾號"云云眾生s"分享大量AI相關技術內容,涵蓋AI在運維場景的實際應用、云原生技術實踐等前沿話題,在業(yè)界具有一定影響力。


核心優(yōu)勢:

20年IT架構與運維經驗,具備深厚的技術底蘊

豐富的AI大語言模型應用開發(fā)經驗

熟練掌握DevOps、云原生、自動化運維等現(xiàn)代技術棧

具備優(yōu)秀的培訓與知識傳播能力

擁有完整的課程體系設計和項目實戰(zhàn)經驗


核心技能

AI與智能運維

AI大語言模型應用開發(fā):基于Google Gemini、Groq Llama3等商用和開源模型開發(fā)多個實用工具

智能運維平臺:使用Go語言開發(fā)自動化運維產品Edith,支持20+種產品的智能化管理

AI內容創(chuàng)作:構建基于AI的新媒體半自動發(fā)布平臺,實現(xiàn)文章翻譯、視頻處理等自動化流程

云原生技術棧

容器編排:Kubernetes、Docker、Helm、ArgoCD

監(jiān)控觀測:Prometheus、OpenTelemetry、eBPF、ClickHouse

服務網格:Istio

CI/CD:Jenkins、GitLab、Harbor

開發(fā)技術

后端開發(fā):Go、Java、Python

前端技術:Angular、Vue、React、Next.js

中間件:WebLogic、WebSphere、JBoss、Tuxedo

云平臺:AWS、阿里云、華為云、Azure

方法論

DevOps、Scrum、Architectural Thinking、Design Thinking


工作經歷

架構師

2024.06 - 至今

負責銀行核心產品研發(fā),參與支持多家銀行等重要金融機構的核心系統(tǒng)項目。

主要成就:

作為銀行核心系統(tǒng)架構師,設計全行級核心業(yè)務系統(tǒng)架構

主導分布式微服務架構規(guī)劃,確保日均億級交易穩(wěn)定處理

推進DevOps平臺建設,優(yōu)化持續(xù)交付能力

負責核心系統(tǒng)的云原生改造,以及海外云環(huán)境的自動化部署

推動AI工具的引入,提高開發(fā)運維效率


全棧開發(fā) | 自由職業(yè)

2024.04 - 2024.06

專注AI技術在內容創(chuàng)作領域的應用實踐。

核心項目:

構建基于AI的新媒體半自動發(fā)布平臺

實現(xiàn)英文文章AI自動下載、翻譯、整理和發(fā)布

開發(fā)技術視頻自動處理流程:下載→語音識別→字幕翻譯→視頻壓制→發(fā)布

使用技術:Google Gemini、Groq API、LlamaIndex、Prefect任務調度

目前公眾號"云云眾生s"和對應視頻號基于此平臺運營

云原生解決方案部總監(jiān) | 北京中亦安圖科技股份有限公司

2021.07 - 2024.03

核心職責:

組建云原生團隊,構建DevOps和平臺工程解決方案

帶領研發(fā)部門進行云原生轉型

負責重要客戶的云原生服務售前工作

使用Go語言開發(fā)自動化運維產品Edith核心代碼

DevOps總監(jiān) | 青島中瑞集團

2019.07 - 2021.06

主要成就:

帶領公司微服務架構轉型,組織軟件開發(fā)過程改進

領導DevOps平臺建設:Kubernetes、Jenkins、GitLab等

實施多云管理:阿里云、AWS、華為云

解決Kubernetes關鍵技術問題:EKS、Prometheus、Istio等

推動公司實現(xiàn)微服務化、DevOps化、多云化轉型

產品專家/自動化運維項目負責人 | IBM

2011.08 - 2019.06

專業(yè)領域:

中間件產品專家:WebLogic、WebSphere、JBoss、Tomcat、Tuxedo

自動化運維工程師:開發(fā)自動化工程流程,提升運維效率

架構咨詢顧問:提供高可用性和運維架構咨詢

Kubernetes產品支持:ICP和OpenShift產品技術支持


重點項目經驗

EasyDevOps課程設計與實施

2023.11 - 2024.03

設計并實施完整的云原生開源DevOps課程體系。

課程特色:

提供完整DevOps平臺參考架構

融合Kubernetes、Jenkins、ArgoCD、Harbor、GitLab等產品

結合云原生運維和開發(fā)方法論

幫助團隊快速轉向云原生DevOps環(huán)境

AI驅動的新媒體平臺

2024.03 - 2024.06

技術創(chuàng)新:

集成多個大語言模型API(Gemini、Groq)

使用LlamaIndex框架構建AI應用

Prefect實現(xiàn)復雜任務調度

實現(xiàn)端到端的內容自動化處理流程

Edith自動化運維產品

2022.01 - 2023.12

產品特點:

Go語言開發(fā),部署簡單,功能強大

支持Linux、Oracle、MySQL、WebLogic等20+產品

已在200+客戶中成功應用

實現(xiàn)一個命令行工具管理多種IT基礎設施

Concerto統(tǒng)一可觀測平臺

2023.04 - 2023.11

技術架構:

融合OpenTelemetry、eBPF、ClickHouse等先進技術

統(tǒng)一Log、Metric、Trace三大可觀測支柱

新一代可觀測解決方案設計


教育背景與認證

學歷:

本科 | 數(shù)學與應用數(shù)學 + 計算機科學 | 中國海洋大學 | 1998-2002

專業(yè)認證:

IBM系列認證:Container & Kubernetes Essentials、Microservices with Istio、Data Analysis with Python等

Oracle WebLogic Server認證專家- MongoDB認證開發(fā)者- IBM區(qū)塊鏈認證- 多項IBM專業(yè)技能認證

榮譽與成就

軟件企業(yè)經營技能人才 | 北京軟件和信息服務業(yè)協(xié)會

杰出貢獻獎 | BEA Dev2dev社區(qū)

IBM專業(yè)認證講師 | IBM

社區(qū)貢獻與影響力

公眾號"云云眾生s"運營- 專注分享云原生、AI、DevOps等前沿技術- 大量AI相關原創(chuàng)內容和實踐案例- 技術視頻制作與分享- 在業(yè)界具有一定影響力

開源社區(qū)貢獻- Subversion中文站站長(2004-2012)- Subversion項目代碼貢獻者- 組織官方文檔翻譯工作- **BEA Dev2dev社區(qū)版主,獲得杰出貢獻獎


培訓與講師經驗

企業(yè)培訓經驗- 多家大型企業(yè)Subversion培訓和咨詢- 云原生技術內部培訓- DevOps方法論和實踐培訓- 中間件技術培訓和支持

課程開發(fā)能力- 具備完整課程體系設計能力- 理論結合實踐的教學方法- 豐富的項目案例庫- 優(yōu)秀的技術傳播和知識分享能力


關于TsingtaoAI

TsingtaoAI企業(yè)實訓業(yè)務線專注于提供LLM、具身智能、AIGC、智算和數(shù)據(jù)科學領域的企業(yè)實訓服務,通過深入業(yè)務場景的案例實戰(zhàn)和項目式實訓,幫助企業(yè)應對AI轉型中的技術挑戰(zhàn)。其實訓內容涵蓋AI大模型開發(fā)、Prompt工程、數(shù)據(jù)分析與模型優(yōu)化等最新前沿技術,并結合實際應用場景,如智能制造、醫(yī)藥健康、金融科技和智能駕駛等。通過案例式學習和PBL項目訓練,TsingtaoAI能夠精準滿足企業(yè)技術團隊的學習需求,提升員工的業(yè)務能力和實戰(zhàn)水平,實現(xiàn)AI技術的高效落地,為企業(yè)創(chuàng)新和生產力提升提供強有力的支持。

同時,TsingtaoAI公司并不是一家單純的實訓機構,我們同樣是一家AI產品開發(fā)公司,公司核心團隊主要也都是由技術和產品人才構成,公司團隊大部分成員在大模型時代之前就在從事AI產品相關的工作。公司在過去一年里,為10余家客戶開發(fā)了AI相關的產品,涵蓋醫(yī)療、教育、智能制造、人力資源等領域。相信我們在AI產品開發(fā)和客戶服務的過程所形成的認知和方法論,能對貴司的需求有更深更細的洞察和理解,也能提供更深入業(yè)務肌理的“AI能力獲得”。

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容