11月27日和28日深圳,TsingtaoAI研發(fā)團隊為某金融科技集團的研發(fā)團隊交付AI大模型在運維領域的應用主題實訓。本實訓專為運維專業(yè)人士設計,旨在深入探討大模型技術在現(xiàn)代IT運維管理中的應用與實踐。本實訓從大模型技術的基礎知識出發(fā),逐步引導學員了解其在自動化運維、智能監(jiān)控、日志分析、性能優(yōu)化和故障排錯等方面的具體應用。
實訓內容豐富,結合理論與實踐案例,詳細解析大模型技術如何解決運維中的高并發(fā)、海量數(shù)據(jù)處理和復雜故障診斷等挑戰(zhàn)。通過案例分析,學員將學習到如何在實際工作中部署和利用大模型,提升運維效率,保障系統(tǒng)穩(wěn)定性,并為企業(yè)節(jié)省成本。
實訓不僅涵蓋了技術層面的深入講解,還包括團隊技能培養(yǎng)、項目管理策略和未來趨勢的前瞻性討論。通過互動環(huán)節(jié),學員將有機會與同行交流心得,共同探討大模型在各自領域的應用潛力。本課程適合希望在運維領域保持競爭力的資深工程師和團隊領導者,幫助他們在大模型時代中把握先機,引領變革。



實訓目標
● 理解大模型技術及其在運維中的應用價值
● 掌握大模型在不同運維場景下的具體實施方法
● 學習如何通過大模型提升運維效率和系統(tǒng)穩(wěn)定性
實訓對象
企業(yè)對象:互聯(lián)網企業(yè)基礎設施、IT部門、運維團隊,傳統(tǒng)企業(yè)的IT部門、運維部門
學員對象:業(yè)務運維工程師、資源管理工程師、IDC運維工程師、開發(fā)工程師、研發(fā)架構師、基礎架構師、技術管理者
實訓大綱(2天):
第一天 上午:大模型及智能運維AIOps技術通用認知
1. AIOps的演進過程:從規(guī)則到統(tǒng)計算法、到大模型賦能智能化運維
2. 大模型的在運維領域的階段應用及案例
3. RAG相關技術和知識庫基礎,及快速演示,及初步優(yōu)化
4. 智能體技術入門、Agent/A2A/MCP協(xié)議初步講解
5. 運維專家的隱性知識轉化為可執(zhí)行的推理流程
第一天 下午:構建運維知識庫
基于大模型的知識庫工作原理及多模態(tài)信息轉化為知識信息的方法
6. 企業(yè)的運維知識庫構建
A.企業(yè)運維知識分類、及采集整理成為知識庫
B.CMDB元數(shù)據(jù)及配置項信息整理成為知識庫的方法及案例
C.運維文檔/架構圖等文檔轉為知識庫
D.預案SOP文檔知識如何有效轉為知識庫
E.運維元數(shù)據(jù)轉化為知識庫
F.基于運維故障報告的根因推薦
G.工程師運維經驗如何轉化為運維知識并入庫的方法
H.案例:基于Deepseek構建企業(yè)運維知識庫及智能問答
7. 動態(tài)知識庫:大模型使用動態(tài)變化的運維數(shù)據(jù)知識
A.把變更記錄轉化為知識庫
B.組織整理監(jiān)控指標成為知識庫
C.運維日志轉為知識,并在故障定位中應用
D.故障處理討論記錄、操作日志導入大模型知識庫
E.知識迭代:知識庫的應用與反饋、產生新知識入庫
8. 構建運維知識庫的難點與挑戰(zhàn)問題
第二天 上午:
● 通過DeepSeek 進行故障智能診斷與根因定位
● SRE進行故障定位的方法和實踐
● 大模型 如何協(xié)助 RCA 推理,多輪推理與工具調用的協(xié)同
● 基于大模型構建關聯(lián)多源數(shù)據(jù)的知識圖譜
● 在故障定位時如何利用運維知識庫,及基于置信度的異常判斷
● 案例:診斷某系統(tǒng)中斷,定位到數(shù)據(jù)庫配置錯誤。
● 實踐:對模擬事件進行 RCA,生成分析報告。
● 運維的應用場景案例:復雜問題排查:
Java故障診斷案例,MCP結合日志分析進行故障診斷
操作系統(tǒng)OS:系統(tǒng)內核故障深度根因分析
第二天 下午:
● 大模型在運維中的應用場景和案例
● 大模型在日常問題分析應用
● 運維管理:運維日常工作報告、運維故障報告整理
● 大模型 for 運維專業(yè)崗位賦能,DBA、系統(tǒng)專家、網絡專家
● 大模型在運維開發(fā)中的應用
● 從0到1設計和實現(xiàn)RAG智能體應用
● 需求分析與邊界定義
● 技術棧選型
● 數(shù)據(jù)采集(覆蓋運維核心場景)
● 數(shù)據(jù)預處理
● 知識庫部署
● 運維如何用好大模型提示詞
● 運維領域的Prompt工程及實操
● Prompt工程及調優(yōu)技巧
● IT 運維任務的提示示例:日志分析、故障排查,常見錯誤及避免方法
● 實踐 設計并優(yōu)化提示,用于分析樣本日志文件,驗證輸出準確性。
部分實訓課件




實訓技術專家
張老師 AI運維資深技術專家
泰健科技CTO,《SRE原理與實踐:構建高可靠性互聯(lián)網應用》作者。
曾任虎牙資深運維專家和架構師,擁有20年軟件開發(fā)、架構、運維、SRE經驗。歷任項目研發(fā)負責人、SRE負責人、架構師,事故管理委員會委員、基礎保障部架構師委員會委員。
為虎牙基于微服務架構的直播業(yè)務、音視頻業(yè)務、海外直播業(yè)務建立了穩(wěn)定性保障體系,在混合多云架構、可觀測性、預案、變更管控、AIOps等SRE領域有深入研究和豐富經驗。多次擔任虎牙“英雄聯(lián)盟全球總決賽直播”穩(wěn)定性保障負責人。
同時,他也是中國信通院分布式系統(tǒng)穩(wěn)定性實驗室高級技術專家,參與編寫了信通院《信息系統(tǒng)穩(wěn)定性保障能力建設指南》?!哆\維前線》一書的聯(lián)合作者。多次參與GOPS、MSUP/EE、GDevops、Takintalks技術大會分享。
孫老師 AI運維技術專家
資深云原生架構專家,擁有20年IT從業(yè)經驗,深耕金融科技與AI運維領域。曾任職IBM和華為等知名企業(yè),為多家大型銀行和保險公司提供核心系統(tǒng)支持。近年來專注于云原生轉型和平臺工程,在AI與運維結合方面具有豐富實戰(zhàn)經驗。
通過公眾號"云云眾生s"分享大量AI相關技術內容,涵蓋AI在運維場景的實際應用、云原生技術實踐等前沿話題,在業(yè)界具有一定影響力。
核心優(yōu)勢:
20年IT架構與運維經驗,具備深厚的技術底蘊
豐富的AI大語言模型應用開發(fā)經驗
熟練掌握DevOps、云原生、自動化運維等現(xiàn)代技術棧
具備優(yōu)秀的培訓與知識傳播能力
擁有完整的課程體系設計和項目實戰(zhàn)經驗
核心技能
AI與智能運維
AI大語言模型應用開發(fā):基于Google Gemini、Groq Llama3等商用和開源模型開發(fā)多個實用工具
智能運維平臺:使用Go語言開發(fā)自動化運維產品Edith,支持20+種產品的智能化管理
AI內容創(chuàng)作:構建基于AI的新媒體半自動發(fā)布平臺,實現(xiàn)文章翻譯、視頻處理等自動化流程
云原生技術棧
容器編排:Kubernetes、Docker、Helm、ArgoCD
監(jiān)控觀測:Prometheus、OpenTelemetry、eBPF、ClickHouse
服務網格:Istio
CI/CD:Jenkins、GitLab、Harbor
開發(fā)技術
后端開發(fā):Go、Java、Python
前端技術:Angular、Vue、React、Next.js
中間件:WebLogic、WebSphere、JBoss、Tuxedo
云平臺:AWS、阿里云、華為云、Azure
方法論
DevOps、Scrum、Architectural Thinking、Design Thinking
工作經歷
架構師
2024.06 - 至今
負責銀行核心產品研發(fā),參與支持多家銀行等重要金融機構的核心系統(tǒng)項目。
主要成就:
作為銀行核心系統(tǒng)架構師,設計全行級核心業(yè)務系統(tǒng)架構
主導分布式微服務架構規(guī)劃,確保日均億級交易穩(wěn)定處理
推進DevOps平臺建設,優(yōu)化持續(xù)交付能力
負責核心系統(tǒng)的云原生改造,以及海外云環(huán)境的自動化部署
推動AI工具的引入,提高開發(fā)運維效率
全棧開發(fā) | 自由職業(yè)
2024.04 - 2024.06
專注AI技術在內容創(chuàng)作領域的應用實踐。
核心項目:
構建基于AI的新媒體半自動發(fā)布平臺
實現(xiàn)英文文章AI自動下載、翻譯、整理和發(fā)布
開發(fā)技術視頻自動處理流程:下載→語音識別→字幕翻譯→視頻壓制→發(fā)布
使用技術:Google Gemini、Groq API、LlamaIndex、Prefect任務調度
目前公眾號"云云眾生s"和對應視頻號基于此平臺運營
云原生解決方案部總監(jiān) | 北京中亦安圖科技股份有限公司
2021.07 - 2024.03
核心職責:
組建云原生團隊,構建DevOps和平臺工程解決方案
帶領研發(fā)部門進行云原生轉型
負責重要客戶的云原生服務售前工作
使用Go語言開發(fā)自動化運維產品Edith核心代碼
DevOps總監(jiān) | 青島中瑞集團
2019.07 - 2021.06
主要成就:
帶領公司微服務架構轉型,組織軟件開發(fā)過程改進
領導DevOps平臺建設:Kubernetes、Jenkins、GitLab等
實施多云管理:阿里云、AWS、華為云
解決Kubernetes關鍵技術問題:EKS、Prometheus、Istio等
推動公司實現(xiàn)微服務化、DevOps化、多云化轉型
產品專家/自動化運維項目負責人 | IBM
2011.08 - 2019.06
專業(yè)領域:
中間件產品專家:WebLogic、WebSphere、JBoss、Tomcat、Tuxedo
自動化運維工程師:開發(fā)自動化工程流程,提升運維效率
架構咨詢顧問:提供高可用性和運維架構咨詢
Kubernetes產品支持:ICP和OpenShift產品技術支持
重點項目經驗
EasyDevOps課程設計與實施
2023.11 - 2024.03
設計并實施完整的云原生開源DevOps課程體系。
課程特色:
提供完整DevOps平臺參考架構
融合Kubernetes、Jenkins、ArgoCD、Harbor、GitLab等產品
結合云原生運維和開發(fā)方法論
幫助團隊快速轉向云原生DevOps環(huán)境
AI驅動的新媒體平臺
2024.03 - 2024.06
技術創(chuàng)新:
集成多個大語言模型API(Gemini、Groq)
使用LlamaIndex框架構建AI應用
Prefect實現(xiàn)復雜任務調度
實現(xiàn)端到端的內容自動化處理流程
Edith自動化運維產品
2022.01 - 2023.12
產品特點:
Go語言開發(fā),部署簡單,功能強大
支持Linux、Oracle、MySQL、WebLogic等20+產品
已在200+客戶中成功應用
實現(xiàn)一個命令行工具管理多種IT基礎設施
Concerto統(tǒng)一可觀測平臺
2023.04 - 2023.11
技術架構:
融合OpenTelemetry、eBPF、ClickHouse等先進技術
統(tǒng)一Log、Metric、Trace三大可觀測支柱
新一代可觀測解決方案設計
教育背景與認證
學歷:
本科 | 數(shù)學與應用數(shù)學 + 計算機科學 | 中國海洋大學 | 1998-2002
專業(yè)認證:
IBM系列認證:Container & Kubernetes Essentials、Microservices with Istio、Data Analysis with Python等
Oracle WebLogic Server認證專家- MongoDB認證開發(fā)者- IBM區(qū)塊鏈認證- 多項IBM專業(yè)技能認證
榮譽與成就
軟件企業(yè)經營技能人才 | 北京軟件和信息服務業(yè)協(xié)會
杰出貢獻獎 | BEA Dev2dev社區(qū)
IBM專業(yè)認證講師 | IBM
社區(qū)貢獻與影響力
公眾號"云云眾生s"運營- 專注分享云原生、AI、DevOps等前沿技術- 大量AI相關原創(chuàng)內容和實踐案例- 技術視頻制作與分享- 在業(yè)界具有一定影響力
開源社區(qū)貢獻- Subversion中文站站長(2004-2012)- Subversion項目代碼貢獻者- 組織官方文檔翻譯工作- **BEA Dev2dev社區(qū)版主,獲得杰出貢獻獎
培訓與講師經驗
企業(yè)培訓經驗- 多家大型企業(yè)Subversion培訓和咨詢- 云原生技術內部培訓- DevOps方法論和實踐培訓- 中間件技術培訓和支持
課程開發(fā)能力- 具備完整課程體系設計能力- 理論結合實踐的教學方法- 豐富的項目案例庫- 優(yōu)秀的技術傳播和知識分享能力
關于TsingtaoAI
TsingtaoAI企業(yè)實訓業(yè)務線專注于提供LLM、具身智能、AIGC、智算和數(shù)據(jù)科學領域的企業(yè)實訓服務,通過深入業(yè)務場景的案例實戰(zhàn)和項目式實訓,幫助企業(yè)應對AI轉型中的技術挑戰(zhàn)。其實訓內容涵蓋AI大模型開發(fā)、Prompt工程、數(shù)據(jù)分析與模型優(yōu)化等最新前沿技術,并結合實際應用場景,如智能制造、醫(yī)藥健康、金融科技和智能駕駛等。通過案例式學習和PBL項目訓練,TsingtaoAI能夠精準滿足企業(yè)技術團隊的學習需求,提升員工的業(yè)務能力和實戰(zhàn)水平,實現(xiàn)AI技術的高效落地,為企業(yè)創(chuàng)新和生產力提升提供強有力的支持。
同時,TsingtaoAI公司并不是一家單純的實訓機構,我們同樣是一家AI產品開發(fā)公司,公司核心團隊主要也都是由技術和產品人才構成,公司團隊大部分成員在大模型時代之前就在從事AI產品相關的工作。公司在過去一年里,為10余家客戶開發(fā)了AI相關的產品,涵蓋醫(yī)療、教育、智能制造、人力資源等領域。相信我們在AI產品開發(fā)和客戶服務的過程所形成的認知和方法論,能對貴司的需求有更深更細的洞察和理解,也能提供更深入業(yè)務肌理的“AI能力獲得”。