Grafana:數(shù)據(jù)采集—》數(shù)據(jù)存儲—》數(shù)據(jù)展示,grafana只是展示數(shù)據(jù)使用
所有的監(jiān)控和系統(tǒng)都是在容器里面部署的,
性能瓶頸分析
現(xiàn)象:
1、響應(yīng)時間 > 5s
2、錯誤率高于預(yù)期要求
3、cpu使用率高
分析流程
1、Jmeter聚合報(bào)告指標(biāo)沒有達(dá)標(biāo)
2、分析服務(wù)器資源—grafanaz監(jiān)控平臺—cpu使用率特別高
3、根據(jù)細(xì)分圖分析是user%使用率高
4、可以使用top查看具體哪一個進(jìn)程使用cpu高
5、可以使用docker監(jiān)控,分析是哪一個容器的cpu使用率高????
? ? a.第一階段:mysql 大于 java進(jìn)程? ? ?b.第二階段:java高于mysql
6、分析mysql進(jìn)程的性能—使用監(jiān)控工具去分析
? ? a.執(zhí)行效率問題
? ? b.緩存? ?庫結(jié)構(gòu)? 死鎖問題
7、打開慢查詢?nèi)罩? file ---》? table? ? select->full join 一般是因?yàn)閿?shù)據(jù)庫里面的查詢操作沒有索引
8、發(fā)現(xiàn)數(shù)據(jù)庫的性能是因?yàn)槁樵儗?dǎo)致,是具體什么語句導(dǎo)致
9、找到具體的慢查詢語句,跟開發(fā)確認(rèn),截圖給開發(fā)
? ? ? ? 什么業(yè)務(wù)——》什么表-》什么問題-》截圖
10、開發(fā)優(yōu)化完,回歸測試
注意事項(xiàng):新版本項(xiàng)目里,需要測試大量查詢的業(yè)務(wù),請先找開發(fā)鋪數(shù)據(jù),百萬級別數(shù)據(jù),方便壓測
錯誤率問題:
現(xiàn)象:jmeter聚合報(bào)告里有錯誤率
分析:
a.查看結(jié)果樹里面是500 服務(wù)器問題
b.分析服務(wù)端問題
c.了解服務(wù)端的架構(gòu)(單體的tomcat\springboot內(nèi)部應(yīng)用服務(wù)器、微服務(wù))
d.docker環(huán)境,找到對應(yīng)的哪一個容器
e.進(jìn)入容器? docker exec -it 容器id /bin/bash
? ? 查看容器日志 docker logs -f --tail 100容器id

