節(jié)省顯示器同時提升持續(xù)集成問題修復及時性的“流水線問題責任聚焦”實驗

作為企業(yè)IT部門某個開發(fā)團隊負責人的你,從書上和大佬那里得知,軟件開發(fā)團隊,如果采用持續(xù)集成實踐,那么就能降低軟件開發(fā)過程中的返工。

于是你按照書中和大佬所說的,在團隊工位顯眼位置,擺放了一個大顯示器,并接上持續(xù)集成流水線。

你喊團隊中所有的5位開發(fā)人員來開會,告訴他們,一旦流水線運行出現(xiàn)問題,比如編譯打包錯誤或自動化測試運行失敗,顯示器就會顯示告警的紅色/黃色畫面。團隊中無論誰看到了紅色/黃色告警,第一時間就要放下手中工作,及時修復流水線。團隊中的其他人,也要配合這位同事的修復工作。

開發(fā)人員都答應了。

但很快你就發(fā)現(xiàn),你所辛辛苦苦搭建的流水線健康顯示屏,其實就是一個擺設。團隊開發(fā)人員根本就不關注。即使顯示屏變紅/黃好幾天,也無人修復。

這個問題該如何破?

你讀了阿倫森的《社會心理學》,其中的“責任稀釋假說“給了你很大的啟發(fā)。即目睹緊急情況的人越多, 他們中任何一個人干預的可能性就越小。

你覺得工位邊上的持續(xù)集成流水線健康狀況顯示器,其實就再現(xiàn)了一個責任稀釋的場景??吹郊t色/黃色告警的開發(fā)人員,都會覺得其他開發(fā)人員已經看到并處理了,于是不再采取行動。

你從書中了解到,在1968年,兩位社會心理學家用實驗模擬了一個人命關天的緊急情況。實驗結果發(fā)現(xiàn),當受試者面臨要出人命的緊急情況,并意識到周圍有4個旁觀者時,只有31%的概率會去施救。若旁觀者下降為2人,施救的概率上升到62%。當周圍沒有旁觀者,施救的概率會達到85%(如圖)。

圖:當周圍沒有旁觀者,受試者施救的概率會達到85%

我在“吾真本說混沌工程”知乎專欄的文章“做軟件的人不被他人忽悠的唯一方法”里,說只有自己動手做有對照組的科學實驗,才能避免被忽悠。

為了避免被忽悠,你覺得可以設計一個實驗,來找到提升自己團隊流水線問題修復及時性的方法。

該如何設計這個實驗?

我在下面幫你列出這個實驗的6個步驟和具體實施方法。你可以根據(jù)團隊具體情況,做適當?shù)恼{整。如果遇到問題,歡迎在評論區(qū)留言,與我交流。

1 基于觀察

放置在工位附近顯眼位置的持續(xù)集成流水線健康顯示屏,就是一個擺設。團隊中的5位開發(fā)人員平時根本就不關注。即使顯示屏變紅/黃好幾天了,也無人修復。

2 問出問題

是什么阻礙了開發(fā)人員,讓他們即使看到了顯示屏的紅色/黃色告警,也不及時修復流水線問題?

3 形成可驗證的解釋性假說

根據(jù)“責任稀釋假說“,目睹流水線紅色/黃色告警的開發(fā)人員越多, 他們中任何一個人修復流水線問題的可能性就越小。

4 基于假說做出預測

如果將工位附近的流水線健康顯示屏撤掉,并要求每位開發(fā)人員,在向流水線合并代碼后,需要通過自己的電腦顯示器,觀察流水線健康狀態(tài)。直到狀態(tài)變?yōu)榻】档木G色,才算合并成功。若其間發(fā)現(xiàn)紅色/黃色告警,因為只有她/他一人在場,周圍沒有旁觀者,那么她/他主動修復流水線所發(fā)現(xiàn)的問題的概率會達到最大。

5 設計并執(zhí)行有對照組的實驗檢驗預測

你需要設法吸引IT部門負責人對這個實驗感興趣,并獲得她/他的支持,比如幫助你找到另一個同樣有5人左右開發(fā)人員的開發(fā)團隊作為對照組,并獲得那個開發(fā)團隊負責人的支持。而你所在的團隊,可以作為實驗組。

由IT部門負責人和實驗組與對照組這兩個開發(fā)團隊負責人,三人成立實驗小組。

為了讓實驗結果不會因為實驗組和對照組兩個開發(fā)團隊的開發(fā)人員,因相互攀比而有損數(shù)據(jù)的準確性,該實驗從始至終秘密進行。即實驗的事情,只有實驗小組的那三人知道。若其他人問起實驗過程中一些事情的緣由,比如為何撤銷顯示屏,可以編一個理由,比如其他團隊臨時借用。總之不要透露正在開展的實驗和實驗意圖。

在實驗開始前,兩個開發(fā)團隊的負責人,需要各自準備好流水線健康狀況觀測工具。比如能通過工具,觀測出流水線何時出問題變紅/黃,何時修復好變綠??梢栽O置一個及時修復的時長范圍。比如流水線每次從變紅/黃到變綠之間,沒有超過4小時,算及時修復。否則,就不算。

對照組在工位顯眼位置,擺放一個大顯示器,并接上持續(xù)集成流水線。對照組團隊負責人在實驗開始前一天,召集所有開發(fā)人員,告訴他們一旦流水線運行出現(xiàn)問題,顯示器顯示告警的紅色/黃色畫面,團隊中無論誰看到了紅色/黃色告警,第一時間就要放下手中工作,及時修復流水線。團隊中的其他人,也要配合這位同事的修復工作。

實驗組則悄悄撤銷工位附近的流水線健康顯示屏。實驗組團隊負責人,就是你,在實驗開始前一天,召集所有開發(fā)人員,要求他們在向流水線合并代碼后,需要通過自己的電腦顯示器,而不是工位附近的流水線健康顯示屏,觀察流水線健康狀態(tài)。只有健康狀況變?yōu)榫G色,才算合并成功。若發(fā)現(xiàn)紅色/黃色告警,就需要立即修復。其他開發(fā)人員在修復期間,需要積極配合。

設置一個開展實驗時間段,比如6周。兩個團隊同時開展實驗,并同時采集數(shù)據(jù)。

每2周作為一個迭代。實驗小組在迭代末就開一次碰頭會,分析和對比這2周采集的觀測數(shù)據(jù),即這2周流水線問題及時修復的百分比。

6 根據(jù)實驗結果可回到第3步不斷迭代優(yōu)化假說/預測/實驗過程

到第6周結束,總結和對比這3個迭代實驗組和對照組流水線問題及時修復百分比。根據(jù)實驗數(shù)據(jù),看看是否支持第4步的預測,并決定是否回到第3步,改進假說、預測或實驗過程。

如果在實驗過程中遇到問題,歡迎在評論區(qū)留言,與我交流。

如果覺得本文對你有幫助,歡迎點贊,點擊在讀,并轉發(fā)給其他經常受流水線問題修復不及時之害的小伙伴。你覺得提升流水線問題修復及時性,還有什么其他好辦法你還希望我聊有關做軟件的其他什么新話題?歡迎在評論區(qū)留言。我會仔細閱讀每一條留言。期待聽到你的聲音。


企業(yè)生意蒸蒸日上,軟件系統(tǒng)穩(wěn)定運行。你所閱讀的文章,來自“吾真本說混沌工程”知乎專欄。

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容