python 交叉分析

分析思路:

1.導(dǎo)入必要的包(pandas,numpy,scipy.stats,matplotlib.pyplot,seaborn)

2.讀取文件,為df

3.按 department 分組并獲得索引 dp_indices ;

4.?得到分組后 dp_indices 的keys鍵;

5.初始化一個矩陣 dp_t_mat ,矩陣的寬和高都是len(dp_keys);

6.行(i)列(j)各自遍歷每個數(shù)據(jù)后,通過 left 行號索引對應(yīng)行keys的數(shù)據(jù),用 scipy.stats.ttest 求交叉后 t 檢驗的 p 值;

7.如果 t 檢驗的P值小于0.05賦-1,否則等于P(這步是讓heatmap繪出的圖形,更加具有區(qū)分性);

8.把P值賦給矩陣;

9.繪制圖形

(注意:t 檢驗的p值越小,二者差異越大,越不相關(guān))

交叉分析實現(xiàn)代碼
heatmap繪制出的圖形
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容