RRA是一種對(duì)排名進(jìn)行整合,獲得一個(gè)綜合性排名列表的算法。
- 原始排名 -> 相對(duì)值
- 對(duì)于每個(gè)基因,對(duì)應(yīng)的rank vector r=(r1, ..., rn)
- RRA computes a P-value ρk for the kth smallest value based on the beta distribution.
若??(??)是??(0,1)的第??個(gè)次序統(tǒng)計(jì)量,則
??(??)~??(??,?????+1). - 如果一個(gè)基因一共在n個(gè)樣本內(nèi)出現(xiàn),則其排名向量?jī)?nèi)有n個(gè)排名,所以假設(shè)檢驗(yàn)后也會(huì)獲得n個(gè)p值。取其中最小的p值來(lái)代表這個(gè)基因。稱之為rho score。Rho score = min (pij)
- Rho score不是精確的p值,當(dāng)總的基因數(shù)不是很多(~100)的時(shí)候,原文建議可以使用bonferroni校正rho score,得到的padj很接近p值的上界。
參考資料
- 「R」Robust Rank Aggregation 算法介紹 - 云+社區(qū) - 騰訊云
- Robust rank aggregation for gene list integration and meta-analysis
- 排名聚合之前的常用算法:[技術(shù)博客] 較科學(xué)的排名算法介紹與實(shí)現(xiàn) - 提不起勁想趕緊完工 - 博客園
- 博士論文:跨平臺(tái)芯片數(shù)據(jù)整合分析挖掘胃癌潛在關(guān)鍵基因構(gòu)建預(yù)后評(píng)估模型及其生物學(xué)功能研究 2.2.4
- 數(shù)理統(tǒng)計(jì)4:均勻分布的參數(shù)估計(jì),次序統(tǒng)計(jì)量的分布,Beta分布 - 江景景景頁(yè) - 博客園