R語(yǔ)言match函數(shù)的應(yīng)用舉例

數(shù)據(jù)篩選是在分析中最常用的步驟,如數(shù)據(jù)挖掘分析中,從TCGA或GEO得到的表達(dá)矩陣要不斷篩選,來(lái)進(jìn)行數(shù)據(jù)整理。
match函數(shù)是生信技能樹(shù)生信爆款入門(mén)課程R語(yǔ)言部分的講到的一個(gè)重要知識(shí)點(diǎn)。
為加深理解,現(xiàn)在找一個(gè)數(shù)據(jù)集做下練習(xí)鞏固。

官方說(shuō)明文檔:

match
match:匹配兩個(gè)向量,返回第二個(gè)向量在第一個(gè)向量匹配位置的下標(biāo)值。
match函數(shù)使用格式有如下兩種:
第一種方便設(shè)置參數(shù),返回x中元素在table中的位置
match(x, table, nomatch = NA_integer_, incomparables = NULL)
第二種簡(jiǎn)潔,返回x中每個(gè)元素在table中是否存在
x %in% table

參數(shù)詳解

x: 向量, 要匹配的值;
table: 向量, 被匹配的值;
nomatch: 沒(méi)匹配上的返回值, 必須是整數(shù);
incomparables: 指定不能用來(lái)匹配的值.

match函數(shù)是一個(gè)完全匹配函數(shù), 當(dāng)兩個(gè)元素類(lèi)型不一樣時(shí), 如果進(jìn)行類(lèi)型轉(zhuǎn)換后匹配得上的話, 則仍可匹配, 可看下例.

match(c(1, "TRUE"), c(T, 0, "1"))
返回3 1,
即1位于表中的3號(hào)位,TRUE位于1號(hào)位,且T和TRUE可匹配成功

c(1, "TRUE", F) %in% c(T, 0, "1")
返回TRUE TRUE FALSE,
表示每個(gè)元素在table中是否存在

舉例練習(xí)如下:

生成測(cè)試數(shù)據(jù):
library(tidyverse)
diamonds
> x <- colnames(diamonds)[1:5]
> x
[1] "carat"   "cut"     "color"   "clarity" "depth"  
> y <- colnames(diamonds)[1:10]
> y
 [1] "carat"   "cut"     "color"   "clarity" "depth"   "table"   "price"   "x"       "y"      
[10] "z"      
> z <- colnames(diamonds)[seq(1,10,2)]
> z
[1] "carat" "color" "depth" "price" "y"    

1.使用match函數(shù)找出x中每個(gè)元素在y中的位置

> match(x,y)
[1] 1 2 3 4 5

2.使用match函數(shù)找出y中每個(gè)元素在x中的位置

> match(y,x)
 [1]  1  2  3  4  5 NA NA NA NA NA

3.判斷z中的元素是否都在x中

> z %in% x
[1]  TRUE  TRUE  TRUE FALSE FALSE

4.z中元素都在y的什么位置?

> match(z,y)
[1] 1 3 5 7 9

5.z中有多少個(gè)元素在y中?

 sum(z %in% y)
[1] 5

6.挑出y里面有z中沒(méi)有的數(shù)值。

 y[-match(z,y)]
[1] "cut"     "clarity" "table"   "x"       "z"      

7.x和z中有幾個(gè)相同元素?,都是哪些元素?

> sum(x %in% z)
[1] 3
> z[x %in% z]
[1] "carat" "depth" "y"   

8.z中和y相同的元素都有哪些?

> y[match(z,y)]
[1] "carat" "color" "depth" "price" "y"    

9.x和z中相同的元素都有哪些?

> x[x %in% z]
[1] "carat" "color" "depth"

10.使用match刪除y中與z重復(fù)的值

> y[-match(z,y)]
[1] "cut"     "clarity" "table"   "x"       "z"      

參考
R語(yǔ)言:數(shù)據(jù)篩選match

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 1.變量轉(zhuǎn)換 is.datatype():判斷變量種類(lèi) as.datatype():轉(zhuǎn)換變量類(lèi)型其中,dataty...
    caoqiansheng閱讀 537評(píng)論 0 3
  • 函數(shù)的編寫(xiě) 參考文章 格式如下所示: 函數(shù)案例A 輸入直角三角形的兩個(gè)邊長(zhǎng),求斜邊長(zhǎng) 運(yùn)行結(jié)果如下所示: 函數(shù)案例...
    天涯清水閱讀 6,089評(píng)論 3 7
  • R語(yǔ)言與數(shù)據(jù)挖掘:公式;數(shù)據(jù);方法 R語(yǔ)言特征 對(duì)大小寫(xiě)敏感 通常,數(shù)字,字母,. 和 _都是允許的(在一些國(guó)家還...
    __一蓑煙雨__閱讀 1,816評(píng)論 0 5
  • —————————第一部分[三維數(shù)據(jù)結(jié)構(gòu)]——————— 一、三維數(shù)據(jù)結(jié)構(gòu) 數(shù)組概況: 二維數(shù)據(jù)結(jié)構(gòu)——矩陣↓疊加...
    ShanSly閱讀 822評(píng)論 0 4
  • 推薦指數(shù): 6.0 書(shū)籍主旨關(guān)鍵詞:特權(quán)、焦點(diǎn)、注意力、語(yǔ)言聯(lián)想、情景聯(lián)想 觀點(diǎn): 1.統(tǒng)計(jì)學(xué)現(xiàn)在叫數(shù)據(jù)分析,社會(huì)...
    Jenaral閱讀 5,950評(píng)論 0 5

友情鏈接更多精彩內(nèi)容