從肆開始的R學(xué)習(xí)之路

本章講一些基礎(chǔ)的代碼,有不懂的可以查詢R語(yǔ)法查詢網(wǎng)站

  1. rep
    即是Replicate Elements of Vectors and Lists 重復(fù)向量和列表中的元素

    rep

  2. runif
    即是平均分布的一組數(shù),runif(235)表示產(chǎn)生235個(gè)min=0,max=1的隨機(jī)數(shù)。

    runif

  3. rnorm
    即是正態(tài)分布的一組數(shù),rnorm(100)表示產(chǎn)生100個(gè)均數(shù)為0,標(biāo)準(zhǔn)差為1的隨機(jī)數(shù)。

    rnorm

  4. R里面遵循先行后列
    nrow= ,ncol=

  5. 邏輯判斷 TRUEorFALSE

    logical

    ==是判斷,=是賦值

  6. seq 生成序列,跨度是1的序列,sequence
    seq(1,9)

    序列

  7. ls()list objects 列舉當(dāng)前環(huán)境中所有的變量
    rm(list=ls())remove,清除當(dāng)前環(huán)境中的變量

  8. 儲(chǔ)存變量save(數(shù)據(jù)1,數(shù)據(jù)2,file='名稱.Rdata') for example

    代碼

    數(shù)據(jù)

    變量

  9. 轉(zhuǎn)化成數(shù)據(jù)框 as.data.frame( ),把向量轉(zhuǎn)化成數(shù)據(jù)框。

  10. 給數(shù)據(jù)框添加一列,賦值。data1[,2] <- 'male',本身只有一列的數(shù)據(jù)框添加了一列值都為male的數(shù)據(jù)。

  11. 按行合并兩個(gè)數(shù)據(jù)框 rbind(data1,data2)

  12. ggplot2 畫直方圖用密度函數(shù)來(lái)畫要加上geom_histogram(stat='density') ,分面用facet_gride( )括號(hào)里放分面參數(shù)。

  13. length( )的括號(hào)里必須是向量,統(tǒng)計(jì)里面有多少個(gè)數(shù)

  14. gl()函數(shù),gl(2,5)生成具有兩個(gè)因子水平,每個(gè)因子水平重復(fù)5次的因子。
    class()查看第一層類別,mode()查看第二層類別,typeof()查看第三層類別。

    類別

  15. 檢驗(yàn)數(shù)據(jù)是否符合正態(tài)分布,三種檢驗(yàn)方法:

  • qq圖
qqnorm(data1[,1])#先生成一系列點(diǎn)
qqline(data1[,1],col='darkred')#看點(diǎn)是否在線上
  • 夏皮羅威克爾檢驗(yàn)
shapiro.test(sample(data1[,1],5000))

這個(gè)檢驗(yàn)最多只能用5000個(gè)數(shù)據(jù),所以只能取樣。


夏皮羅威克爾檢驗(yàn)

p值>0.05即有效,符合正態(tài)分布

  • KS檢驗(yàn)
ks.test(
  data1[,1],
  rnorm(10000,mean=mean(data1[,1]),sd=sd(data1[,1]))
)

將原數(shù)據(jù)與以原數(shù)據(jù)的平均數(shù)為值,標(biāo)準(zhǔn)差為值的一組隨機(jī)正態(tài)分布數(shù)作比較。


ks檢驗(yàn)

也是p值>0.05即可。

  1. 正態(tài)分布的四個(gè)函數(shù)應(yīng)用。
#關(guān)于正態(tài)分布的4個(gè)函數(shù)及其應(yīng)用
#由已知的正態(tài)分布總體來(lái)分析個(gè)體
#已知某大學(xué)男性畢業(yè)生收入的均值為7000,標(biāo)準(zhǔn)差為2000,求:
#1.1若甲同學(xué)的收入大于80%的人,那么他的收入是多少呢?(由概率求值問題)
qnorm(0.8,mean=7000,sd=2000)

#1.2乙同學(xué)收入為8500左右的概率是多少?(點(diǎn)概率問題)
dnorm(8500,mean=7000,sd=2000)

#1.3已知丙同學(xué)的收入為9000,他的收入會(huì)比百分之多少的人高?(區(qū)間概率問題)
pnorm(9000,mean=7000,sd=2000)
計(jì)算題
  1. 一般正態(tài)分布轉(zhuǎn)換成標(biāo)準(zhǔn)正態(tài)分布
    若隨機(jī)變量X~N(\mu,\sigma),則有Z=X-\mu\over \sigma~N(0,1)

  2. 因子factor可以看成是分類變量,轉(zhuǎn)化成因子factor()

Grade <- c('Low','Medium','High')
Grade.f <- factor(Grade,order=T,levels=c('Low','Medium','High'))
因子
  1. 轉(zhuǎn)化成字符串as.character( ),轉(zhuǎn)化成數(shù)值型as.numeric( )。

  2. 導(dǎo)入數(shù)據(jù),F(xiàn)ile>Import Dataset>選擇類型

  3. which函數(shù)的應(yīng)用,用于條件的篩選

a <- c(12,34,56,86,11,16)
which(a>30)
返回位數(shù),所在位置
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • R中常見函數(shù) 1、對(duì)行和列進(jìn)行操作的函數(shù): ?對(duì)矩陣或數(shù)據(jù)框的行和列調(diào)用函數(shù):apply(矩陣/數(shù)組,1,func...
    蘋果皮好多皮閱讀 551評(píng)論 0 0
  • --title: R語(yǔ)言中dnorm, pnorm, qnorm與rnorm以及隨機(jī)數(shù)date: 2018-09-...
    backup備份閱讀 69,738評(píng)論 1 29
  • 20171205(從有道遷移) 高級(jí)數(shù)據(jù)管理 示例問題:給所有學(xué)生確定一個(gè)單一的成績(jī)衡量指標(biāo),需要將這些科目的成績(jī)...
    KrisKC閱讀 541評(píng)論 0 0
  • 劉小澤寫于18.8.29-30 R函數(shù)是什么? 其實(shí)就是對(duì)一些編程語(yǔ)言的封裝,編寫函數(shù)可以減少重復(fù)代碼的書寫,讓R...
    劉小澤閱讀 3,485評(píng)論 0 6
  • 魯迅先生對(duì)于中醫(yī)的態(tài)度我始終很納悶。雖說(shuō)暇不掩玉,但以他的地位與聲望,對(duì)于中醫(yī)的傷害是顯而易見的。現(xiàn)代所謂...
    花癡_halou閱讀 1,009評(píng)論 5 4

友情鏈接更多精彩內(nèi)容