本章講一些基礎(chǔ)的代碼,有不懂的可以查詢R語(yǔ)法查詢網(wǎng)站
-
rep
即是Replicate Elements of Vectors and Lists 重復(fù)向量和列表中的元素
rep -
runif
即是平均分布的一組數(shù),runif(235)表示產(chǎn)生235個(gè)min=0,max=1的隨機(jī)數(shù)。
runif -
rnorm
即是正態(tài)分布的一組數(shù),rnorm(100)表示產(chǎn)生100個(gè)均數(shù)為0,標(biāo)準(zhǔn)差為1的隨機(jī)數(shù)。
rnorm R里面遵循先行后列
nrow= ,ncol=-
邏輯判斷
TRUEorFALSE
logical
==是判斷,=是賦值 -
seq生成序列,跨度是1的序列,sequence
seq(1,9)
序列 ls()list objects 列舉當(dāng)前環(huán)境中所有的變量
rm(list=ls())remove,清除當(dāng)前環(huán)境中的變量-
儲(chǔ)存變量
save(數(shù)據(jù)1,數(shù)據(jù)2,file='名稱.Rdata')for example
代碼
數(shù)據(jù)
變量 轉(zhuǎn)化成數(shù)據(jù)框
as.data.frame( ),把向量轉(zhuǎn)化成數(shù)據(jù)框。給數(shù)據(jù)框添加一列,賦值。
data1[,2] <- 'male',本身只有一列的數(shù)據(jù)框添加了一列值都為male的數(shù)據(jù)。按行合并兩個(gè)數(shù)據(jù)框
rbind(data1,data2)ggplot2 畫直方圖用密度函數(shù)來(lái)畫要加上
geom_histogram(stat='density'),分面用facet_gride( )括號(hào)里放分面參數(shù)。length( )的括號(hào)里必須是向量,統(tǒng)計(jì)里面有多少個(gè)數(shù)-
gl()函數(shù),gl(2,5)生成具有兩個(gè)因子水平,每個(gè)因子水平重復(fù)5次的因子。
class()查看第一層類別,mode()查看第二層類別,typeof()查看第三層類別。
類別 檢驗(yàn)數(shù)據(jù)是否符合正態(tài)分布,三種檢驗(yàn)方法:
- qq圖
qqnorm(data1[,1])#先生成一系列點(diǎn)
qqline(data1[,1],col='darkred')#看點(diǎn)是否在線上
- 夏皮羅威克爾檢驗(yàn)
shapiro.test(sample(data1[,1],5000))
這個(gè)檢驗(yàn)最多只能用5000個(gè)數(shù)據(jù),所以只能取樣。

p值>0.05即有效,符合正態(tài)分布
- KS檢驗(yàn)
ks.test(
data1[,1],
rnorm(10000,mean=mean(data1[,1]),sd=sd(data1[,1]))
)
將原數(shù)據(jù)與以原數(shù)據(jù)的平均數(shù)為值,標(biāo)準(zhǔn)差為值的一組隨機(jī)正態(tài)分布數(shù)作比較。

也是p值>0.05即可。
- 正態(tài)分布的四個(gè)函數(shù)應(yīng)用。
#關(guān)于正態(tài)分布的4個(gè)函數(shù)及其應(yīng)用
#由已知的正態(tài)分布總體來(lái)分析個(gè)體
#已知某大學(xué)男性畢業(yè)生收入的均值為7000,標(biāo)準(zhǔn)差為2000,求:
#1.1若甲同學(xué)的收入大于80%的人,那么他的收入是多少呢?(由概率求值問題)
qnorm(0.8,mean=7000,sd=2000)
#1.2乙同學(xué)收入為8500左右的概率是多少?(點(diǎn)概率問題)
dnorm(8500,mean=7000,sd=2000)
#1.3已知丙同學(xué)的收入為9000,他的收入會(huì)比百分之多少的人高?(區(qū)間概率問題)
pnorm(9000,mean=7000,sd=2000)

一般正態(tài)分布轉(zhuǎn)換成標(biāo)準(zhǔn)正態(tài)分布
若隨機(jī)變量X~N(),則有Z=
~N(0,1)
因子factor可以看成是分類變量,轉(zhuǎn)化成因子
factor()
Grade <- c('Low','Medium','High')
Grade.f <- factor(Grade,order=T,levels=c('Low','Medium','High'))

轉(zhuǎn)化成字符串
as.character( ),轉(zhuǎn)化成數(shù)值型as.numeric( )。導(dǎo)入數(shù)據(jù),F(xiàn)ile>Import Dataset>選擇類型
which函數(shù)的應(yīng)用,用于條件的篩選
a <- c(12,34,56,86,11,16)
which(a>30)









