Day-6 lzyazcr
R語言的第三天
鏡像配置
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
R包安裝
install.packages("dplyr")
R包加載
library(dplyr)
簡(jiǎn)版iris數(shù)據(jù)集:
Iris :鳶尾花數(shù)據(jù)集,包含 3 類共 150 條記錄,每類各 50 個(gè)數(shù)據(jù),每條記錄都有 4 項(xiàng)特征:花萼長(zhǎng)度、花萼寬度、花瓣長(zhǎng)度、花瓣寬度,可以通過這4個(gè)特征預(yù)測(cè)鳶尾花卉屬于(iris-setosa, iris-versicolour, iris-virginica)中的哪一品種
test <- iris[c(1:2,51:52,101:102),]
兩個(gè)小技巧
1:管道操作 %>% (cmd/ctr + shift + M)(加載任意一個(gè)tidyverse包即可用管道符號(hào))
test %>%
group_by(Species) %>%
summarise(mean(Sepal.Length), sd(Sepal.Length))
減少工作量,簡(jiǎn)化代碼,必備R包:magrittr
2:count統(tǒng)計(jì)某列的unique值
count(test,Species)
unique值:返回參數(shù)數(shù)組中所有不同的值,并按照從小到大排序
數(shù)據(jù)關(guān)系處理.png

數(shù)據(jù)關(guān)系處理.png

dplry五種常用函數(shù).png