今天學(xué)習(xí)的內(nèi)容是R和Rstudio的安裝,以及R的基礎(chǔ)操作。學(xué)習(xí)資源主要有:
一、認(rèn)識(shí)R與Rstudio
- R:一種編程語(yǔ)言,匯集了許多函數(shù),能夠提供統(tǒng)計(jì)、繪圖等強(qiáng)大功能。
- Rstudio:R語(yǔ)言軟件界面簡(jiǎn)陋,圖形界面的Rstudio能夠使R更方便使用。RStudio是免費(fèi)提供的開(kāi)源集成開(kāi)發(fā)環(huán)境(IDE)。
二、安裝R與Rstudio
我的電腦之前已經(jīng)安裝了這兩個(gè)軟件,為了學(xué)習(xí)的完整性,還是要梳理一下整個(gè)安裝的過(guò)程。并且,安裝會(huì)涉及用戶名中英文的問(wèn)題,我在首次安裝的時(shí)候沒(méi)有遇到,這次記錄了如果用戶名是英文,該怎么修改的方法。
1. 查看電腦用戶名是中文還是英文
查看任意一個(gè)桌面文件的路徑,Desktop的上一級(jí)就是用戶名。
2. 修改用戶名
如果用戶名是中文,則需要修改
電腦搜索欄 - 控制面板 - 環(huán)境變量 - 修改TEMP、TMP為不帶中文的路徑 - 重啟電腦
注:所有自己的重要文件要云備份:堅(jiān)果云、iCloud云盤(pán)都是非常好的雙向同步云
3.下載R與Rstudio
登錄官網(wǎng)后,按文末思維導(dǎo)圖的指引進(jìn)行操作,比較簡(jiǎn)單,不贅述。下載好之后,打開(kāi)Rstudio,界面長(zhǎng)這樣:
三、Rstudio基本操作
1. 設(shè)置字體大小
Tools - Global Options - Appearance
2. 用Rproject管理工作目錄
新建project - New Directory - New project - 設(shè)置文件名、路徑 - 在文件夾里打開(kāi)project
3. 顯示文件列表
getwd:顯示當(dāng)前路徑
setwd:設(shè)置當(dāng)前路徑,注意,直接復(fù)制電腦的路徑過(guò)來(lái),要把/改為\,否則識(shí)別不了
dir()、list.files():顯示當(dāng)前路徑有哪些文件
4.數(shù)學(xué)運(yùn)算
加:a+b
減:a-b
乘:a*b
除:a/b
平方:a^b
開(kāi)方:sqrt()
求絕對(duì)值:abs()
取對(duì)數(shù):loga(b)
5. 賦值
用<-或->賦值,箭頭指向?qū)ο?,Alt+-可以打出。例如:x <-5
6. 刪除
刪除對(duì)象:rm()
刪除所有變量:rm(list = ls())
7. 歷史命令
history()
8. 清空控制臺(tái)
Ctrl+l
四、嘗試做幾個(gè)圖
- plot()函數(shù)
詳情參考:
- R語(yǔ)言基礎(chǔ)備忘-plot()詳解
- 聽(tīng)說(shuō)你還不會(huì) plot 函數(shù)? (這個(gè)鏈接講得很好理解)
plot()函數(shù)是基礎(chǔ) R 包 graphics 里的函數(shù),對(duì)于繪制一些簡(jiǎn)單基礎(chǔ)的圖形完全可以,想要繪制復(fù)雜一點(diǎn)的也是完全可以。
做一個(gè)圖試試:代碼如下
a<-c(1:5)
b<-c(2:6)
plot(a,b,type = "p",main="圖1",xlab="橫軸",ylab="縱軸",col="red")
定義變量a為1到5的整數(shù),定義變量b為2到6的整數(shù),圖的類型是點(diǎn)圖,標(biāo)題為“圖1”,橫軸標(biāo)注為“橫軸”,縱軸標(biāo)注為“縱軸”,圖形顏色是紅色。
-
rnorm()函數(shù)
rnorm(n, mean = 0, sd = 1)
n 為產(chǎn)生隨機(jī)值個(gè)數(shù)(長(zhǎng)度),mean 是平均數(shù), sd 是標(biāo)準(zhǔn)差 ,rnorm() 函數(shù)呈隨機(jī)正態(tài)分布,隨機(jī)抽樣或者取值 n 次。
plot(rnorm(10,5,1))的圖像如下:
圖2 -
runif()函數(shù)
runif()和rnorm()都是用于隨機(jī)生成數(shù)值的函數(shù),但是有區(qū)別。注意對(duì)比兩者圖像的差異。
runif(n, min = 0, max = 1)
n為產(chǎn)生隨機(jī)值的個(gè)數(shù),min為最小值,max為最大值。
plot(runif(10,1,5))的圖像如下:
圖3.PNG -
boxplot()函數(shù)
boxplot()用于繪制箱線圖??山o出變量的中心趨勢(shì),發(fā)散情況和離群值。
箱子中間的線代表中位數(shù),表示平均水平;箱子上下兩條邊分別代表第三、第一個(gè)四分位數(shù),箱子的長(zhǎng)度可反應(yīng)數(shù)據(jù)的離散情況;箱子外的上下兩條線代表最大最小值,線外的點(diǎn)可能為離群值。
boxplot(iris$Sepal.Length~iris$Species,col = c("lightblue","lightyellow","lightpink"))
表示繪制一個(gè)箱線圖,呈現(xiàn)不同種類鳶尾花的花萼長(zhǎng)度的統(tǒng)計(jì)情況,箱子的顏色分別為淺藍(lán),淺黃,淺粉。
圖4
注:iris是一個(gè)R語(yǔ)言自帶的數(shù)據(jù)框,通常用作示例。iris$Sepal.Length表示iris數(shù)據(jù)框的Sepal.Length這一列數(shù)據(jù)。以此類推。