R的入門
我用的是MacBook pro的macOS系統(tǒng),所以有一些代碼會與Win系統(tǒng)的小伙伴有一些差別。
關(guān)于R的下載:https://www.r-project.org
另外推薦下載RStudio,它是一款R的編輯器,界面比R更加友好,且有一些自動補全等。平時大家還可以用RStudio提供的Rmarkdown平臺寫代碼,比較方便保存、修改。
下載地址:https://www.rstudio.com

本次練習所用到的數(shù)據(jù):https://pan.baidu.com/s/1jHX1ZOM
數(shù)據(jù)的導(dǎo)入
首先將數(shù)據(jù)a-1.txt下載到自己的電腦,然后打開查看:
沒錯,我們有很多很多條數(shù)據(jù),也許我們可以用excel打開它并計算平均數(shù)等值,但是顯然excel一定會卡爆。另外,我們可以觀察到第一行是‘x’并非一個數(shù)值而是這一列數(shù)據(jù)的名稱,也就是我們常說的header。

接著我們打開RStudio/R軟件。
此時要注意當前工作路徑是否與數(shù)據(jù)保存的路徑一致,不然會發(fā)生報錯說文件不存在。

1.在R語言中,會看報錯十分關(guān)鍵。建議大家不要使用中文版本,雖然你會發(fā)現(xiàn)中文比較容易看懂,但是當在瀏覽器中搜索中文版的報錯時,幾乎給不了你任何解答。
2.我們在保存文件的時候要學會使用英文,因為你會發(fā)現(xiàn)用中文在讀取文件以及使用其他各種指令的時候真的各種不方便。
3.在輸入R代碼的時候務(wù)必注意時英文輸入法,用中文的各種標點符合都可能會出現(xiàn)錯誤。
改變工作路徑
getwd()命令可以得知我們當前的工作路徑。
setwd()命令可以讓我們修改工作路徑。

當然很多人可能并不能很快速地輸入這一串的路徑,沒有關(guān)系我們也可以用傻瓜式的點擊辦法:

然后選擇到你保存a-1.txt文件的目錄里即可。
read.table('a_1.txt',header=T)
a<-read.table('a_1.txt',header=T)#讀取a_1.txt并保存到a
b<-read.table('a_1.txt')#讀取a_1.txt并保存到b
上述三行代碼有所不同:
第一行并未保存,因此你輸入后會直接將讀取的結(jié)果顯示在屏幕上,并無法進一步處理它。
第二行與第三行都將讀取的數(shù)據(jù)存儲到一個變量中,而第二行的a將header設(shè)置為T(TRUE),也就是R不會把x當成一個值讀入,而會認為它是一個header。但是b則把x也當作一個值。
此時,RStudio就顯示出其的優(yōu)越性,點擊右上框中b后面的表格圖樣我們便可在左上框查看其數(shù)據(jù)。我們會發(fā)現(xiàn)其header為V1。

計算數(shù)據(jù)的概括性度量
attach(a)#該指令可以讓我們直接用表中的變量名
mean(x)#計算平均值
sum(x)#計算總和
max(x)#尋找最大值
min(x)#尋找最小值
range(x)#x的范圍
median(x)#計算中位值
var(x)#計算方差
sd(x)#計算標準差

當然我們還有其他很酷的函數(shù)可以用于描述性分析,可以讓我們一下子看到多個統(tǒng)計量。
#用summary()函數(shù)進行描述性分析
summary(x)
#用Hmisc包中的describe()進行描述分析
library(Hmisc)#在使用之前要進行包的安裝
describe(x)
#用psych包中的describe()進行描述分析
library(psych)#在使用之前要進行包的安裝
describe(x)



另外我們還可以用boxplot(x)制作箱型圖

那么箱型圖怎么看呢?

那么,第一次的練習就到此為止。關(guān)于包的加載等大家可以自己百度學習一下?!?/p>