2.3 數(shù)據(jù)輸入
如圖2-2所示,R可從鍵盤、文本文件、Microsoft Excel和Access、流行的統(tǒng)計軟件、特殊格式的文件、多種關(guān)系型數(shù)據(jù)庫管理系統(tǒng)、專業(yè)數(shù)據(jù)庫、網(wǎng)站和在線服務(wù)中導(dǎo)入數(shù)據(jù)。

2.3.1 使用鍵盤輸入數(shù)據(jù)
也許輸入數(shù)據(jù)最簡單的方式就是使用鍵盤了。有兩種常見的方式:用R內(nèi)置的文本編輯器和直接在代碼中嵌入數(shù)據(jù)。我們首先考慮文本編輯器。
R中的函數(shù)edit()會自動調(diào)用一個允許手動輸入數(shù)據(jù)的文本編輯器。具體步驟如下:
(1) 創(chuàng)建一個空數(shù)據(jù)框(或矩陣),其中變量名和變量的模式需與理想中的最終數(shù)據(jù)集一致;
(2) 針對這個數(shù)據(jù)對象調(diào)用文本編輯器,輸入你的數(shù)據(jù),并將結(jié)果保存回此數(shù)據(jù)對象中。
在下例中,你將創(chuàng)建一個名為mydata的數(shù)據(jù)框,它含有三個變量:age(數(shù)值型)、gender
(字符型)和weight(數(shù)值型)。然后你將調(diào)用文本編輯器,鍵入數(shù)據(jù),最后保存結(jié)果。
mydata <- data.frame(age=numeric(0),
gender=character(0), weight=numeric(0))
mydata <- edit(mydata)
2.3.2 從帶分隔符的文本文件導(dǎo)入數(shù)據(jù)
你可以使用read.table()從帶分隔符的文本文件中導(dǎo)入數(shù)據(jù)。此函數(shù)可讀入一個表格格式的文件并將其保存為一個數(shù)據(jù)框。表格的每一行分別出現(xiàn)在文件中每一行。其語法如下。
mydataframe <- read.table(file, options)
其中,file是一個帶分隔符的ASCII文本文件,options是控制如何處理數(shù)據(jù)的選項。表2-2列出了常見的選項。


函 數(shù) read.table()還 擁 有 許 多 微 調(diào) 數(shù) 據(jù) 導(dǎo) 入 方 式 的 追 加 選 項 。 更 多 詳 情 , 請 參 閱help(read.table)。

2.3.3 導(dǎo)入 Excel 數(shù)據(jù)
讀取一個Excel文件的最好方式,就是在Excel中將其導(dǎo)出為一個逗號分隔文件(csv),并使用前文描述的方式將其導(dǎo)入R中。
library(xlsx)
workbook <- "c:/myworkbook.xlsx"
mydataframe <- read.xlsx(workbook, 1)
更多的導(dǎo)入數(shù)據(jù)類型可以 自行進行學(xué)習(xí),最常用的就是read.table()和read.csv()
R語言實戰(zhàn)(第2版):第一章 R語言介紹
R語言實戰(zhàn)(第2版):第二章 創(chuàng)建數(shù)據(jù)集(01)
R語言實戰(zhàn)(第2版):第二章 創(chuàng)建數(shù)據(jù)集(02)