一:手動(dòng)輸入
1.利用鍵盤輸入
列入下面數(shù)據(jù)

需要導(dǎo)入的數(shù)據(jù)
通過保存變量,然后整合成數(shù)據(jù)框。
# 病人編號(hào)
patientID = c(1,2,3,4)
# 入院時(shí)間
admDate = c("10/15/2009","11/01/2009","10/21/2009","10/28/2009")
# 年齡
age = c(25,34,28,52)
# 糖尿病類型
diabetes = c("Type1","Type2","Type1","Type1")
# 病情
status = c("Poor","Improved","Excellent","Poor")
生成5個(gè)變量,再定義一個(gè)數(shù)據(jù)庫,依次輸入5個(gè)變量。
data = data.frame(patientID,admDate,age,diabetes,status)

結(jié)果
2. 利用R的edit函數(shù)打開圖形編輯器
首先定義一個(gè)數(shù)據(jù)框,不然edit編輯了也無法保存,最后再把編輯的數(shù)據(jù)賦值給原來的數(shù)據(jù)框。
data2 = data.frame(patientID=character(0),admDate=character(0),age = numeric(0),diabetes=character(0),status=character(0))
data2 = edit(data2)
##
或者再用fix()函數(shù)
fix(data2)
最后生成如下的可視化的編輯框。

結(jié)果
二:讀取外部數(shù)據(jù)
1. 讀取存儲(chǔ)于外部文件上的數(shù)據(jù)
三:通過訪問數(shù)據(jù)庫的方式
1.通過ODBC訪問數(shù)據(jù)庫
ODBC簡(jiǎn)稱Open Database Connectivetity,R中可以通過RODBC來訪問可用的數(shù)據(jù)庫。
install.packages("RODBC")
四:讀入文件
read.table(file, header = FALSE, sep = "", quote = "\"'",
dec = ".", numerals = c("allow.loss", "warn.loss", "no.loss"),
row.names, col.names, as.is = !stringsAsFactors,
na.strings = "NA", colClasses = NA, nrows = -1,
skip = 0, check.names = TRUE, fill = !blank.lines.skip,
strip.white = FALSE, blank.lines.skip = TRUE,
comment.char = "#",
allowEscapes = FALSE, flush = FALSE,
stringsAsFactors = default.stringsAsFactors(),
fileEncoding = "", encoding = "unknown", text, skipNul = FALSE)
參數(shù)說明:
# 純文本文件一般用.txt作為擴(kuò)展名,用空格,豎線或制表符分隔。
# 以逗號(hào)分隔的一般以csv文件作為擴(kuò)展名。用read.table()讀取純文本文件。
# R默認(rèn)會(huì)給每一行添加行號(hào)。sep指定分隔符,默認(rèn)空白分隔。csv文件分隔符為逗號(hào)。
# header參數(shù)是指讀取數(shù)據(jù)時(shí),第一行是否作為變量的名稱,而不是當(dāng)初具體的值處理。也叫表頭。
# skip參數(shù)是指讀取文件時(shí),跳過部分文件。比如skip=4,則從第5行讀取數(shù)據(jù)。
# nrows參數(shù)指定讀取文件的行數(shù)。skip控制從哪一行讀,nrows控制讀取到哪一行。
# na.strings處理缺失值。可以通過此函數(shù)告訴read.table()哪些是缺失值。read.table()會(huì)將這部分替換為NA。
# stringsAsFactors函數(shù)控制讀入字符串是否轉(zhuǎn)換為因子。R在讀取數(shù)據(jù)時(shí),數(shù)字會(huì)被讀取成數(shù)值型,字符串會(huì)被默認(rèn)轉(zhuǎn)換成因子類型。