R基礎(chǔ)五(獲取數(shù)據(jù))

一:手動(dòng)輸入

1.利用鍵盤輸入

列入下面數(shù)據(jù)


需要導(dǎo)入的數(shù)據(jù)

通過保存變量,然后整合成數(shù)據(jù)框。

# 病人編號(hào)
patientID = c(1,2,3,4)
# 入院時(shí)間
admDate = c("10/15/2009","11/01/2009","10/21/2009","10/28/2009")
# 年齡
age = c(25,34,28,52)
# 糖尿病類型
diabetes = c("Type1","Type2","Type1","Type1")
# 病情
status = c("Poor","Improved","Excellent","Poor")

生成5個(gè)變量,再定義一個(gè)數(shù)據(jù)庫,依次輸入5個(gè)變量。

data = data.frame(patientID,admDate,age,diabetes,status)
結(jié)果

2. 利用R的edit函數(shù)打開圖形編輯器

首先定義一個(gè)數(shù)據(jù)框,不然edit編輯了也無法保存,最后再把編輯的數(shù)據(jù)賦值給原來的數(shù)據(jù)框。

data2 = data.frame(patientID=character(0),admDate=character(0),age = numeric(0),diabetes=character(0),status=character(0))
data2 = edit(data2)
## 
或者再用fix()函數(shù)
fix(data2)

最后生成如下的可視化的編輯框。


結(jié)果

二:讀取外部數(shù)據(jù)

1. 讀取存儲(chǔ)于外部文件上的數(shù)據(jù)

三:通過訪問數(shù)據(jù)庫的方式

1.通過ODBC訪問數(shù)據(jù)庫

ODBC簡(jiǎn)稱Open Database Connectivetity,R中可以通過RODBC來訪問可用的數(shù)據(jù)庫。

install.packages("RODBC")

四:讀入文件

read.table(file, header = FALSE, sep = "", quote = "\"'",
           dec = ".", numerals = c("allow.loss", "warn.loss", "no.loss"),
           row.names, col.names, as.is = !stringsAsFactors,
           na.strings = "NA", colClasses = NA, nrows = -1,
           skip = 0, check.names = TRUE, fill = !blank.lines.skip,
           strip.white = FALSE, blank.lines.skip = TRUE,
           comment.char = "#",
           allowEscapes = FALSE, flush = FALSE,
           stringsAsFactors = default.stringsAsFactors(),
           fileEncoding = "", encoding = "unknown", text, skipNul = FALSE)

參數(shù)說明:

# 純文本文件一般用.txt作為擴(kuò)展名,用空格,豎線或制表符分隔。
# 以逗號(hào)分隔的一般以csv文件作為擴(kuò)展名。用read.table()讀取純文本文件。
# R默認(rèn)會(huì)給每一行添加行號(hào)。sep指定分隔符,默認(rèn)空白分隔。csv文件分隔符為逗號(hào)。
# header參數(shù)是指讀取數(shù)據(jù)時(shí),第一行是否作為變量的名稱,而不是當(dāng)初具體的值處理。也叫表頭。
# skip參數(shù)是指讀取文件時(shí),跳過部分文件。比如skip=4,則從第5行讀取數(shù)據(jù)。
# nrows參數(shù)指定讀取文件的行數(shù)。skip控制從哪一行讀,nrows控制讀取到哪一行。
# na.strings處理缺失值。可以通過此函數(shù)告訴read.table()哪些是缺失值。read.table()會(huì)將這部分替換為NA。
# stringsAsFactors函數(shù)控制讀入字符串是否轉(zhuǎn)換為因子。R在讀取數(shù)據(jù)時(shí),數(shù)字會(huì)被讀取成數(shù)值型,字符串會(huì)被默認(rèn)轉(zhuǎn)換成因子類型。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容