第二章:創(chuàng)建數(shù)據(jù)集_《R語(yǔ)言實(shí)戰(zhàn)》筆記

  • 對(duì)象:指可以賦值給變量的任何事物(常量、函數(shù)、圖形等)
  • 模式(數(shù)據(jù)類型):對(duì)象的模式描述了此對(duì)象是如何存儲(chǔ)的——數(shù)值型、字符型、邏輯型復(fù)數(shù)型和原生型

數(shù)據(jù)的輸入

R提供了適用范圍廣泛的數(shù)據(jù)導(dǎo)入工具

使用鍵盤輸入數(shù)據(jù)

edit()函數(shù)會(huì)自動(dòng)調(diào)用一個(gè)允許手動(dòng)輸入數(shù)據(jù)的文本編輯器,步驟:

1、創(chuàng)建一個(gè)空的數(shù)據(jù)框/矩陣
2、針對(duì)這個(gè)數(shù)據(jù)對(duì)象,調(diào)用文本編輯器

mydata=data.frame(age=numeric(0),gender=character(0),weight=numeric(0))
mydata=edit(mydata)
image.png
從帶分隔符的文本文件導(dǎo)入數(shù)據(jù)

read.table()函數(shù):mydataframe=read.table(file,options)
重要的option

header 第一行是否包含了變量名,邏輯變量
seq 設(shè)定數(shù)組的分隔符??梢酝ㄟ^(guò)seq=" "進(jìn)行設(shè)定
na.strings 可選的用于表示缺失值的字符向量,na.strings=c("-9","?")在讀取數(shù)據(jù)的時(shí)候轉(zhuǎn)換成NA
skip 讀取數(shù)據(jù)前跳過(guò)行的數(shù)目

read.table()在讀取時(shí),會(huì)默認(rèn)把字符變量轉(zhuǎn)化為因子,可以通過(guò)colClasses選項(xiàng)對(duì)每一列指定一個(gè)列,或者設(shè)置stringsAsFactors=FALSE進(jìn)行更改

導(dǎo)入Excel數(shù)據(jù)

可以先將excel表輸出為逗號(hào)分隔文件在,再用read.table進(jìn)行讀取。
也可以用xlsx包直接導(dǎo)入Excel工作表
最簡(jiǎn)單格式:read.xlsx(file,n) n為要導(dǎo)入的工作表序號(hào)1

其他可以導(dǎo)入的數(shù)據(jù)

XML:XML包
直接從網(wǎng)頁(yè)抓取數(shù)據(jù)
SPSS數(shù)據(jù):foreign包中的read.spss(),Hmisc包中的spss.get()
SAS數(shù)據(jù)
...........

處理數(shù)據(jù)對(duì)象的實(shí)用函數(shù)
image.png

image.png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容