R語言學習--data.table-fread函數(shù)

參考:https://cran.r-project.org/web/packages/data.table/data.table.pdf

描述

"freda" 用于常規(guī)分隔文件;即每行具有相同列數(shù)的文件。之后還可以在每個列中指定第二個分隔符(sep2)。這樣的列將被讀取為list,其中每個單元格本身就是一個向量。

用法

fread(input, file, text, cmd, sep="auto", sep2="auto", dec=".", quote="\"",
nrows=Inf, header="auto",
na.strings=getOption("datatable.na.strings","NA"), # due to change to ""; see NEWS
stringsAsFactors=FALSE, verbose=getOption("datatable.verbose", FALSE),
skip="__auto__", select=NULL, drop=NULL, colClasses=NULL,
integer64=getOption("datatable.integer64", "integer64"),
col.names,
check.names=FALSE, encoding="unknown",
strip.white=TRUE, fill=FALSE, blank.lines.skip=FALSE,
key=NULL, index=NULL,
showProgress=getOption("datatable.showProgress", interactive()),
data.table=getOption("datatable.fread.datatable", TRUE),
nThread=getDTthreads(verbose),
logical01=getOption("datatable.logical01", FALSE), # due to change to TRUE; see NEWS
keepLeadingZeros = getOption("datatable.keepLeadingZeros", FALSE),
yaml=FALSE, autostart=NA, tmpdir=tempdir()
)

參數(shù)較多, 但在實際的應用中很多并不需要,以下,講解常用參數(shù)意義,及如何設置參數(shù)。

input : 一串代表所導入文件路徑的字符,可以與paste連用,例,input =paste("../Data/input/",xxx,sep"")
提前設置路徑可直接寫 文件名。

sep : 列之間的分隔符,默認為最常用的分隔符,通常csv文件分隔符為“,”,使用 NULL或者 “” 默認為咩有分隔符。

sep :列內(nèi)的分隔符?

header :導入的第一行數(shù)據(jù)是否作為列名(表頭),是為TRUE,否為FALSE(FALSE默認v1-v?)

na.strings : 數(shù)集中缺失的類型用什么來表示,默認情況下,將讀為NA,plink中分型數(shù)據(jù)中通常設置 na.strings = "--" ,bulpf90中數(shù)據(jù)文件中的缺失設置為 NA。

StringsFactors : 表示讀入的數(shù)據(jù),對于字符類型,是否自動處理為因子類型。為了方便后邊模型處理,這里設置為因子類型。

data.table : TRUE 設置返回為data.table ,F(xiàn)ALSE設置返回為 data.frame。

最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容