參考:https://cran.r-project.org/web/packages/data.table/data.table.pdf
描述
"freda" 用于常規(guī)分隔文件;即每行具有相同列數(shù)的文件。之后還可以在每個列中指定第二個分隔符(sep2)。這樣的列將被讀取為list,其中每個單元格本身就是一個向量。
用法
fread(input, file, text, cmd, sep="auto", sep2="auto", dec=".", quote="\"",
nrows=Inf, header="auto",
na.strings=getOption("datatable.na.strings","NA"), # due to change to ""; see NEWS
stringsAsFactors=FALSE, verbose=getOption("datatable.verbose", FALSE),
skip="__auto__", select=NULL, drop=NULL, colClasses=NULL,
integer64=getOption("datatable.integer64", "integer64"),
col.names,
check.names=FALSE, encoding="unknown",
strip.white=TRUE, fill=FALSE, blank.lines.skip=FALSE,
key=NULL, index=NULL,
showProgress=getOption("datatable.showProgress", interactive()),
data.table=getOption("datatable.fread.datatable", TRUE),
nThread=getDTthreads(verbose),
logical01=getOption("datatable.logical01", FALSE), # due to change to TRUE; see NEWS
keepLeadingZeros = getOption("datatable.keepLeadingZeros", FALSE),
yaml=FALSE, autostart=NA, tmpdir=tempdir()
)
參數(shù)較多, 但在實際的應用中很多并不需要,以下,講解常用參數(shù)意義,及如何設置參數(shù)。
input : 一串代表所導入文件路徑的字符,可以與paste連用,例,input =paste("../Data/input/",xxx,sep"")
提前設置路徑可直接寫 文件名。
sep : 列之間的分隔符,默認為最常用的分隔符,通常csv文件分隔符為“,”,使用 NULL或者 “” 默認為咩有分隔符。
sep :列內(nèi)的分隔符?
header :導入的第一行數(shù)據(jù)是否作為列名(表頭),是為TRUE,否為FALSE(FALSE默認v1-v?)
na.strings : 數(shù)集中缺失的類型用什么來表示,默認情況下,將讀為NA,plink中分型數(shù)據(jù)中通常設置 na.strings = "--" ,bulpf90中數(shù)據(jù)文件中的缺失設置為 NA。
StringsFactors : 表示讀入的數(shù)據(jù),對于字符類型,是否自動處理為因子類型。為了方便后邊模型處理,這里設置為因子類型。
data.table : TRUE 設置返回為data.table ,F(xiàn)ALSE設置返回為 data.frame。