《學習小組Day6筆記--高乃林》
轉(zhuǎn)眼間就到了倒數(shù)第二天,入門到時入了,但離自己的理想預期還有很大的差距,慢慢來,先把作業(yè)做了。
安裝dplyr包并加載,然后再開始搞事情。

圖片1.png

圖片2.png
這么說,test取的是數(shù)據(jù)集里的(1,2,51,52,101,102列)。Mutate加了一列,名稱為new的數(shù)據(jù)。
我自己搞了一個名稱為new1的數(shù)據(jù)。
但很明顯,剛剛建立的new的一列,并沒有保存下來,所以我建了新的new1的時候,new已經(jīng)不見了。而且,連我剛剛創(chuàng)的new1也沒能保存???見下圖

圖片3.png

圖片4.png
繼續(xù)往下走,肯定有可以保存的方法的。
下面分別是篩選、排列、匯總的函數(shù),都是比較好理解的。不過多展示。
實用技能中的管道還好理解,就是相當于限定條件,比如下面代碼說的就是test數(shù)據(jù)中,根據(jù)species分組,并計算每一組的Sepal.Length的mean,和Sepal.Length的sd。

圖片5.png
count統(tǒng)計某列的unique值?蒙了一下。
但反應過來了,就是test有6行,每個species都有2行。

圖片6.png

圖片7.png
即是說不重復的species有2行。所以是n=2。
下一步就遇到了問題了。
options(stringsAsFactors = F)函數(shù)不懂什么意思。查了一下:strings是“字符串”,F(xiàn)actors是“因子”。如名稱通常是字符串,而指標是因子。如果在建立數(shù)據(jù)框的時候,將字符串設置為因子,那么數(shù)據(jù)名稱就被“因子化”了。所以,不能將其字符因子化。但為什么呢??但會試試不加他會怎么樣。
一步步走,跟教程的一樣,沒什么意思。

圖片8.png
那么試試因子化會怎么樣呢?

圖片10.png
好像也沒什么變化呀!??!

圖片11.png
剩下也沒什么好展示的了。
結束今天的學習。
留了兩個問題:①怎么保存新創(chuàng)的數(shù)據(jù)?②options(stringsAsFactors = F)函數(shù)有什么用?自己先搜索解決。