2021-08-25

《學習小組Day6筆記--高乃林》

轉(zhuǎn)眼間就到了倒數(shù)第二天,入門到時入了,但離自己的理想預期還有很大的差距,慢慢來,先把作業(yè)做了。

安裝dplyr包并加載,然后再開始搞事情。

圖片1.png

圖片2.png

這么說,test取的是數(shù)據(jù)集里的(1,2,51,52,101,102列)。Mutate加了一列,名稱為new的數(shù)據(jù)。
我自己搞了一個名稱為new1的數(shù)據(jù)。
但很明顯,剛剛建立的new的一列,并沒有保存下來,所以我建了新的new1的時候,new已經(jīng)不見了。而且,連我剛剛創(chuàng)的new1也沒能保存???見下圖


圖片3.png

圖片4.png

繼續(xù)往下走,肯定有可以保存的方法的。
下面分別是篩選、排列、匯總的函數(shù),都是比較好理解的。不過多展示。

實用技能中的管道還好理解,就是相當于限定條件,比如下面代碼說的就是test數(shù)據(jù)中,根據(jù)species分組,并計算每一組的Sepal.Length的mean,和Sepal.Length的sd。

圖片5.png

count統(tǒng)計某列的unique值?蒙了一下。
但反應過來了,就是test有6行,每個species都有2行。


圖片6.png
圖片7.png

即是說不重復的species有2行。所以是n=2。

下一步就遇到了問題了。

options(stringsAsFactors = F)函數(shù)不懂什么意思。查了一下:strings是“字符串”,F(xiàn)actors是“因子”。如名稱通常是字符串,而指標是因子。如果在建立數(shù)據(jù)框的時候,將字符串設置為因子,那么數(shù)據(jù)名稱就被“因子化”了。所以,不能將其字符因子化。但為什么呢??但會試試不加他會怎么樣。
一步步走,跟教程的一樣,沒什么意思。


圖片8.png

那么試試因子化會怎么樣呢?


圖片10.png

好像也沒什么變化呀!??!


圖片11.png

剩下也沒什么好展示的了。

結束今天的學習。
留了兩個問題:①怎么保存新創(chuàng)的數(shù)據(jù)?②options(stringsAsFactors = F)函數(shù)有什么用?自己先搜索解決。

————————End。

?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容