Series結(jié)構(gòu)

在Pandas中有除了主要的DataFrame結(jié)構(gòu)外還有個Series結(jié)構(gòu)

在DataFrame中一行或者一列就是Series結(jié)構(gòu)

titanic = pd.read_csv("E:/Anaconda/MachineLearningData/Titanic/test.csv")?? #獲取數(shù)據(jù)集

titanic_age = titanic["Age"]

print (type(titanic_age))

結(jié)果

從結(jié)果中可以看到titanic_age是一個Series類型

再進行以下操作

titanic_age_value = titanic_age.values

print type(titanic_age_value)

結(jié)果

可以看到pandas中的titanic_age.values返回的是一個numpy中的ndarray結(jié)構(gòu)。


用Series()構(gòu)造函數(shù)來創(chuàng)建新的series類型的變量:

ndarray_age = titanic_age.values??? #獲取特征age的ndarray值

ndarray_name = titanic["Name"].values??? #獲取特征name的ndarray值

#Series()中前一個參數(shù)為特征,參數(shù)index作為序號,在這里名字作為了序號,

series_custon = Series(ndarray_age,index=ndarray_name)???

print type(series_custon)

print series_custon

新定義了index后依舊可以用原來的0 1 2 等數(shù)字來進行索引

結(jié)果

DataFrame類型也可以重新定義index:

來自API文檔

若新定義的index為String時也可以對其進行切片造作

df.loc["string1":"string2"]


輸出這兩個名字的人的年齡:

print series_custon[['Kelly, Mr. James','Wilkes, Mrs. James (Ellen Needs)']]? #按名字索引

print series_custon[0:3]?? #按序號索引

結(jié)果

從結(jié)果可以看到是序號(名字)和特征值一起得到

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容