零基礎(chǔ)學Pyhton數(shù)據(jù)分析 >> Pandas >> Pandas基礎(chǔ)

前言

大家好,這里是零基礎(chǔ)學Pyhton數(shù)據(jù)分析系列。如果你想做一個Python數(shù)據(jù)分析師,或者想做一個Python算法建模師,這么這些知識都是必備的哦。希望你可以在這個系列的學習中有所收獲,成為一位優(yōu)秀的數(shù)據(jù)分析師或者算法建模師。

這個系列很簡單,這個系列很精彩。

這個系列所有的代碼編寫均是Python3版本。

這個系列用到的數(shù)據(jù)集是Pyhton自帶的非常經(jīng)典的鳶尾花數(shù)據(jù)集,可以直接使用哦。

喜歡的朋友們可以點個關(guān)注,有問題歡迎隨時和我交流。

Pandas概念

Python可以成為數(shù)據(jù)分析最主流的語言,Pandas是其中不可或缺的因素。我在實際工作中,80%的數(shù)據(jù)處理工作都是使用Pandas來完成的,如果你想學Python數(shù)據(jù)分析,那么一定要會Pandas的常用操作。

本文就講講Pandas的基礎(chǔ),讓大家對Pyhton的Pandas包有一個初步的了解,后續(xù)會詳解Pandas在工作中的常用操作。

Pandas是什么

Pandas是Python + Data + Analysis的組合縮寫,也就是Pyhton + 數(shù)據(jù) + 分析,它是Python的一個數(shù)據(jù)分析包。

Pandas的核心數(shù)據(jù)結(jié)構(gòu)是:Series和DataFrame。

簡單來說,Pandas是編程界的Excel,它的核心數(shù)據(jù)結(jié)構(gòu)DataFrame就是excel中一張表。

Pandas和Numpy的區(qū)別

Pandas是在Numpy基礎(chǔ)上實現(xiàn),相比Numpy,Pandas使用起來更加直觀簡單,但Pandas與numpy的關(guān)系不是替代,而是互為補充。

Pandas包的導入

import pandas as pd

在Pandas使用時,我們習慣把Pandas包命名成pd,這樣在使用Pandas各種方法時很方便。(當然你也可以命名成其他的,不過業(yè)內(nèi)都是命名成pd,還是跟著大眾走吧) 比如查看Pandas版本:

pd.__version__'1.3.5'

Pandas核心數(shù)據(jù)結(jié)構(gòu)

Pandas的核心數(shù)據(jù)結(jié)構(gòu)是:Series和DataFrame。Dataframe是多行多列,Series是單列多行。讓我們具體來看看這兩種數(shù)據(jù)格式長什么樣。后續(xù)文章也會詳細講解如何使用這兩種數(shù)據(jù)結(jié)構(gòu)來處理數(shù)據(jù)。

DataFrame

Dataframe是多行多列的,直接上圖,讓我們看看DataFrame長什么樣。

image.png

<figcaption style="text-align: center; line-height: 1.75; color: rgb(136, 136, 136); font-size: 0.8em;">圖片</figcaption>

如上圖,就是一個100行 * 5列的DataFrame數(shù)據(jù)。第左邊一列是它的索引(可以理解為是excel表的序號。索引不一定是順序的,也可能是重復的,斷續(xù)的,后續(xù)使用時會詳細說明),最上面一行是它的列名(就是每一列代表的含義)。

有木有發(fā)現(xiàn),這不就是一張ecxel表嗎,是的,你可以把DataFrame理解為excel中一張表,對DataFrame的操作,就是對這張excel的操作變成了用Python代碼來實現(xiàn)。

是不是非常的直觀,這就是Pandas的美妙之處。

Series

Series是多行單列的,直接上圖,讓我們看看Series長什么樣。

image.png

<figcaption style="text-align: center; line-height: 1.75; color: rgb(136, 136, 136); font-size: 0.8em;">圖片</figcaption>

如上圖,就是一個Series數(shù)據(jù)。第左邊一列是它的索引,Series就是一列數(shù)據(jù),每個數(shù)據(jù)對應(yīng)一個索引值。(和DataFrame一樣,索引不一定是順序的,也可能是重復的,斷續(xù)的,后續(xù)使用時會詳細說明)

總結(jié)

看完DataFrame和Series的舉例,是不是發(fā)現(xiàn)DataFrame和Series非常簡單,然后我們要學的就是如何使用Pyhton對DataFrame和Series進行增、刪、改、查。后續(xù)文章中,我會把我在工作中常用的操作一一詳解,不說覆蓋全部的知識點,但是用來完成絕大部分的數(shù)據(jù)處理工作足夠了。等學會這些操作,那么恭喜你,你已經(jīng)是一位初級數(shù)據(jù)分析師啦。

后記

Python真的是一個非常適合做數(shù)據(jù)分析的代碼,數(shù)據(jù)分析師和算法建模師也真的是一份非常有趣的工作,如果你對數(shù)據(jù)很感興趣,那成為一名數(shù)據(jù)分析師或者算法建模師一定是一個不錯的選擇。

當然數(shù)據(jù)分析師和算法建模師,業(yè)務(wù)經(jīng)驗才是核心,代碼只是我們的工具,要想成為一個優(yōu)秀的數(shù)據(jù)工程師,實踐是必不可少的。

原創(chuàng)不易,每一個知識點都是我在工作中常用的,初心是為了分享,所以希望大家能多多支持,關(guān)注點贊轉(zhuǎn)發(fā),有什么問題歡迎在后臺聯(lián)系我,也可以在公眾號找到我的微信加我。

加油,騷年!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容