備注: 本博客所有代碼可從如下github地址下載: https://github.com/Elliot518/data-science
注: 你需要自行安裝Python3和Jupyter開發(fā)環(huán)境
1. 簡(jiǎn)介
Pandas是一個(gè)高性能、易于使用的數(shù)據(jù)分析工具。
- 安裝
pip install pandas
?
2. 數(shù)據(jù)結(jié)構(gòu)
Pandas 中有兩種數(shù)據(jù)結(jié)構(gòu),Series 和 DataFrame,前者是一維的,后者是二維的,DataFrame 就是多個(gè) Series。
2-1) Series
Series類似一維數(shù)組,它就像Python中的list或Numpy中的一維的array。

Series

Series數(shù)據(jù)結(jié)構(gòu)示例
Series 常用的創(chuàng)建方式:
a) 字典創(chuàng)建
import pandas as pd
# create series by dictionary
sites = {1: "Google", 2: "Runoob", 3: "Wiki"}
sites
series_sites = pd.Series(sites)
series_sites

image.png
b) 列表創(chuàng)建
# create series by list
sites2 = ["Google", "Runoob", "Wiki"]
sites2
series_sites2 = pd.Series(sites2)
series_sites2
c) 數(shù)組創(chuàng)建
import numpy as np
import pandas as pd
data = np.random.randn(3)
data
series_data = pd.Series(data)
series_data

image.png
d) 索引訪問
# access by index
data = pd.Series(sites, index = ['G', 'R', 'W'])
data
data[['G', 'R']]

image.png
e) Series 運(yùn)算
# Series 運(yùn)算
data = pd.Series([1, 2, 3], index = ['x', 'y', 'z'])
data
data = data * 2
data

image.png
?
2-2) DataFrame
DataFrame 是二維結(jié)構(gòu),類似于 Excel 表格。

DataFrame
pandas.DataFrame(data, index, columns)
data:數(shù)據(jù),列表、字典等
index:行索引
columns:列索引
DataFrame 常用的創(chuàng)建方式:
a) 二維列表創(chuàng)建
import pandas as pd
# 二維列表
data = [['Google', 10],['Runoob', 12],['Wiki', 13]]
pd.DataFrame(data, columns=['Site', 'Age'])
b) 字典組成的列表創(chuàng)建
# 字典組成的列表
data = [{'Site': 'Google', 'Age': 10},{'Site': 'Runoob', 'Age': 12},{'Site': 'Wiki', 'Age': 13}]
pd.DataFrame(data)
c) 列表組成的字典創(chuàng)建
# 列表組成的字典
data = {'Site':['Google', 'Runoob', 'Wiki'], 'Age':[10, 12, 13]}
pd.DataFrame(data)
d) 訪問列
# 訪問列
data['Site']