一、基礎(chǔ)
1、數(shù)據(jù)結(jié)構(gòu)
- Data Frame
- 關(guān)系型表格
- Series
- 單一列,Data Frame包含多個(gè)Series
2、創(chuàng)建data frame
name = ['zhangsan','lisi','name1','name2']
id = [968,155,77,578]
datalist = list(zip(name,birth))
df = pd.DataFrame(data=datalist,columns = ['Names','Birth'])
二、分析
1、排序
Sorted = df.sort_values(['Births'], ascending=False)
Sorted.head(1)
三、CSV操作
1、轉(zhuǎn)換成csv
df.to_csv('test.csv',index=False,Header=True)
2、讀取csv
df = pd.read_csv(file_path)
df[:3]
3、查看df的數(shù)據(jù)類型
df.dtype
df.Birth.dtype
四、Excel操作
1、讀取Excel
import pandas as pd
import xlrd
excel_path ="test.xlsx"
data = pd.read_excel(excel_path)
2、選擇指定列、指定行
# 選擇第1-10行(行數(shù)即index=0,index=9),第2-3列(列數(shù)即index=1,index=2)
name = data.iloc[0:10,1:3]
print(name)
顯示
花費(fèi)事項(xiàng) 金額
0 項(xiàng)目組周六例行加班聚餐 450.00
1 購買手機(jī)架15位 54.99
2 打碼平臺充值 500.00
3 寄兩臺手機(jī) 12.00
4 遼寧電信 200.00
5 浙江移動(dòng) 100.00
6 浙江電信 50.00
7 浙江聯(lián)通 50.00
8 福建電信 50.00
9 山東移動(dòng) 100.00