pandas使用筆記

1.寫入excel:
df = pd.DataFrame(resultlist)#一個(gè)列表,列表里裝的是json格式的數(shù)據(jù)
df.to_excel('data.xlsx', encoding='utf-8', startcol=0, index=False)

2.讀取excel
df = pd.read_excel('data.xlsx', encoding='utf-8', usecols='A,C:H,R:AB')

3.去掉重復(fù)的行
df.drop_duplicates(subset = [name],keep='first',inplace=True)

4.列名
df= pd.read_excel('a.xlsx', encoding='utf-8')
print(df.columns)

5.分組,
image.png

df.groupby(['id','b']):

6.遍歷
比較快的是
for tup in df.itertuples():
print(tup[0])#索引
print(tup[1])#和excel中的列一一對(duì)應(yīng)
print(tup[2])

7.條件查詢
df.loc[df["列名"] == "sth"]#返回符合條件的行
df.loc[df["列名"] == "sth","列名"] 單元格
這樣寫會(huì)返回類型,如果只要值
df.loc[df["列名"] == "sth","列名"] .values#返回的是列表
有多個(gè)條件的用&
df.loc[(df['A']=='a') & df['A']=='b') ]

8.問題1:
Index(['Unnamed: 0', 'Unnamed: 1', 'Unnamed: 2', 'Unnamed: 3'], dtype='object')
查詢列名時(shí)報(bào)以上錯(cuò)誤
原因:默認(rèn)查詢excel的sheet1,numbers導(dǎo)出excel時(shí)會(huì)增加一個(gè)sheet1,刪掉即可

9.判斷單元格是否為null
if tup[i] is np.nan

10:將兩列合并成一列
parent_teacher_data['address'] = parent_teacher_data['country']+parent_teacher_data['province']+parent_teacher_data['city']+parent_teacher_data['county']

11:追加寫入
如果是用to_excel追加比較麻煩,所以改用csv,mode='a'
df.to_csv("candidaterule.csv", encoding='utf-8',mode="a",index=None)
我是將json寫入csv的,如果直接這樣,每次追加寫入都有一行列名

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • pyspark.sql模塊 模塊上下文 Spark SQL和DataFrames的重要類: pyspark.sql...
    mpro閱讀 9,916評(píng)論 0 13
  • Pandas是用來生成可視化表格,并且對(duì)表格進(jìn)行運(yùn)算的??梢詫umpy的數(shù)據(jù)進(jìn)行生成表格。在學(xué)習(xí)Q-Learni...
    猿鹿說閱讀 470評(píng)論 0 1
  • 關(guān)鍵縮寫和包導(dǎo)入 在這個(gè)速查手冊(cè)中,我們使用如下縮寫: df:任意的Pandas DataFrame對(duì)象s:任意的...
    驚蟄_a11a閱讀 1,352評(píng)論 0 0
  • ######導(dǎo)入 導(dǎo)出###############df=pd.read_excel('D:/1.xls')df....
    Neural_PDE閱讀 685評(píng)論 0 2
  • 因?yàn)槊總€(gè)月會(huì)分析部門內(nèi)部各個(gè)小團(tuán)隊(duì)的平均加班時(shí)長,以評(píng)估大家的工作量,每次手工分析純粹是重復(fù)邏輯工作,做多了之后便...
    miyasz閱讀 2,115評(píng)論 0 2

友情鏈接更多精彩內(nèi)容