python——表格合并

一、concat?“拼接”

df = pd.concat([df1, df2], axis = 0, ignore_index = False, join = "outer

axis:指的是拼接的方向。axis = 0指的是拼接行(向下拼接),axis = 1指的是拼接列(向右拼接)。

ignore_index: 指的是拼接后是否忽視原df各自的索引。比如,假如我們按行拼接,原來df1和df2中各有五條數(shù)據(jù),索引是0,1,2,3,4。

????ignore_index=False,那么拼接后df的索引就是0,1,2,3,4,0,1,2,3,4。

????ignore_index=True, 那么拼接后df的索引就是0,1,2,3,4,5,6,7...

join:表示“如何拼接”。其中,outer表示取并集,inner表示取交集。


二、merge “合并”

df = pd.merge(left, right, on =["ID", "ID"])

# 實戰(zhàn)項目中,同一個企業(yè)的數(shù)據(jù)依據(jù) year 豎向排列,要改為橫向合并。

def merge_year(data):

????temp = pd.merge(data[data['year'] ==2016], data[data['year'] ==2017], on=["ID", "ID"], suffixes=['.1', '.2'])

????ret = pd.merge(data[data['year'] ==2015], temp, on=["ID", "ID"])

????return ret

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容