在Pandas中,如果你想要在寫入Excel文件后繼續(xù)追加更多的DataFrame數(shù)據(jù),可以使用ExcelWriter對(duì)象的mode='a'(追加模式)選項(xiàng)。這允許你打開現(xiàn)有的Excel文件,并在不覆蓋現(xiàn)有數(shù)據(jù)的情況下寫入新的數(shù)據(jù)。
- 使用ExcelWriter的追加模式(mode='a')來寫入數(shù)據(jù)。
with pd.ExcelWriter('文章列表.xlsx', engine='openpyxl', mode='a') as writer:
parse_and_save_data(base_url, headers, context, writer)
- 使用writer.sheets.keys().len()動(dòng)態(tài)生成sheet名稱。
# 將DataFrame寫入Excel,每次追加到新的sheet中
df.to_excel(writer, sheet_name=f'Sheet{writer.sheets.keys().__len__()}', index=False)
print(f'數(shù)據(jù)已保存到Excel文件的 "Sheet{writer.sheets.keys().__len__() - 1}"')
以下是如何使用ExcelWriter以追加模式寫入Excel文件的示例:
import pandas as pd
# 假設(shè)df1和df2是你要寫入的兩個(gè)DataFrame
df1 = pd.DataFrame({'A': [1, 2], 'B': [3, 4]})
df2 = pd.DataFrame({'A': [5, 6], 'B': [7, 8]})
# 寫入第一個(gè)DataFrame到Excel
with pd.ExcelWriter('data.xlsx', engine='openpyxl', mode='w') as writer:
df1.to_excel(writer, index=False)
# 追加第二個(gè)DataFrame到Excel的新的sheet
with pd.ExcelWriter('data.xlsx', engine='openpyxl', mode='a') as writer:
df2.to_excel(writer, sheet_name='Sheet2', index=False)
在這個(gè)例子中:
- 第一次使用
ExcelWriter時(shí),mode='w'表示寫入模式,如果文件已存在,它會(huì)被覆蓋。 - 第二次使用
ExcelWriter時(shí),mode='a'表示追加模式,df2將被寫入Excel文件的新工作表(sheet)中,而不是覆蓋原有數(shù)據(jù)。
請(qǐng)注意以下幾點(diǎn):
- 確保你使用的是
openpyxl引擎,因?yàn)?code>xlsxwriter不支持追加寫入。 - 在追加模式下,如果指定的工作表已經(jīng)存在,新的DataFrame將會(huì)寫入到該工作表的下一行開始的位置。如果工作表不存在,將會(huì)創(chuàng)建一個(gè)新的工作表。
- 如果Excel文件是首次創(chuàng)建,使用
mode='w';如果文件已存在并且你想要追加數(shù)據(jù),使用mode='a'。 - 如果你想要在追加數(shù)據(jù)時(shí)跳過已存在的數(shù)據(jù),可以在
to_excel方法中設(shè)置參數(shù)if_sheet_exists='new'。這將導(dǎo)致Pandas在指定的工作表存在時(shí)創(chuàng)建一個(gè)新的工作表。
使用追加模式是一種節(jié)省內(nèi)存的有效方法,特別是當(dāng)你需要分批次處理和寫入大量數(shù)據(jù)時(shí)。