【Python爬蟲】每次追加到新的sheet中

在Pandas中,如果你想要在寫入Excel文件后繼續(xù)追加更多的DataFrame數(shù)據(jù),可以使用ExcelWriter對象的mode='a'(追加模式)選項。這允許你打開現(xiàn)有的Excel文件,并在不覆蓋現(xiàn)有數(shù)據(jù)的情況下寫入新的數(shù)據(jù)。

  1. 使用ExcelWriter的追加模式(mode='a')來寫入數(shù)據(jù)。
with pd.ExcelWriter('文章列表.xlsx', engine='openpyxl', mode='a') as writer:
        parse_and_save_data(base_url, headers, context, writer)
  1. 使用writer.sheets.keys().len()動態(tài)生成sheet名稱。
# 將DataFrame寫入Excel,每次追加到新的sheet中
        df.to_excel(writer, sheet_name=f'Sheet{writer.sheets.keys().__len__()}', index=False)
        print(f'數(shù)據(jù)已保存到Excel文件的 "Sheet{writer.sheets.keys().__len__() - 1}"')

以下是如何使用ExcelWriter以追加模式寫入Excel文件的示例:

import pandas as pd

# 假設df1和df2是你要寫入的兩個DataFrame
df1 = pd.DataFrame({'A': [1, 2], 'B': [3, 4]})
df2 = pd.DataFrame({'A': [5, 6], 'B': [7, 8]})

# 寫入第一個DataFrame到Excel
with pd.ExcelWriter('data.xlsx', engine='openpyxl', mode='w') as writer:
    df1.to_excel(writer, index=False)

# 追加第二個DataFrame到Excel的新的sheet
with pd.ExcelWriter('data.xlsx', engine='openpyxl', mode='a') as writer:
    df2.to_excel(writer, sheet_name='Sheet2', index=False)

在這個例子中:

  • 第一次使用ExcelWriter時,mode='w'表示寫入模式,如果文件已存在,它會被覆蓋。
  • 第二次使用ExcelWriter時,mode='a'表示追加模式,df2將被寫入Excel文件的新工作表(sheet)中,而不是覆蓋原有數(shù)據(jù)。

請注意以下幾點:

  • 確保你使用的是openpyxl引擎,因為xlsxwriter不支持追加寫入。
  • 在追加模式下,如果指定的工作表已經(jīng)存在,新的DataFrame將會寫入到該工作表的下一行開始的位置。如果工作表不存在,將會創(chuàng)建一個新的工作表。
  • 如果Excel文件是首次創(chuàng)建,使用mode='w';如果文件已存在并且你想要追加數(shù)據(jù),使用mode='a'
  • 如果你想要在追加數(shù)據(jù)時跳過已存在的數(shù)據(jù),可以在to_excel方法中設置參數(shù)if_sheet_exists='new'。這將導致Pandas在指定的工作表存在時創(chuàng)建一個新的工作表。

使用追加模式是一種節(jié)省內(nèi)存的有效方法,特別是當你需要分批次處理和寫入大量數(shù)據(jù)時。

?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容