前言
我嘗試給pandas中篩選后數(shù)據(jù)的某行某列賦值時(shí),提示SettingWithCopyWarning:,是說(shuō)不能直接對(duì)副本進(jìn)行數(shù)據(jù)修改。
問(wèn)題復(fù)現(xiàn)
原始數(shù)據(jù)

此處
year-month-day為簽到日期,diff是我想計(jì)算的連續(xù)簽到天數(shù),如果下一行減去本行為1,則計(jì)為連續(xù)簽到天數(shù),diff的值+1。
我原來(lái)的賦值方法:
df.loc[df['user_id'] == i,'diff'].iloc[j] = 1# 報(bào)錯(cuò),其中i為第i個(gè)user_id的值,j為同一user_id的第j行
這里我通過(guò)df.loc[df[xx]==i,'yy'].iloc[j] = zz賦值(xx、yy均為列名),其中df.loc[df[xx]==i]后直接賦值是可以的,df.loc[df[xx]==i]為df的一個(gè)子集,即view或視圖,而df.loc[df[xx]==i,'yy'].iloc[j]為df的一個(gè)副本,是不能直接賦值的(但是可以print查看)。
處理方法(供參考,不適用所有場(chǎng)景)
我的處理方法比較傻:先把df.loc[df[xx]==i].copy()賦給一個(gè)臨時(shí)變量dfx,然后dfx.iloc[j,dfx.columns.get_loc('yy')] = zz計(jì)算完后再把臨時(shí)變量賦值回原df,即df.loc[df[xx]==i,'yy'] = dfx['yy']。
處理后的結(jié)果:

總結(jié)(不想看前面廢話請(qǐng)看這里:)
1,建議只使用一個(gè)loc或一個(gè)iloc方法賦值,即df.loc[xx]=zz或df.iloc[xx]=zz;不能同時(shí)使用loc和iloc賦值,即df.loc[xx].iloc[yy]=zz。
2,如果想實(shí)現(xiàn)1中同時(shí)使用loc和iloc后進(jìn)行賦值,可先用臨時(shí)變量存loc的值,再對(duì)臨時(shí)變量進(jìn)行iloc的運(yùn)算,處理后再賦值回原變量