學(xué)一點(diǎn)總結(jié)一點(diǎn),積少成多^_^
需求:有兩個(gè)csv文件,需要按列合并。舉例如下:
a.csv:
column1 ? ?column2 ? ?column3
a1 ? ? ? ? ? ? ? a21 a22 ? ? ?a31 a32
b1 ? ? ? ? ? ? ? b21 b2 ? ? ? b3 ? b32
b.csv:
column1 ? ?column2 ? ?column3
a1 ? ? ? ? ? ? ? a21 a22 ? ? ?a33
c ? ? ? ? ? ? ? ?c1 ? ?c2 ? ? ? ?c31 c3
c.csv
column1 ? ? column2 ? ? ?column3
a1 ? ? ? ? ? ? ? ? a21 a22 ? ? ?a31 a32 a33
b1 ? ? ? ? ? ? ? b21 b2 ? ? ? b3 ? b32
c ? ? ? ? ? ? ? ?c1 ? ?c2 ? ? ? ?c31 c3
要求:把 a.csv 和 b.csv 按列合并,得到 c.csv。
實(shí)現(xiàn):
hdr = 'column1, column2, column3'.split(',')
1. 核心算法函數(shù):
def merge_dict1_into_dict2(dict1, dict2):
<tab>for k2, value2 in dict2.items():
<tab><tab>if k2 in dict1:
<tab><tab><tab>for idx in hdr:
<tab><tab><tab><tab>if value2 [idx] != dict1[k2][idx]
<tab><tab><tab><tab><tab>set1 = set(dict1[k2][idx].split(' '))
<tab><tab><tab><tab><tab>set2 = set(value2[idx].split(' '))
<tab><tab><tab><tab><tab>dict1[k2] = ' '.join(set1 | set2)
<tab><tab>else:
<tab><tab><tab>dict1[k2] = value2
2. 把 a.csv 和 b.csv 分別讀到兩個(gè)二維字典里:dict1, dict2
//明天再寫...
dict1 = dict([(iter['column1'], iter) for iter in csv.DictReader(open('a.csv', 'r')) if 'column1' in iter])
merge_dict2_into_dict1(dict1, dict2)
3. 把用函數(shù)處理過(guò)的 dict1 寫入 c.csv文件。
4. 有木有人知道tab鍵怎么敲,手工輸‘<tab>’太累了。。。