時(shí)間過(guò)得飛快,猴年就這樣悄悄溜走,轉(zhuǎn)眼迎來(lái)了雞年。雞年的第一篇關(guān)于數(shù)據(jù)分析的文章,我打算用來(lái)紀(jì)念2016年這個(gè)對(duì)于我來(lái)說(shuō)并不平凡的猴年。
我常常在想,數(shù)據(jù)分析真的和生活聯(lián)系的非常緊密。例如說(shuō),提到猴子,我們通常想起來(lái)孫悟空,提到孫悟空,我們又不難想到“真假美猴王”。其實(shí)在平常接觸的數(shù)據(jù)中,我們總是會(huì)遇到很多重復(fù)的數(shù)據(jù),這些重復(fù)數(shù)據(jù)就像六耳獼猴干擾我們的視聽(tīng),擾亂分析的思路。于是,我們要有本事把重復(fù)的數(shù)據(jù)挑選出來(lái),還要有本事把不需要的重復(fù)數(shù)據(jù)剔除掉。這可是很需要功力的哦。

關(guān)于篩選和剔除重復(fù)的數(shù)據(jù),你平常是怎么操作的呢?猶記得,我剛剛參加工作的時(shí)候,對(duì)待重復(fù)數(shù)據(jù)的處理方式就是排序,而后挑選著刪除一些重復(fù)的數(shù)據(jù)。這樣的操作也能夠達(dá)成目的,只不過(guò)確實(shí)相當(dāng)費(fèi)時(shí)間而且容易看花了眼。

我今天為大家介紹幾種可以快速查找重復(fù)項(xiàng)并對(duì)其進(jìn)行刪除的方式,希望可以在工作中有所幫助,畢竟我們需要更多的時(shí)間來(lái)好好生活好好戀愛(ài)嘛~
請(qǐng)注意,我們今天的原始數(shù)據(jù)是這樣的:

方法一:利用Excel條件格式
Excel在處理日常工作的過(guò)程中,其功能還是非常強(qiáng)大的。我們可以利用的最簡(jiǎn)便的方法常常藏在其中。
Step1,選中單元格區(qū)域A1:A10,選擇“開(kāi)始”--->“條件格式”--->“突出單元格顯示規(guī)則”--->“重復(fù)值”,如圖1.1所示。

Step2,經(jīng)過(guò)上面的操作,我們會(huì)看到如下結(jié)果,如圖1.2所示,在這里我們還可以為重復(fù)的單元格選擇標(biāo)記的顏色哦,是不是一目了然呢?

Step3,那么接下來(lái),如何把重復(fù)的內(nèi)容刪掉,保留我們想要的數(shù)據(jù)呢?如圖1.3所示,在“數(shù)據(jù)”選項(xiàng)卡中的“數(shù)據(jù)工具”組中,單擊“刪除重復(fù)項(xiàng)”,在“列”區(qū)域下面,選擇要?jiǎng)h除的列(這里只有“編號(hào)”這一列),并單擊“確定按鈕”。(PS:如果你只想刪除重復(fù)的數(shù)據(jù),卻并不需要知道哪些數(shù)據(jù)重復(fù),那么你可以選擇跳過(guò)STEP1和STEP2,直接進(jìn)行這一步。)
Step4,得到如圖1.4所示的結(jié)果,在這里我們可以看到有多少重復(fù)值被刪除,同時(shí)有多少唯一值被保留下來(lái)了。單擊“確定”即可完成操作,得到我們最終的想要的結(jié)果。
總結(jié)一下,這種方法的優(yōu)缺點(diǎn)如下:
優(yōu)點(diǎn):可以看到到底是哪些數(shù)據(jù)重復(fù)了,而且比較快捷的得到重復(fù)值刪除后的結(jié)果。
缺點(diǎn):至于每一個(gè)重復(fù)項(xiàng)的數(shù)量有幾個(gè),并不能夠直觀看到。
方法二:利用“高級(jí)篩選”功能處理重復(fù)值
如果想要找出重復(fù)值,“高級(jí)篩選”功能又怎么能被我們忽略呢?更何況在處理重復(fù)數(shù)據(jù)的過(guò)程中,該方法還十分簡(jiǎn)便易行。
Step1:選中單元格區(qū)域A1:A10,在“數(shù)據(jù)”選項(xiàng)卡中的“排序和篩選”分組中找到“高級(jí)”按鈕,點(diǎn)擊該按鈕,可以看到彈出一個(gè)“高級(jí)篩選”對(duì)話框。如圖2.1所示:
Step2:在上圖所示的對(duì)話框中,選中“將篩選結(jié)果復(fù)制到其他位置”,在“復(fù)制到”文本框中選中B1區(qū)域,同時(shí)注意勾選“選擇不重復(fù)的記錄”,點(diǎn)擊“確定”按鈕,如圖2.2所示。得到的結(jié)果如圖2.3所示。
總結(jié)一下,這種方法的優(yōu)缺點(diǎn)如下:
優(yōu)點(diǎn):非常方便快捷的得到刪除重復(fù)數(shù)據(jù)后的結(jié)果。
缺點(diǎn):并不能直觀的看到到底是哪些數(shù)據(jù)重復(fù)了,重復(fù)數(shù)據(jù)的個(gè)數(shù)分別是多少。
方法三:利用COUNTIF函數(shù)處理重復(fù)數(shù)據(jù)
綜合上述方法一和方法二我們不難看出,上面的兩種方法操作起來(lái)非常簡(jiǎn)單,但是缺點(diǎn)也非常明顯。那就是,如果想要定位到具體的重復(fù)項(xiàng),并且直觀了解到該重復(fù)項(xiàng)的數(shù)量,上述兩種方法就略顯不足了。所以,如果需求比較復(fù)雜,需要了解到重復(fù)項(xiàng)的數(shù)量或者排序的話,我們就要借用COUNTIF函數(shù)來(lái)進(jìn)行處理了。
Step1:首先了解一下COUNTIF函數(shù)。COUNTIF函數(shù)的作用是:對(duì)所選區(qū)域中滿足單個(gè)指定條件的單元格進(jìn)行計(jì)數(shù),如圖3.1所示。

Step2:選中B2單元格,然后輸入函數(shù)公式:=COUNTIF(A:A,A2),如圖3.2所示。這就表示“數(shù)一數(shù)在A列,像A2這樣的有幾個(gè)”:
Step3:選中C2單元格,輸入函數(shù)公式:=COUNTIF(A$2:A2,A2),如圖3.3所示。這就表示“在A列中,該單元格中的項(xiàng)目是第幾次出現(xiàn)”
Step4:將B2和C2的公式復(fù)制到B3:C11的所有單元格,可以得到如下結(jié)果,如圖3.4所示。這里需要說(shuō)明下,拿“AD652280”舉例子,這里的B4表示“AD652280”在A列一共有兩個(gè);而C4則表示,“AD652280”在A列第一次出現(xiàn),C10表示“AD652280”在A列第二次出現(xiàn)。這樣我們就能夠直觀看到有哪些項(xiàng)是重復(fù)的,重復(fù)了幾次(可以看B列);這些項(xiàng)從哪里開(kāi)始重復(fù)的,第幾次重復(fù)(看C列)。
Step5:為了方便講解,我們給B列命名為“有幾個(gè)”,給C列命名為“第幾個(gè)”。我們可以通過(guò)刪除C列中計(jì)數(shù)不為“1”的項(xiàng)目來(lái)達(dá)到刪除重復(fù)數(shù)據(jù)的目的(即把第二次、第三次。。。第N次出現(xiàn)的都刪掉)。選中“第幾個(gè)”列即C列中有數(shù)據(jù)的單元格,在“數(shù)據(jù)”選項(xiàng)卡中選擇“排序和篩選”--->點(diǎn)擊“篩選”--->點(diǎn)擊C列的列標(biāo)簽上出現(xiàn)的下拉菜單--->點(diǎn)擊“數(shù)字篩選”--->選擇“不等于”,如圖3.5所示。
Step6:在圖3.6所示的對(duì)話框中,紅框內(nèi)填入“1”,而后點(diǎn)擊“確定”。
Step7:刪除在上一步中得到的行,即可得到最終的不重復(fù)的結(jié)果。
看了上面介紹的幾種方法,是不是感覺(jué)自己的功力又有所提高了呢?
其實(shí)呀,正是因?yàn)槲覀冊(cè)谌粘5墓ぷ髦?,掌握了一個(gè)又一個(gè)看起來(lái)平凡但卻非常有用的方法,才使得我們能夠脫穎而出、與眾不同呢。
還猶豫什么,趕快學(xué)起來(lái)吧,下一個(gè)升職加薪的,一定是你哦~