文/明道軟件 胡晨川
初階的餅圖、環(huán)形圖、折線圖、柱形圖、條形圖等就不多說了,因?yàn)樗麄冎庇^到無需解釋。但需要提一下做這些圖的時(shí)候的細(xì)節(jié):
首先,告別excel默認(rèn)的樣式和配色,因?yàn)槟菢訒?huì)使你的報(bào)告逼格很低。在我平時(shí)工作中,許多伙伴會(huì)問“你這圖表用什么軟件做的?感覺好高級(jí)?”,我說“excel啊”,他們吃驚不已。但這就是要的效果!
如何達(dá)到這些效果?先仔細(xì)摸索圖表布局選項(xiàng)卡下的坐標(biāo)軸、網(wǎng)格線、趨勢線、圖例,標(biāo)簽等功能細(xì)節(jié);其次是熟悉繪圖區(qū)格式里面的細(xì)節(jié),如調(diào)整圖表區(qū)域的配色,合理使用陰影等;最后是選擇合適的圖表來反映問題,這一點(diǎn)其實(shí)相當(dāng)復(fù)雜,在后續(xù)的文章中會(huì)循序漸進(jìn)地提及(結(jié)合一些場景),一股腦地說,我寫得辛苦你讀的累,劃不來。
推薦一本劉萬祥的《Excel圖表之道》,它會(huì)讓你驚嘆于excel作圖功能是如此的強(qiáng)大。
進(jìn)入主題:強(qiáng)大的散點(diǎn)圖
很多人聽到這會(huì)說,散點(diǎn)圖很簡單啊,感覺平時(shí)用不上。真不是你想的這么簡單。耐心的孩子聽我慢慢說。
首先,散點(diǎn)圖確實(shí)能很直觀的反應(yīng)兩個(gè)變量之間的關(guān)系。
案例一:利用散點(diǎn)圖觀察不同來源流量與網(wǎng)站總流量的關(guān)系。

上圖展示了某公司主站的新訪客各來源渠道與總新訪客量。結(jié)論很直觀:direct(直接訪問來源)和organic(自然搜索來源)和總的新訪客有明顯的正相關(guān)關(guān)系(direct與newuv相關(guān)系數(shù)達(dá)到0.89,direct來源的占比達(dá)到60%)。因此,我們知道這個(gè)公司大部分訪客來源于口碑,而且其潛力還相當(dāng)大,因?yàn)閐irect和organic圖顯示新訪客對(duì)direct的彈性比較高,沒有出現(xiàn)像sem(藍(lán)色)圖那樣的邊際效益遞減的情況。
(一些名詞解釋我會(huì)在文章最后列出)
通過組合型散點(diǎn)圖,我們已經(jīng)得到了一些有價(jià)值的信息。我個(gè)人對(duì)sem來源的變化趨勢非常感興趣。針對(duì)這點(diǎn)我們繼續(xù)挖掘信息。
案例二:在散點(diǎn)圖上用顏色增加一個(gè)分析維度,并添加平滑趨勢線。

圖中,我將sem來源的訪問量按四分位數(shù)進(jìn)行了分層,配合局部加權(quán)多項(xiàng)式擬合線。似乎又有了新的收獲:
1.sem來源流量較少時(shí)(紅色和綠色,后50%),與總流量的正相關(guān)關(guān)系是比較明顯的。
2.sem來源流量在75%到50%分位數(shù)(綠色)之間非常集中。我猜測,使sem流量維持在這個(gè)水平的投放策略,看來是有一種粘性的,即便加大投放,在一定幅度內(nèi),sem的流量增長也不明顯,直到突破某個(gè)臨界值,進(jìn)入藍(lán)色和紫色區(qū)域后,才會(huì)松開。
3.較高sem流量(藍(lán)色和紫色,前50%),與總流量的關(guān)系非常弱,擬合線幾乎平了。
到這里,您可能會(huì)這么問:sem流量在什么程度才是最優(yōu)?
要衡量這個(gè)問題,我選取了sem投放總成本,sem單位點(diǎn)擊成本(cpc),和sem來源的注冊(cè)轉(zhuǎn)化率三個(gè)指標(biāo)。讓可愛的散點(diǎn)圖升級(jí)!
案例三:點(diǎn)的大小衡量一個(gè)新的指標(biāo),散點(diǎn)圖進(jìn)化為氣泡圖

氣泡圖,就是除了橫縱坐標(biāo)軸,點(diǎn)的大小還能衡量一個(gè)變量的散點(diǎn)圖。上圖不僅衡量了sem投放總成本(semCOST)和sem來源流量(semUV),還用點(diǎn)的大小衡量注冊(cè)轉(zhuǎn)化率(regRate)。結(jié)論比較直觀,注冊(cè)轉(zhuǎn)化率高的點(diǎn),在右上方,且預(yù)測線顯示,投放力度越大,流量越大,且注冊(cè)轉(zhuǎn)化率至少不變。
得到這個(gè)結(jié)論有點(diǎn)振奮了,有沒有?
還能不能再增加點(diǎn)信息?可以,我們將單位點(diǎn)擊成本進(jìn)一步放到散點(diǎn)圖中。
案例四:氣泡的顏色再衡量一個(gè)變量,升級(jí)為彩色氣泡圖

如圖,點(diǎn)的大小是注冊(cè)轉(zhuǎn)化率,點(diǎn)的顏色是單位點(diǎn)擊成本,從暖色調(diào)到冷色調(diào),由低到高。轉(zhuǎn)化率高且cpc低的點(diǎn),在右上角。我們可以說,sem投放成本越高,sem流量越多,且轉(zhuǎn)化率越高,更可喜的是cpc還更低。對(duì)于一個(gè)sem投放部門來說,沒有比這更完美的結(jié)論了。
但是,散點(diǎn)圖只是反映了相關(guān)關(guān)系,并不是因果關(guān)系。我們不能說,增加sem投放是注冊(cè)轉(zhuǎn)化率升高且cpc降低的原因。但是,有這么顯著的相關(guān)關(guān)系,我們就有足夠的理由去增加投放,然后再去觀察數(shù)據(jù)。
數(shù)據(jù)分析再精確,如果縮手縮腳,是依然辦不成事情的。
當(dāng)然,投放策略分析是可以做得非常復(fù)雜的,我們這里只是為了介紹散點(diǎn)圖而引入了這個(gè)場景,初步地做個(gè)分析。但在中小企業(yè),我覺得做到這一步就可以了。(這幾張圖已經(jīng)可以把老板搞暈了,然后給你一大筆預(yù)算?。?/p>
注釋:
1.文中圖表是使用R軟件的gglot2包實(shí)現(xiàn)的,很遺憾不是excel。感興趣的讀者可以關(guān)注“川術(shù)”公眾號(hào)并給我留言,留下郵箱。我將無償分享代碼。
2.直接訪問來源(directUV)是指直接在地址欄輸入U(xiǎn)RL或者將主站URL添加收藏夾后,訪問來到主頁的流量。
3.自然搜索來源(organic)是指搜索引擎上,由非付費(fèi)詞搜索點(diǎn)擊進(jìn)入網(wǎng)站的流量。而semUV就是有付費(fèi)搜索詞進(jìn)來的。
4.四分位數(shù),指將一個(gè)數(shù)列排序后,處在排名第25%、50%、75%的位置的數(shù)??梢圆椴榘俜治粩?shù)的概念,你會(huì)理解更透徹。
5.局部加權(quán)回歸,有點(diǎn)難描述。如果你懂回歸,就去谷歌一下,如果不懂回歸就算了。