常見圖表介紹及實(shí)例
發(fā)現(xiàn)一篇文檔講的很好,這里基本都是摘錄,原文請參見附錄
什么是散點(diǎn)圖
散點(diǎn)圖也叫 X-Y 圖,它將所有的數(shù)據(jù)以點(diǎn)的形式展現(xiàn)在直角坐標(biāo)系上,以顯示變量之間的相互影響程度,點(diǎn)的位置由變量的數(shù)值決定。
通過觀察散點(diǎn)圖上數(shù)據(jù)點(diǎn)的分布情況,我們可以推斷出變量間的相關(guān)性。如果變量之間不存在相互關(guān)系,那么在散點(diǎn)圖上就會表現(xiàn)為隨機(jī)分布的離散的點(diǎn),如果存在某種相關(guān)性,那么大部分的數(shù)據(jù)點(diǎn)就會相對密集并以某種趨勢呈現(xiàn)。數(shù)據(jù)的相關(guān)關(guān)系主要分為:正相關(guān)(兩個變量值同時增長)、負(fù)相關(guān)(一個變量值增加另一個變量值下降)、不相關(guān)、線性相關(guān)、指數(shù)相關(guān)等,表現(xiàn)在散點(diǎn)圖上的大致分布如下圖所示。那些離點(diǎn)集群較遠(yuǎn)的點(diǎn)我們稱為離群點(diǎn)或者異常點(diǎn)。

散點(diǎn)圖經(jīng)常與回歸線(就是最準(zhǔn)確地貫穿所有點(diǎn)的線)結(jié)合使用,歸納分析現(xiàn)有數(shù)據(jù)以進(jìn)行預(yù)測分析。
對于那些變量之間存在密切關(guān)系,但是這些關(guān)系又不像數(shù)學(xué)公式和物理公式那樣能夠精確表達(dá)的,散點(diǎn)圖是一種很好的圖形工具。但是在分析過程中需要注意,這兩個變量之間的相關(guān)性并不等同于確定的因果關(guān)系,也可能需要考慮其他的影響因素。
英文名:Scatter graph, Point graph, X-Y plot, Scatter chart or Scattergram
散點(diǎn)圖應(yīng)用場景
散點(diǎn)圖通常用于顯示和比較數(shù)值,不光可以顯示趨勢,還能顯示數(shù)據(jù)集群的形狀,以及在數(shù)據(jù)云團(tuán)中各數(shù)據(jù)點(diǎn)的關(guān)系。
常見的是身高和體重的數(shù)據(jù)
從網(wǎng)上找一份身高體重的數(shù)據(jù),

然后,我們選中身高和體重,插入一個散點(diǎn)圖

通過觀察,很容易發(fā)現(xiàn),身高和體重是正相關(guān)的,而且是線性相關(guān),及身高越高,體重越重
我們可以添加趨勢線,并顯示公式

當(dāng)然,我們還可以在添加一個性別維度去看

這里我們要分別選擇數(shù)據(jù)源,在Excel中,需要先制作男生的散點(diǎn)圖,然后添加數(shù)據(jù)源,增加列,然后使用不同的圖形表示就好了

好了,上面,我們簡單了解了散點(diǎn)圖,知道在Excel中簡單制作散點(diǎn)圖了,先到這里。
散點(diǎn)圖的變形-氣泡圖
上面的散點(diǎn)圖,只有2個變量,身高和體重,那如果我們想要再增加變量呢?比如說年齡,我們就可以用點(diǎn)的大小來表示年齡,這就變成了有大有小的點(diǎn),像氣泡一樣,所以叫氣泡圖。

這里主要是在Excel中,選擇不同的數(shù)據(jù)源即可,我們用年齡來控制大小


散點(diǎn)圖的變形-分類矩陣
我們在繪制了散點(diǎn)圖之后,通過添加輔助線可以進(jìn)行決策,類似于波士頓矩陣

這主要是一種投資策略,通過這個圖,可以快速的了解每種產(chǎn)品所處的價值區(qū)間,在Excel中,我們也可以簡單的模擬這種圖

上圖是通過在數(shù)據(jù)區(qū),填充了一個圖片完成的,這里主要是要設(shè)置不同區(qū)間的閾值,這需要深入了解業(yè)務(wù)。
附錄
以上內(nèi)容參考: https://antv.alipay.com/vis/doc/chart/details/scatter-plot.html