原來圖表還有這樣的發(fā)展歷史,這下總學(xué)會(huì)怎么用了吧

作者:可樂

來源:可樂的數(shù)據(jù)分析之路

轉(zhuǎn)載請(qǐng)聯(lián)系授權(quán)

你好,我是可樂

今天,當(dāng)我們游刃有余地使用圖表來進(jìn)行數(shù)據(jù)可視化操作的過程中,不知道你有沒有想過一個(gè)問題:

這些圖表都是怎么來的?

一開始,人們并沒有意識(shí)到可以用圖形來描述枯燥的文字,通過圖形來表示數(shù)量,還是一個(gè)相對(duì)較新的發(fā)展領(lǐng)域。

前人栽樹,后人乘涼,這篇文章就帶你了解那些圖形/圖表的發(fā)展歷史。

1、折線圖

1786年,William Playfair繪制了英格蘭在1700年到1780年的進(jìn)出口數(shù)據(jù)的線圖,被認(rèn)為是歷史上最早的線圖,也就是折線圖,橫軸是時(shí)間刻度,年份,縱軸是數(shù)值。

(插一個(gè)題外話,1786年對(duì)應(yīng)我國清朝乾隆時(shí)期,我們總說數(shù)據(jù)分析要具備對(duì)比的思維,對(duì)比來了)


最早的折線圖

折線圖是由直角坐標(biāo)系、點(diǎn)和線組成的圖表。通常用來展示數(shù)值型數(shù)據(jù)隨時(shí)間的變化,相比條形圖,它更能體現(xiàn)數(shù)據(jù)趨勢(shì)。


image

使用需注意:
  • 縱坐標(biāo)軸一般從0開始
  • 選用相對(duì)較粗的線型
  • 盡量不要超過5條線。
  • 若為預(yù)測(cè)值,請(qǐng)用虛線表示

2、 條形圖

還是這一年,William Playfair在《商業(yè)與政治圖解》中創(chuàng)造性地使用條形圖來呈現(xiàn)離散數(shù)量的比較,描述了蘇格蘭在1780年~1781年的進(jìn)出口數(shù)據(jù),從下面這張他的原稿中我們可以看到,橫坐標(biāo)表示進(jìn)出口的具體數(shù)值,縱坐標(biāo)表示不同的國家,這已經(jīng)和我們今天所使用的條形圖沒什么區(qū)別了。

最早的條形圖

條形圖可用來表示比例,對(duì)相對(duì)大小進(jìn)行比較,更精確,更容易發(fā)現(xiàn)細(xì)微的差別,條形圖可以垂直也可以水平,水平條形圖用于展現(xiàn)類別數(shù)據(jù),垂直條形圖用于展現(xiàn)數(shù)值型數(shù)據(jù)。
image

使用時(shí)需注意:
? 同一系列數(shù)據(jù)使用相同的顏色
? 盡量不要用傾斜的標(biāo)簽
? 若添加了數(shù)據(jù)標(biāo)簽,就刪掉網(wǎng)格線吧
? 讓數(shù)據(jù)由大到小排列。

3、餅圖

Playfair堅(jiān)信一圖勝千言,他又發(fā)明了餅圖、折線圖等,他一生從事過很多職業(yè),商人、統(tǒng)計(jì)學(xué)家、郵遞員、翻譯、會(huì)計(jì)等,可以說是一個(gè)妥妥的斜杠青年,或許正是這些職業(yè)經(jīng)歷,帶給了他圖形創(chuàng)作的靈感。

發(fā)明條形圖后的15年,也就是1801年,Playfair在他的《統(tǒng)計(jì)學(xué)摘要》中,他用餅圖描述了當(dāng)時(shí)的土耳其帝國在亞洲、歐洲和非洲的領(lǐng)土面積的比例,從他的原稿中可以看出,歐洲占比25%(右上直角),亞洲占比60%,非洲占比15%。這是餅圖的首次亮相。

(1801年,此時(shí)中國進(jìn)入清朝嘉慶帝時(shí)代)

最早的餅圖

餅圖,是將數(shù)據(jù)劃分為幾個(gè)有明顯區(qū)別的扇形的圓形統(tǒng)計(jì)圖表。在餅圖中,每個(gè)扇形的弧長(以及圓心角和面積)大小,表示該種類占總體的比例,且這些扇形合在一起剛好是一個(gè)完全的圓形。
image

餅圖主要體現(xiàn)的是比例,但是,由于人類對(duì)角度的感知力并不如長度,當(dāng)所有扇區(qū)大小相近時(shí),使用餅圖就無太大意義,建議用柱狀圖或條形圖代替。

如下圖所示,用餅圖分不清細(xì)微差別,但是用柱狀圖則一目了然。


image

使用時(shí)需注意:

  • 使用時(shí),須確認(rèn)各個(gè)扇形的數(shù)據(jù)加起來等于100%;
  • 避免扇區(qū)超過5個(gè),盡量讓圖表簡潔明了;
  • 注意扇形的排布順序,一般情況下,將最大的扇形放在12點(diǎn)鐘方向,接下來按面積依次排列;
  • 最后,正確使用顏色,既區(qū)分出需要強(qiáng)調(diào)的扇形,又不致于讓人眼花繚亂。

4、散點(diǎn)圖

1833年,John Herscherl 發(fā)表了一篇觀察雙星軌道的文章,其中使用了散點(diǎn)圖展現(xiàn)觀測(cè)時(shí)間和位置角之間的關(guān)系,這是第一個(gè)具有現(xiàn)代意義的散點(diǎn)圖。John Herscherl是發(fā)現(xiàn)了天王星和紅外光的威廉·赫歇爾的兒子。

(1833年,清朝道光時(shí)期,第一次鴉片戰(zhàn)爭(zhēng)即將爆發(fā))


最早的散點(diǎn)圖

前面我們說的圖表都是一維的,而散點(diǎn)圖是一個(gè)典型的二維圖表,它是由兩組數(shù)據(jù)構(gòu)成的多個(gè)坐標(biāo)點(diǎn)的統(tǒng)計(jì)圖表,主要用于數(shù)據(jù)趨勢(shì)的展示和數(shù)據(jù)間相關(guān)性的說明。


image

使用時(shí)需注意:
  • 散點(diǎn)圖適用于變量之間關(guān)系的探索
  • 在用散點(diǎn)圖做相關(guān)性分析時(shí),數(shù)據(jù)量若太少則沒有太大的說明意義
  • 數(shù)據(jù)點(diǎn)過大、過多,也會(huì)影響數(shù)據(jù)圖的可讀性
  • 數(shù)據(jù)分類不宜過多,分類太多會(huì)失去對(duì)比的意義

5、南丁格爾玫瑰圖

南丁格爾玫瑰圖,是餅圖的變種,它是弗羅倫斯·南丁格爾女士發(fā)明的,又名為極區(qū)圖、雞冠花圖。

要說到南丁格爾女士,也是很傳奇,她首先是一位護(hù)士,其次也是一名統(tǒng)計(jì)學(xué)家,更是英國皇家統(tǒng)計(jì)學(xué)會(huì)的第一位女性會(huì)員。

19世紀(jì)50年代,英國、法國、土耳其和俄國進(jìn)行了克里米亞戰(zhàn)爭(zhēng)。南丁格爾主動(dòng)申請(qǐng),自愿擔(dān)任戰(zhàn)地護(hù)士。當(dāng)時(shí)的醫(yī)院衛(wèi)生條件極差,甚至連干凈的水源與廁所都沒有,傷士死亡率高達(dá)42%,直到 1855 年衛(wèi)生委員會(huì)來到醫(yī)院改善整體的衛(wèi)生環(huán)境后,死亡率才戲劇性地降至 2.5% 。當(dāng)時(shí)的南丁格爾注意到這件事,認(rèn)為政府應(yīng)該改善戰(zhàn)地醫(yī)院的條件來拯救更多年輕的生命。

出于對(duì)資料統(tǒng)計(jì)的結(jié)果會(huì)不受人重視的憂慮,她發(fā)明出一種色彩繽紛的圖表形式,讓數(shù)據(jù)能夠更加讓人印象深刻。

這張圖就是南丁格爾當(dāng)時(shí)報(bào)告這件事時(shí)所用的圖表,以表達(dá)軍醫(yī)院季節(jié)性的死亡率,從整體上來看:這張圖是用來說明、比較戰(zhàn)地醫(yī)院傷患因各種原因死亡的人數(shù),每塊扇形代表著各個(gè)月份中的死亡人數(shù),面積越大代表死亡人數(shù)越多。

(19世紀(jì)50年代,對(duì)應(yīng)清朝咸豐時(shí)代,此時(shí)第一次鴉片戰(zhàn)爭(zhēng)已經(jīng)爆發(fā),中國已經(jīng)淪為半殖民地半封建社會(huì),1856年第二次鴉片戰(zhàn)爭(zhēng)爆發(fā))


image

這張圖里有一大一小兩個(gè)玫瑰圖,右側(cè)較大的玫瑰圖,展現(xiàn)的是1854 年 4 月至 1855 年 3 月的數(shù)據(jù);而左側(cè)的玫瑰圖,展現(xiàn)的則是 1855 年 4 月至 1856 年 3 月的數(shù)據(jù),以1855 年4 月做為分界,將24 個(gè)月的資料切分為左右兩張圖再用黑色線條連結(jié),是因?yàn)檫@大約便是衛(wèi)生委員會(huì)來改善環(huán)境時(shí)的日期,也因此我們可以比較兩個(gè)年度的死亡人數(shù)與其原因的概略比例。

? 灰色的區(qū)域的面積明顯大于其他顏色的面積。這意味著大多數(shù)的傷亡并非直接來自戰(zhàn)爭(zhēng),而是來自糟糕醫(yī)療環(huán)境下的感染。
? 衛(wèi)生委員到達(dá)后(1855年3月),死亡人數(shù)明顯的下降。

她的方法打動(dòng)了當(dāng)時(shí)的高層,包括軍方人士和維多利亞女王本人,于是醫(yī)事改良的提案才得到支持,因該圖的外形酷似一朵綻放的玫瑰,因此“南丁格爾玫瑰圖”也就由此而來。

關(guān)于該圖形的制作方法,我在 教你做超驚艷的南丁格爾玫瑰圖 這篇文章中有詳細(xì)的說明。

使用時(shí)需注意:

  • 餅圖是用角度的大小體現(xiàn)數(shù)值或占比;
  • 南丁格爾玫瑰圖是用扇形的半徑表示數(shù)據(jù)的大小,各扇形的角度則保持一致。
  • 可以說南丁格爾玫瑰圖實(shí)際上是一種極坐標(biāo)化的圓形直方圖。它夸大了數(shù)據(jù)之間差異的視覺效果,適合展示數(shù)據(jù)原本差異小的數(shù)據(jù)

6、斯諾的霍亂地圖

霍亂,是因攝入的食物或水受到霍亂弧菌污染而引起的一種急性腹瀉性傳染病,能在數(shù)小時(shí)內(nèi)造成腹瀉脫水甚至死亡。

1854年倫敦蘇荷區(qū)爆發(fā)霍亂,當(dāng)時(shí)人們還不知道霍亂是為何引起的,更不知該如何應(yīng)對(duì)。面對(duì)這種傳染率強(qiáng),致死率也高的傳染病,當(dāng)時(shí)的人們束手無策。

英國麻醉學(xué)家、流行病學(xué)家John Snow走訪疫區(qū),在地圖上用散點(diǎn)來表示霍亂案例與周圍水泵的關(guān)聯(lián),并且用統(tǒng)計(jì)數(shù)據(jù)來說明水源水質(zhì)與霍亂的相關(guān)性,最終鎖定了一個(gè)公共水井。

(1856年第二次鴉片戰(zhàn)爭(zhēng)爆發(fā),清政府被迫簽訂了一系列不平等條約)

image

雖然約翰·斯諾并沒有發(fā)現(xiàn)霍亂病的病原體,但創(chuàng)造性地使用空間統(tǒng)計(jì)學(xué)查找到傳染源,給了后人無限的利用價(jià)值。

隨著公共衛(wèi)生體系的成熟,配合抗生素治療,霍亂已經(jīng)沒有那么可怕了。

7、?;鶊D

1812年拿破侖向俄國宣戰(zhàn),從法國出發(fā)進(jìn)軍莫斯科,最后失敗。

法國土木工程師Charles Joseph Minard于1869年11月20日發(fā)表了一幅統(tǒng)計(jì)圖形,將?;鶊D與制圖以及溫度線圖表結(jié)合在一起,對(duì)這場(chǎng)戰(zhàn)爭(zhēng)的進(jìn)程進(jìn)行了非常直觀的展示。42.2萬人的軍隊(duì)是如何在戰(zhàn)斗、地理和冰凍的影響下付出慘痛代價(jià),最終減少到只有1萬人的,這就是著名的拿破侖東征圖,也是最早的?;鶊D。

這幅圖展示了拿破侖軍隊(duì)的數(shù)量、行進(jìn)的路程、維度、經(jīng)緯度、行進(jìn)方向、特定日期或事件的位置。

(1869年,清朝同治時(shí)期,慈禧掌權(quán))


image

?;鶊D,是一種表現(xiàn)流程的示意圖,用于描述一組值到另一組值的流向。分支的寬度對(duì)應(yīng)了數(shù)據(jù)流量的大小。如下圖所示,對(duì)用戶轉(zhuǎn)化情況進(jìn)行了描述,多少用戶加入購物車,又有多少用戶付款等流程。


image

使用時(shí)需注意:

  • 顏色避免太過花哨,影響閱讀
  • ?;鶊D的特點(diǎn)是能量守恒,因此每條邊,寬度應(yīng)是保持不變的

參考:

  1. http://www.tuzhidian.com/chart?id=5c553ca258461d3fa6136677
  2. https://blog.csdn.net/weixin_38754337/article/details/113532959
  3. 《統(tǒng)計(jì)之美》
  4. http://finance.sina.com.cn/money/fund/fundzmt/2020-01-21/doc-iihnzahk5562348.shtml
  5. https://www.datavis.ca/papers/friendly-scat.pdf
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容