上文介紹了如何獲取二手房?jī)r(jià)數(shù)據(jù)以及數(shù)據(jù)的清洗,本文將利用python的畫圖工具包matplotlib對(duì)這些數(shù)據(jù)做一些簡(jiǎn)要的分析。
(1)直方圖(分布圖)

從直方圖中可以看出,上海市二手房的平均價(jià)格大概在5萬(wàn)/平方米,總體呈現(xiàn)右偏分布,說明每平米的房屋均價(jià)存在極大值,使得平均值大于中位數(shù)。
(2)箱線圖

從箱線圖中可以看出,數(shù)據(jù)有些離散,且有較多的異常值分布在右側(cè),和直方圖所呈現(xiàn)出的右偏分布一致。
(3)折線圖

如上圖所示,折線圖中分別比較了上海各個(gè)地區(qū)房?jī)r(jià)的最高價(jià)、均價(jià)和最低價(jià)。通過比較可以發(fā)現(xiàn),徐匯、靜安、長(zhǎng)寧、浦東等地區(qū)的房?jī)r(jià)差異較大,而崇明和金山房?jī)r(jià)差異較小。如果只比較均價(jià)的話,從圖中可以發(fā)現(xiàn)黃埔、徐匯、靜安等地區(qū)的房?jī)r(jià)相對(duì)較高。
(4)散點(diǎn)圖

上圖橫軸為房間的面積,縱軸為房屋總價(jià)。從圖中可以看出,房屋的總價(jià)和房屋面積呈現(xiàn)出正相關(guān)關(guān)系,隨著房屋面積的增加,房屋總價(jià)也在增加。且金山區(qū)的房屋面積集中在100到400平左右,而長(zhǎng)寧區(qū)的房屋面積則比較分散。
(5)雷達(dá)圖

從雷達(dá)圖中可以看出,相對(duì)而言,徐匯地區(qū)的醫(yī)療資源較為豐富,浦東的地鐵相對(duì)較多,而松江地區(qū)的公園較多(可能是因?yàn)樵诮紖^(qū))