項目名稱:鏈家租房分析
數據來源:網上爬取鏈家租房網數據
主要字段:數值型數據包括:價格、房屋面積;
非數值型數據包括:地區(qū)、類型、朝向、租賃方式、電梯、車位等
分析內容:

一、導入庫和讀入數據
1. 導入相關庫

2.讀取數據(由于爬蟲中斷,數據保存在兩個csv文件中,需要縱向合并一下數據)

二、數據預處理
1.缺失值與重復值處理
無缺失值,有重復值,刪除重復值并重置索引




2. 數據字段的處理

2.1房屋類型字段的處理

2.2 房屋面積字段的處理

2.3朝向,樓層,電梯,車位四個字段的處理

數據相對簡單,到此為止,我們的數據就處理完成了,下一步就要做數據分析了~~
三、數據分析
1.查看一下數值型數據的整體情況,數值型字段包括價格和房屋面積兩個字段,房租的平均價格是2743,方差是1318波動較大,平均面積是36m2,方差是29波動較大。

2.價格分布圖
平均價格2743,大多處于2000~4000之間,存在一些極值點,可能是整租房的價格較高

3. 房屋面積分布圖
平均面積36m2,同樣存在一些極值點,可能是整租房面積較大

4. 租賃方式分析
整租房的數量約是合租房的2倍,整租的價格也比合租的價格高


5. 房屋類型及朝向分析
1室1廳1衛(wèi)的數量最多為618,其次是1室0廳1衛(wèi)為569
朝向為南的數量最多為961,其次是朝向為東南的數量為480

6. 電梯、車位的分析
有電梯的房子占63.98%,可以租用車位的房子數量占25.33%,免費使用車位的占1.10%,深圳果然是租房難,停車難

7. 各區(qū)域房子數量與價格分布
房源數量排名前五的區(qū)域分別是龍崗,福田,羅湖,南山,寶安,其中龍崗區(qū)房源數量多,價格也相對偏低,是個租房的好地方


8. 各區(qū)域房子價格分布
福田區(qū)價格最高,為3268,價位波動較大,最高的達15000

9. 各區(qū)域房子面積分布
光明區(qū)的平均面積最大為60m2,龍崗區(qū)45m2也是很不錯的了,福田區(qū)只有27m2,真是又貴又小吶,租在福田區(qū)的孩子表示傷不起。

10. 各區(qū)域房子價格與面積散點圖
租房密集區(qū)域主要集中在福田區(qū),羅湖區(qū),南山區(qū),龍崗區(qū),寶安區(qū),針對這幾個地方,性價比最高的租房區(qū)域是龍崗區(qū),其次是寶安區(qū),羅湖區(qū),福田區(qū),南山區(qū),福田區(qū)因為房屋區(qū)域面積波動存在較多極大值點,所以導致性價比排名比南山還靠前,感覺福田區(qū)應該是性價比最低的呢。

