一、分析背景

从铺天盖地的楼市消息中,不难发现,2018年房地产行业正面临着严峻的宏观调控,稳住不炒的原则已写入政府工作报告。各地楼市明显降温。特大城市也不例外。总的来看,上海一手房创纪录的销售价格控制,过去频繁出现地王的上海,在2018年变得平静了许多。各地区一手房销售价格总体保持平稳。对于购房者而言,同等条件下,优先购买新房,而非二手房,二手房购买需求明显减少。但从另一个角度来看,随着二手房市场活跃度的降低,二手房挂牌价格也在松动,市场上适合购买的二手房数量已经开始回落。增加。为了交通便利,很多上班族还是更喜欢选择离公司近、交通便利的楼盘作为选房的重要条件。此外,二手房老小区多,房屋面积小,总价低的优势也降低了购房者的进入门槛,对于刚工作的新上海人来说还是比较有吸引力的。

二、分析目的

为了给倾向于购买二手房的购房者提供一些更直观的购房信息,我通过外部公开网站获得了上海联嘉置业2018年第三季度的二手房挂牌数据希望通过对挂牌房屋数据的分析,为购房者提供一些有用的购房建议,尤其是如何在有限的预算内找到相对满意的房子。

三、分析思路

本文分析的总体思路是基于图表展示的方法得出结论,通过分析各个区域板块的房屋整体挂牌价格、房屋面积、新旧房屋、交通情况来帮助购房方便和对房地产的兴趣。根据自己的预算,综合考虑住房面积、交通便利、新旧房产程度等因素,选择自己满意的住房。

四、分析过程

(一)澄清问题

上海各区二手房挂牌价是多少?户型分布、新旧建筑程度、交通便利程度、楼盘受欢迎程度有什么特点?

(二)理解数据

上海联嘉置业2018年第三季度二手房挂牌数据该数据表包括九个字段:title、model、community、bulk、region、num、traffic、price、unit price(每平方米) 具体分析如下:

1.标题:因为是直接抓拍到的链家地产的网站信息,所以该字段对应的待售房源标题包括小区名称和房源的一些卖点(性质卖点的主要是Main,实际使用价值不大)由于后续字段已经提供了相应的信息,所以该栏数据的存在意义不大

2.模型:房间布局信息、面积、朝向、装修程度、是否有电梯等。字段属性太多,需要拆分分析

3. 社区:社区名称

链家房产官网成都_上海链家房产网_杭州链家房产官网电话

4.建造:楼层、建造时间等,需要拆分的字段

5.地区:地区

6. num:listing的关注数、浏览量、listing信息发布时间、字段属性太多,需要拆分分析

7.交通:周边交通情况,部分字段属性与字段含义不一致,部分不匹配的数据记录需要转移到其他字段。

8. price:listing总价,单位:千

9.单价(每平方米):元

(三)数据清洗

1. 选择一个子集:前面分析的title字段中的数据没有太大的分析价值,所以考虑隐藏这个列的数据。 (去重操作完成后链接字段没有值,也会被隐藏)

2. 列名重命名:

(1)将model字段重命名为房子的布局,增加房子面积、朝向、装修程度、是否有电梯四个字段

(2)将社区字段重命名为社区名称

(3)将bulit字段重命名为楼层,增加总楼层数、小区建设时间、建筑结构

(4)将区域字段重命名为区域

(5)将num字段重命名为listing的关注人数,增加浏览量,listing信息发布时间字段

杭州链家房产官网电话_上海链家房产网_链家房产官网成都

(6) 将交通字段重命名为交通状况

(7)将价格字段重命名为总标价(万元)

3. 删除重复值:在整个数据表中,第一列的链接字段是链家地产网站的URL信息。这条记录应该是唯一的,所以该字段作为判断是否删除重复标准,操作后删除

数据表中有381个重复数据。

4.缺失值处理:对数据表中的各个字段进行筛选后,发现数据完整,没有缺失值

5. 一致性:

(1) 将布局字段中的几个属性分开,让每个属性与实际字段一一对应(房屋布局、房屋面积、朝向、装修程度、是否有电梯)

p>

(2)将楼层字段中的几个属性分开,让每个属性与实际字段一一对应(楼层、总楼层数、小区建设时间、建筑结构)

(3)交通状况字段表示的值的含义与该字段的含义不一致,有些不匹配的数据记录需要转移到其他项目描述字段(房屋书5年以上/房本2年以上)/随时查看房间)

(4) 列表关注人数字段中的几个属性分开,让每个属性与实际字段一一对应(列表关注人数、浏览人数、以及上市信息的发布时间)

(5)将交通状况字段中的几个属性分开,以便后续分析房源与地铁站的距离(分隔字段为相邻地铁线路、地铁站名、距离)

p>

(6)提取涉及数字的字段的值,如房屋面积、总层数、小区建设时间、距离(m)、人数关注listing、浏览量、listing发布时间,数据分析会更方便。

链家房产官网成都_杭州链家房产官网电话_上海链家房产网

6.异常值处理:挂牌总价(万元)和单价(每平方米)这两个字段应该是数值数据上海链家房产网,需要转成文本格式,可以使用数据列函数。

7.根据业务分析需要调整数据表中字段的顺序。

(四)数据分析

1. 提问

(1)上海各区域板块整体挂牌价格有哪些特点?

(2)上海哪些地区二手房挂牌较多?

(3)listing中每个listing的区域分布有什么特点?

(4)listing中新旧楼盘分布情况如何?

(5)什么是真正的地铁房间?

(6) 对房地产最感兴趣的前 5 名房产是什么?

2.分析问题

(1)可以通过数据透视表分析上海各地区的平均挂牌价格,了解上海各地区的整体挂牌价格有哪些特点

从挂牌房屋平均总价来看,300W-400W和400W-500W这两个区间可购买的房屋面积最多,选择余地也比较大。

上海链家房产网_杭州链家房产官网电话_链家房产官网成都

从挂牌房单价来看,5W-7W区间房源最多,2W以下12W以上房源只有个位数。

(2)可以通过数据透视表分析上海各地区的房源数量,了解上海哪些地区的二手房房源较多

有一个地区有 70 多处二手房源。在 50-59 范围内有 4 个区域。半数以上的地区二手房挂牌量不足10套。

具体来说,房源数量排名前10的区域如下:

(3)可以使用数据透视表对所有房源的房屋面积进行分析,找出房屋中每个房源的房屋面积分布特征。

从挂牌房屋面积来看,近80%的房屋面积小于90平方米,为新进入上海工作的人提供了更多选择。

(4)可以使用数据透视表分析所有挂牌房屋的年龄上海链家房产网,找出房屋中房屋的新旧分布特征

忽略1970年以前或小区建成时的数据,二手房挂牌主要是1990年代和2010年以前的,2010年以后的新房较少。

(5)您可以使用数据透视表分析所有列出的社区,以找出哪些社区是真正的地铁房屋以及列出的数量

上海链家房产网_杭州链家房产官网电话_链家房产官网成都

我们将真正的地铁房子定义为距离地铁站1000米以内的社区,共有826间房子。房源数量排名前五的街区如下:

(6)根据关注者数量对所有房源进行排序,找出关注度最高的前5个房源

最受欢迎的楼盘有一个共同特点:地理位置优越,位于主要商圈,靠近地铁站,交通便利

五、分析结论和建议

1. 从挂牌房平均总价来看,挂牌房最多在300-500W区间。所以购房者的购房预算在300W以上,买二手房的时候会有大量的房子。选择。

2. 从挂牌房单价来看,5W-7W区间的房源最多。对于刚进上海打工的人来说,在上海买房还是比较难的,可以适当考虑。老旧小区面积较小,可以控制购房总价,实现落户需求。

3.根据联家地产提供的2018年第三季度二手房挂牌数据,上海半数以上地区的二手房挂牌数量不足10套。 2018年三季度二手房市场上市整体活跃度不够。但仍有老闵行区、金桥区、北菜区、采样区、甘泉宜川区等5个区的房源超过50套。有兴趣的买家可以优先考虑这些地区的房源。

4.从挂牌房面积来看,近80%的房源小于90平米,为新进上海打工的人提供了更多选择。

5. 二手房的挂牌大多是1990年代和2010年以前的,这个时期房屋的布局比较合理,购房率也比较高。但是,一般没有合理规划停车位。购买前,建议进一步了解小区周边停车问题。

6.如果住宅区1000米范围内有地铁站作为真正意义上的地铁房评判标准,挂牌的二手房近半数都在挂牌,中心城区的二手房比较大。交通便利优势明显。

7.最受欢迎的房源一般地理位置优越,位于主要商圈,靠近地铁站,交通便利。在预算充足的前提下,建议选择具备以上条件的房子,自住的同时可以兼顾投资物业。