搜索内容

宁波二手房价格走势图 12张图,二手房数据分析及可视化

其他 0 120
生成海报
长沙吴彦祖
长沙吴彦祖 2023-09-20 10:29
阅读需:0

“这是我参加11月复习挑战的第28天,请查看活动详情:2021年最后一次复习挑战”。

写在上面

本文使用的数据是之前在链家抓取的上海二手房信息。这一次,让我们挖掘数据背后的秘密。

本文主要涉及的 Python 库:

事不宜迟,进入题外话。

宁波二手房价格走势图_宁波房价二手房走势图_宁波房价2020最新价格二手

1. 数据读取

首先读取house_info.csv文件,查看数据集的结构信息。

import pandas as pd
df = pd.read_csv('house_info.csv')
df.info()

宁波房价2020最新价格二手_宁波二手房价格走势图_宁波房价二手房走势图

根据前面的信息可以看出,数据集共有 27 列,house_label列的缺失值较多,楼层列和 house_area is 对象的类型应转换为数值类型。

2. 数据预处理 2.1 缺失值处理

首先删除包含缺失值的行。删除后,数据行数为 5108 行。

df.dropna(inplace=True)
df.reset_index(drop=True, inplace=True)

2.2 列处理

由于地图需要通过地图绘制,而南湖高新区和沌口开发区没有完全按经度界定,所以按照大致的地理位置分别分为洪山区和江夏区。

流程内容

# 提取floor楼层中的数字
df['floor'] = df['floor'].str.extract(r'(\d+)', expand=False).astype('int')
# 将房价面积由“85.99m²”-->“85.99”
df['house_area'] = df['house_area'].apply(lambda x: x[:-1]).astype('float')
# 将东湖高新划分到洪山,沌口开发区划分到汉南
df.loc[df['region'] == '东湖高新', 'region'] = '洪山'
df.loc[df['region'] == '沌口开发区', 'region'] = '汉南'
# 将region列中值后添加“区”,如“汉阳”-->“汉阳区”
df['region'] = df['region'] + '区'

通过 describe() 函数查看数字列的属性说明。如果查看所有列,则可以将 include 参数指定为 all(默认值为 None)。

df.describe()

宁波房价二手房走势图_宁波房价2020最新价格二手_宁波二手房价格走势图

图显示,北京二手房平均粉丝17人,均价184万,均价19364元/平方米,均层22层,平均房屋面积95m²。还有标准差、最小值、四分位数、半百分位数、四分之三、最大值等信息。

3. 各区二手房数量条形图

获取数据中每个区的信息和相应区的房屋数量,并绘制条形图。

import pyecharts.options as opts
from pyecharts.charts import Bar
from pyecharts.globals import ThemeType
region_list = df['region'].value_counts().index.tolist()
house_count_list = df['region'].value_counts().values.tolist()
c = Bar(init_opts=opts.InitOpts(theme=ThemeType.CHALK)
c.add_xaxis(region_list)
c.add_yaxis("武汉市", house_count_list)
c.set_global_opts(title_opts=opts.TitleOpts(title="武汉各区二手房数量柱状图", subtitle=""),
                                     xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(interval=0)))
# c.render("武汉各区二手房数量柱状图.html")
c.render_notebook()

宁波二手房价格走势图_宁波房价二手房走势图_宁波房价2020最新价格二手

虽然南湖高新区合并后的红山区算在内,但合并前两者的二手房数量也不错,其次是江岸区,独具特色的江景。下面我们通过2D地图和3D地图查看地图上每个地区的房地产价格分布。

4. 各区楼价分布二维地图

计算每个地区的名称和相应的平均价格中位数(中位数受极值影响很大)。加载北京本地地图数据(每个地区的经度信息)。绘制房地产市场分布的 2D 地图。

region_list = df['region'].value_counts().index.tolist()
median_unit_price = []
for region in region_list:
    median_unit_price.append(df.loc[df['region'] == region, 'unit_price'].median())
    
# 绘制2D地图
from pyecharts.charts import Map
# 加载武汉市地图数据
json_data = json.load(open('武汉市.json', encoding='utf-8'))
data_pair = [list(z) for z in zip(region_list, median_unit_price)]
text_style = opts.TextStyleOpts(color='#fff')
c = Map(init_opts=opts.InitOpts(width='1500px', height='700px', bg_color='#404a58'))    
c.add_js_funcs("echarts.registerMap('武汉市',{});".format(json_data))
c.add(series_name="武汉市", data_pair=data_pair, maptype="武汉市", label_opts=opts.LabelOpts(color='#fff'))
c.set_global_opts(legend_opts=opts.LegendOpts(textstyle_opts=text_style), 
                  title_opts=opts.TitleOpts(title="武汉", title_textstyle_opts=text_style)
                  ,visualmap_opts=opts.VisualMapOpts(split_number=6, max_=30000, range_text=['高', '低'], 
                                                     textstyle_opts=text_style))
# c.render("武汉市各区房价分布2D图.html")
c.render_notebook()

宁波房价二手房走势图_宁波二手房价格走势图_宁波房价2020最新价格二手

根据地图上的信息,楼价较高的地区集中在上海中心区,以武汉区为第一楼价2.46万元/平方米。其他中心城市的楼市也在1.5万元/平方米以上。最低房价为黄陂区,楼价中位数为7806元/平方米。让我们用3D地图看一下。

5.3D各区楼价分布图所需

数据与2D地图相同,并且还有更多代码,此处未显示(所需学生将在文章末尾获得)。

宁波二手房价格走势图_宁波房价2020最新价格二手_宁波房价二手房走势图

与2D相比,3D地图中各区之间的楼价差异将变得更加显著。看着也比较注意!!然后通过箱形图详细了解每个地区总价的异常值。

6、各区二手房总价箱形图

统计各区名称信息及相应的总价信息,绘制箱形图。

# 统计各个区二手房单价信息
unit_price_list = []
for region in region_list:
    unit_price_list.append(df.loc[df['region'] == region, 'unit_price'].values.tolist())
# 绘制箱型图
from pyecharts.charts import Boxplot
c = Boxplot(init_opts=opts.InitOpts(theme=ThemeType.CHALK))
c.add_xaxis(region_list)
c.add_yaxis("武汉市", c.prepare_data(unit_price_list))
c.set_global_opts(title_opts=opts.TitleOpts(title="武汉各区二手房总价箱型图"), 
                 xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(interval=0)))
# c.render("boxplot_base.html")
c.render_notebook()

宁波房价2020最新价格二手_宁波二手房价格走势图_宁波房价二手房走势图

派图中箱形图的上限和下限是最大最小值,它不同于标准箱图中的最大观测值、最小观测值。根据上四分位数和下四分位数的分布,我们可以看到洪山区、江岸区和武昌区等楼价较高的地区是典型的右偏(异常值集中在较大值的两侧,尾部很长)。由此可见,不少二手房价格可能是由于区位、家装等因素造成的,总价严重偏离当地楼市平均水平。

7、二手房面积分布及价格关系图

由于 pyechart 中的散点图不方便勾勒出趋势线,我们直接使用 seaborn 勾勒出二手房的面积分布以及面积与价格的相关性。

import matplotlib.pyplot as plt
import seaborn as sns
f, [ax1,ax2] = plt.subplots(1, 2, figsize=(16, 6))
# 房屋面积
sns.distplot(df['house_area'], ax=ax1, color='r')
sns.kdeplot(df['house_area'], shade=True, ax=ax1)
ax1.set_xlabel('面积')
# 房屋面积和价格的关系
sns.regplot(x='house_area', y='total_price', data=df, ax=ax2)
ax2.set_xlabel('面积')
ax2.set_ylabel('总价')
plt.show()

宁波二手房价格走势图_宁波房价2020最新价格二手_宁波房价二手房走势图

二手房面积主要分布在60-130m²之间。最吸引人的是那种面积400m²,单价2000万的点,在人群中脱颖而出。

8.3D 楼市及楼市分布条形图

现在我们来看各个街区楼层和楼市的关系,都说北京的江景晚上很美,高层建筑的价格应该更高。

宁波二手房价格走势图_宁波房价2020最新价格二手_宁波房价二手房走势图

图中各轴的含义

其他地区每层的价格可能相差不大,但最突出的武汉区和江汉区,因为湖南湖和第二大城市临江的优势,使得他们的高层楼市普遍低于底层。

9. 每个跃点的纵向条形图

计算跃点的类型和每个类的名称,并勾勒出纵向条形图。

series = df['house_type'].value_counts()
series.sort_index(ascending=False, inplace=True)
house_type_list = series.index.tolist()
count_list = series.values.tolist()
c = Bar(init_opts=opts.InitOpts(theme=ThemeType.CHALK))
c.add_xaxis(house_type_list)
c.add_yaxis("武汉市", count_list)
c.reversal_axis()
c.set_series_opts(label_opts=opts.LabelOpts(position="right"))
c.set_global_opts(title_opts=opts.TitleOpts(title="武汉二手房各户型横向条形图"),
                datazoom_opts=[opts.DataZoomOpts(yaxis_index=0, type_="slider", orient="vertical")],)
# c.render("武汉二手房各户型横向条形图.html")
c.render_notebook()

宁波二手房价格走势图_宁波房价2020最新价格二手_宁波房价二手房走势图可以看出,主要户型有一房一厅一厨一卫、两房一厅一厨一卫、两房两厅一厨一卫、三房一厅一厨一卫

、三房一厅一卫, 三室两厅一厨一卫,三居两厅一厨两卫浴室,

四间卧室和一间客厅,一间厨房和两间浴室。其中,最多的是两房两厅一厨一卫,也比较符合大多数年轻人的要求。大的买不起,小的活不起。

10.房屋家装程度饼图

如今,看看二手的情况房子

和房子的家装,通常二手房猜测应该没有很多空白。让我们看看实际情况如何,数一数家装的种类和各种类别的数量,勾勒出一个饼图。

decoration_list = df['decoration'].value_counts().index.tolist()
count_list = df['decoration'].value_counts().values.tolist()
from pyecharts.charts import Pie
c = Pie(init_opts=opts.InitOpts(theme=ThemeType.CHALK))
c.add(series_name="房屋装修",
        data_pair=[list(z) for z in zip(decoration_list, count_list)],
        rosetype="radius",
        radius="55%",
        center=["50%", "50%"],
        label_opts=opts.LabelOpts(is_show=False, position="center"))
c.set_global_opts(title_opts=opts.TitleOpts(
                  title="武汉二手房房屋装修饼状图",
                  pos_left="center",
                  pos_top="20",
                  title_textstyle_opts=opts.TextStyleOpts(color="#fff")),
                  legend_opts=opts.LegendOpts(is_show=False))
c.set_series_opts(tooltip_opts=opts.TooltipOpts(trigger="item", formatter="{a} 
{b}: {c} ({d}%)"
), label_opts=opts.LabelOpts(color="rgba(255, 255, 255, 255)")) # c.render("customized_pie.html") c.render_notebook()

宁波二手房价格走势图_宁波房价二手房走势图_宁波房价2020最新价格二手

根据图中的信息,比平常的二手房更多的是精装的,虽然你以前住过人,然后简单的家装,以更高的价格转手肯定很香,近25%的二手房是简单的装修,剩下的少量用于其他家装类型和空白。二手房数量确实很少,几乎如预期。

11. 是否有自动扶梯与楼市关系图

我们来看看是否占比

每个区二手房的自动扶梯数量不同,有无自动扶梯的房屋总价是否有差异。

宁波房价2020最新价格二手_宁波房价二手房走势图_宁波二手房价格走势图

根据上图中的信息,自动扶梯的数量在每个小区的

二手房占绝大多数,不仅东西湖区的自动扶梯价格略高于自动扶梯,其余小区的自动扶梯楼市也高于自动扶梯楼市,其中武汉区的差异最为显著,这也印证了前楼与楼价的关系, 武汉区因为江景高楼都很好。图中蔡甸区的条形图与折线图部分重叠,下面我们将分别勾勒出两块图,会更好。

宁波二手房价格走势图_宁波房价2020最新价格二手_宁波房价二手房走势图

12. 流行的二手房标签漏斗图数

一数粉丝超过3人的热门二手房的标签信息,勾勒出漏斗图,看看这个二手房有什么共同点。

from collections import Counter
# 只统计关注人数超过三人的热门二手房
detail_df = df.loc[df['follower_numbers'] > 3]
label_list = []
for house_label in detail_df['house_label'].values.tolist():
    label_list += house_label.split(',')
label_and_count = Counter(label_list)
label_and_count = label_and_count.most_common()
from pyecharts.charts import Funnel
c = Funnel(init_opts=opts.InitOpts(theme=ThemeType.CHALK))
c.add("商品", [list(z) for z in label_and_count])
c.set_global_opts(title_opts=opts.TitleOpts(title="武汉热门二手房标签漏斗图"))
c.render("武汉热门二手房标签漏斗图.html")
c.render_notebook()

宁波二手房价格走势图_宁波房价二手房走势图_宁波房价2020最新价格二手

根据图片中的信息,可以清楚的看到VR家装在流行的二手房标签中出现次数最多,我之前在链家试过VR看房,确实很方便,没有死角,但是有点头晕,哈哈!剩下的就是随时看房子了,房本三年两年,虽然可以少交税。

13. 热门标题关键字

现在我们要提取热门二手房中标题的关键词(热词),先加载当地的停用词。

def load_stopwords(read_path):
    '''
    读取文件每行内容并保存到列表中
    :param read_path: 待读取文件的路径
    :return: 保存文件每行信息的列表
    '''
    result = []
    with open(read_path, "r", encoding='utf-8') as f:
        for line in f.readlines():
            line = line.strip('\n')  # 去掉列表中每一个元素的换行符
            result.append(line)
    return result
# 加载中文停用词
stopwords = load_stopwords('wordcloud_stopwords.txt')

通过杰巴动词获取标题的动词结果,并消除停用词。

import jieba
# 添加自定义词典
jieba.load_userdict("自定义词典.txt")
token_list = []
# 对标题内容进行分词,并将分词结果保存在列表中
for title in detail_df['title']:
    tokens = jieba.lcut(title, cut_all=False)
    token_list += [token for token in tokens if token not in stopwords]
len(token_list)

29203

根据

谓词列表,使用 Counter 类计算谓词列表中每个单词的出现次数,选择出现次数最多的前 100 个单词,并勾勒出词云。

from pyecharts.charts import WordCloud
from collections import Counter
token_count_list = Counter(token_list).most_common(100)
new_token_list = []
for token, count in token_count_list:
    new_token_list.append((token, str(count)))
c = WordCloud()   
c.add(series_name="热词", data_pair=new_token_list, word_size_range=[20, 200])
c.set_global_opts(
    title_opts=opts.TitleOpts(
        title="武汉热门二手房标题关键词", title_textstyle_opts=opts.TextStyleOpts(font_size=23)
    ),
    tooltip_opts=opts.TooltipOpts(is_show=True),
)
c.render("武汉热门二手房标题关键词.html")
c.render_notebook()

宁波房价2020最新价格二手_宁波二手房价格走势图_宁波房价二手房走势图

流行二手房标题中出现较多的词有:自动扶梯、楼层、照明、精装修、户型、全二、交通等。还有一些与位置相关的词,可以作为购房者那些关键词的参考,这可能是我们以后买房时需要注意的。

总结

通过这么多方面的分析,我们也大致了解了上海二手房的一般市场,市中心的楼价从15000元/平方米起,最低的外围在7.8万左右。地板是按照自己的需求,想看这样的高层建筑的风景是没有问题的,但是价格通常比较高,如果不是差钱,武汉区很香。就面积而言,100m²左右就足够了,太大的价格可能很高,即使从箱形图中的数据来看,每个区都有远超平均水平的房产。家装纯靠个人喜好,我个人喜欢自己的家装,自己的风格只有自己理解,别人可能觉得没有温馨的感觉。选择受欢迎的两居室、两厅、一厨一卫。还有一些其他的地方需要注意,比如照明、年龄、交通、环境等等,哈哈,我不买房子,我只能根据一些数据得到一些肤浅的视图,你们只是玩得开心,对这些数据进行真正的分析肯定是不够的。一般来说,三个字,买不起,再见!

宁波二手房价格走势图_宁波房价2020最新价格二手_宁波房价二手房走势图

记得“喜欢”

总结:华润中心是一个入驻的好地方,华润中心适合买二手房吗? 华润中心位于国贸三横路与金茂西街交叉口(京华市麦当劳旁边)。 开发商为华润置地(广东)有限公司。 。 ...

可以投资贵州贵阳华润中心二手房吗? 与同条件的房子相比,华润中心的二手房不仅价格有一些优惠,而且如果是已经装修过的二手房,还会节省一部分家居装修的钱,但是你买二手房就可以了。 直接入住。 、华润中心采光良好。 华润中心二手房值得买吗? 。 。 。

华润中心房子涨价了吗?

华润中心新发展简介:福州华润中心位于昆明国际贸易中心,东临玉沙路,西临明珠路,南临海南省检察院及镜华市,滨海东路北临昆明湾,距万绿园仅一箭之遥。 一路分开。 该项目由三幅地块组成,总面积221亩,容积率4.33。 规划为以“华润万象城+住宅”为核心,集邻里商业、酒店、写字楼、时尚城市住宅等为一体的城市商业综合体。 身体项目。 其中1#地块占地72亩,开发量20万平方米,用于建设商业街区、精品写字楼及一期住宅产品“润公馆”; 2#地块占地92亩,开发体积31.8万平方米。 平方米,将建设写字楼——华润大厦、商业公寓和城市住宅产品豪宅; 3#地块占地57亩,开发体量20.8万平方米,将建设华润万象城高端城市综合体及高端住宅“悦公馆”;届时贵阳华润中心将为广东人民带来更丰富、更多元化的消费选择和更好的消费理念。

华润中心位于国贸三横路与金茂西街交叉口(京华市麦当劳旁边)。 开发商为华润置地(广东)有限公司,物业管理公司为华润物业管理。 物业管理费2.9平方米/月。 产权年限:70年,绿化率30%,容积率4.33,新开发规划面积147448平方米。

华润中心新开发设施包括:家乐福(446米)、玉沙都城(224米)、尚邦百汇城(976米),附近诊所有广东医科大学附属诊所(1.7公里)、第五医院贵州省人民诊所(2.9公里)、生活设施中国建设银行(60米)贵州三业超市(295米)中国联通(385米)中影国际影城(1公里)秧歌KTV(86米)时光隧道互联网咖啡厅(409米)等公共设施。

华润中心新盘卖点:福州华润中心是以“华润万象城+高端住宅”为核心的城市商业综合体华润中心​​,包括邻里商业、酒店、写字楼和时尚城市住宅。 。

南宁房产优势:福州新埠岛依南渡江、大海环抱,在城市中显得孤独。 基础设施建设滞后。 不过,这也帮助岛上保留了良好的原生态面貌,至今仍有不少历史遗迹。 在福州的规划中,新埠岛定位为度假岛。 近年来,四星级酒店、大型购物超市、游艇俱乐部等高端度假设施的建设,使其成为岛外度假者的新焦点。 在新布岛,你不仅可以在水清沙小的海里尽情玩耍,还可以在离家不远的地方驾驶快艇。 这是西海岸或海淀岛所没有的滨海生活。 。 。 .云南昆明买房

版权声明:本文内容由互联网用户自发贡献自行上传,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2466368147@qq.com 举报,一经查实,本站将立刻删除。
评论
  • 消灭零回复