当前位置: 首页 > news >正文

王烨张开西安网站关键词优化推荐

王烨张开,西安网站关键词优化推荐,佛山响应式网站开发,国外酷炫网站有哪些…… 书接上文 4.车辆等级维度 探查车龄为5年的车辆,折旧价值与车辆等级的关系。 # 筛选出车龄为5的数据创建新表 data_age5 data[data[age] 5] data_age5 # 分组聚合计算均值 data_car_level data_age5.groupby(car_level_name)[lowest_price].mean().reset…

……

书接上文

4.车辆等级维度

探查车龄为5年的车辆,折旧价值与车辆等级的关系。

# 筛选出车龄为5的数据创建新表
data_age5 = data[data['age'] == 5]
data_age5
# 分组聚合计算均值
data_car_level = data_age5.groupby('car_level_name')['lowest_price'].mean().reset_index()
data_car_level

这里用到了 DataFrame 的 groupby 函数,这个函数对于数据处理的重要程度无需赘言。

groupby 必须配合聚合函数同时使用,否则只能得到一个 DataFrameGroupBy 类型的玩意儿。

这里是可以只传 groupby 参数,不写聚合函数作用的字段的,也就是:

data_age5.groupby('car_level_name').mean()

这样的效果和前面提到的 describe 函数相似,会对所有数值字段进行聚合计算。

这里还用到了 reset_index 函数,可以给生成的新表添加一列数字索引。

data_car_level_sort = data_car_level.sort_values('lowest_price',ascending = False)
data_car_level_sort

创建新表,使用 sort_values 函数对数据进行排序。第一个参数必穿,是排序的数值列名,第二个参数是调整升序降序,默认升序,给参数 False 可以改为降序。

5.标签维度——可视化

根据标签,对比5年车龄车辆残值价格。

尝试使用另一种分组聚合方式——数据透视表:

data_picture = data_age5.pivot_table(index = 'maker_type', values = ['lowest_price'],aggfunc=np.mean)
bar_data_picture = data_picture.reset_index()
bar_data_picture

使用 pivot_table 函数,含义与 group by 相同,索引 index 就是分组的列,值 values 就是需要聚合计算的数值列,聚合函数 aggfunc 使用 numpy 包中的聚合函数,这里依旧取平均值。

# 设置字体
plt.rcParams['font.sans-serif'] = ['SimHei']
# 设置编码,保证图表中中文和符号正常显示
plt.rcParams['axes.unicode_minus'] = False
# 定义x轴和y轴都是哪些数据
sns.barplot(x = bar_data_picture['maker_type'], y = bar_data_picture['lowest_price'], ci=68)
# 设置标题
plt.title('五年车龄二手车价格对比')
plt.show()

使用 matplotlib.pyplot 包进行可视化属性参数配置。

更多配置详情请看:

http://t.csdn.cn/Kkx8Ihttp://t.csdn.cn/Kkx8I使用 seaborn 包传输图像必须的横纵坐标数据并展示。

注:查看matplotlib默认配置参数:print(plt.rcParams)

6.品牌维度——箱线图

data_brand = data_age5.groupby('brand')['lowest_price'].mean().reset_index()
data_brand_sort_desc = data_brand.nlargest(5, 'lowest_price')
data_brand_sort_desc

同样分组聚合,查看各个品牌的车辆残值价格平均数,然后取价格最高的前五个品牌。

使用 nlargest 函数可以轻松获得,与之相对的还有取最小值的前n个元素的函数 nsmallest 。

data_brand_sort_desc_plot = data_age5[data_age5['brand'].isin(data_brand_sort_desc.brand)]
data_brand_sort_desc_plot

反向取得价格平均数前五的品牌的车辆全部信息。

这里的 data_brand_sort_desc.brand 和 data_brand_sort_desc['brand'] 含义相同,也是提取表的一列。

isin 函数使用方式和SQL类似,利用布尔索引判断目标表的某一列值是否在条件列中。

上述过程相当于SQL的:

select t1.*
from 总表 t1
where lowest_price in (select lowest_price,brandfrom (   selectavg(lowest_price) lowest_price,brandfrom 总表group by brand) t2order by lowest_price desclimit 5
) 

对比SQL的复杂写法和嵌套逻辑,python代码看起来就简单多了(看起来)。

sns.boxplot(x='brand',y='lowest_price',data=data_brand_sort_desc_plot)

然后进行可视化,使用 boxplot 函数生成箱线图,传入 x 轴 y 轴以及表名,可以观察到数据的中位数、上下四分位数、异常值分布。

关于箱线图怎么看,以及 boxplot 函数的详细使用,和参数修改,可以参考:http://t.csdn.cn/jNh8Xicon-default.png?t=N4P3http://t.csdn.cn/jNh8X

7.相关性分析——热力图

python有一个探查不同维度之间相关性的常用函数,corr:

correlation = data.corr()
correlation

这是在对全体数据进行各维度相关性探查,corr 函数会将 DataFrame 表中所有数值类型的列进行相关性计算,计算结果在 -1 和 1 之间,结果越接近 1 表示两个维度值之间越正相关,越接近 -1 则说明两个维度值之间越呈负相关。

sns.heatmap(correlation, linewidth = 1.0, linecolor = 'white', square = True, annot = True, vmax=1.0) 
# annot是否显示值
# vmax热力图取值颜色最大值 
# square是否是正方形

紧接着用 heatmat 函数生成多热力图查看数据相关度整体情况,通过调整配置参数值,可以轻松看到数据各个维度的相关性。

结论:

二手车价格与新车价格呈很强的正相关;

车龄与二手车残值率呈很强的负相关;

车龄与二手车净残值也呈负相关,但没有残值率体现的明显。

(完)

http://www.qdjiajiao.com/news/4153.html

相关文章:

  • 邓州网站优化2023新闻摘抄大全
  • 网站建设全网营销客户资源国家培训网官网
  • 民权做网站的公司凡科建站怎么用
  • 昆明做网站哪家好谷歌chrome浏览器
  • 新乡营销型网站建设常用的搜索引擎有
  • dw网站设计模板谷歌推广哪家公司好
  • 网站建设就业方向怎么建立信息网站平台
  • 泉州seo网络营销惠州seo
  • 济南做企业网站公司吉林百度查关键词排名
  • 怎么欣赏一个网站设计图百度最新版下载
  • 网站建设有哪些渠道微博营销
  • 2345网址导航是什么公司的seo方式包括
  • 惠州网站建设优化众志seo
  • 网站标题前的小图标怎么做怎么做好网络销售
  • 外贸网站建设入门q群排名优化软件
  • 西安网站设计公司网络运营商
  • 静态网站做毕业设计网页设计制作网站代码
  • java 做网站后台东莞百度seo推广公司
  • 兼职做网站 深圳推广普通话手抄报简单又好看
  • 怎样看一个网站是哪个公司做的营销文案
  • 做网站开发能挣钱网络推广平台几大类
  • 做课内教学网站百度指数是啥
  • 建站网站破解版小程序推广运营的公司
  • 南通网站建设协议目前最靠谱的推广平台
  • wordpress插件 2017重庆网站关键词排名优化
  • 花生壳顶级域名可以做网站优化方案模板
  • 网站meta标签怎么做广东互联网网络营销推广
  • 路桥区高质量营销型网站建设小红书关键词搜索量查询
  • 自建企业网站教程被忽悠去做网销了
  • 北京 网站制作网站建设