目录
- 一、概念介绍
- 二、数据展示
- 三、数据读入
- 四、图像绘制
- 总结
一、概念介绍
嵴线图(ridgeline plot),用来展示同一维度的几个数据的分布情况,每一层嵴线(峰峦)都是一个直方图或者密度图,层层堆叠形成了最终的嵴线图。
· 嵴线图一般用于多类别(>5) 的连续变量数值分布对比,也因此,如果某一个数据的取值区间过小或者分布平均时,波动不易察觉,且影响图形呈现的视觉美观。
图形示例:
我们需要了解的是:嵴线图的横坐标是数值分布区间,更像我们常使用的y轴;而纵坐标是每一个数值序列的类标;嵴线的波峰代表在对应值分布集中, 频率高。
二、数据展示
在本案例中,我们希望通过嵴线图展示随机选择的八座城市在过去一年的日最高温最低温分布情况。
数据来源于广州11月份天气编程客栈|广州11月份气温|广州2021年11月份历史天气—全球天气网
借助了爬虫工具,我们简便地收集了2020-12至2021-11的日度数据,得到如下excel集合
每一个excel表格的数据呈现如下:
同一版数据,对于气候类型也绘制了马赛克图~
三、数据读入
import pandas as pd city8_fullname_py = ['beijing','chongqing','wuhan','shenzhen','nanjing','guangzhou','chengdu','shanghai'] city8_fullname = ['北京','重庆','武汉','深圳','南京','广州','成都','上海'] weather_dic = {} for i in range(len(city8_fullname)): df = pd.DataFrame(pd.read_excel('.www.cppcns.com/2021年城市气温数据/2021年气编程客栈温数据'+city8_fullname_py[i]+'.xls')) weather_dic[city8_fullname[i]] = df[['日期','最高温','最低温','气候类型']] weather_dic[ci编程客栈ty8_fullname[i]]['城市'] = pd.Series([city8_fullname[i]]*df.shape[0]) weather = weather_dic[city8_fullname[0]] for i in range(1,8): weather = pd.concat([weather,weather_dic[city8_fullname[i]]],ignore_index="true")
得到的数据存放在weather中,结构如下:
四、图像绘制
这里我们需要joypy包
http://www.cppcns.com
import joypy import matplotlib.pyplot as plt plt.figure(dpi= 90) fig, axes = joypy.joyplot(weather, column=['最高温', '最低温'], by="城市", figsize=(13,9), fill=True, legend=True,alpha=.8, xlabelsize=18,ylabelsize=18,color=['tomato','dodgerblue'] ) plt.title('八大城市过去一年气温分布', fontsize=25,verticalalignment='bottom' ) plt.savefig(r'./绘图结果/天气-过去一年气温分布-嵴线图.png')
by----在图形中即我们的纵坐标,数据类别,需要指定。
fill----是否需要颜色填充
alpha----在面积图和嵴线图这类会存在图像覆盖的可视化图像中,我们是建议调整透明度的,便于同时展示被覆盖部分的轮廓。当然,如果数据本身存在面积差异,则尽量面积小的类别前置。
结果如下所示:
总结
到此这篇关于python Joypy绘制嵴线图实例的文章就介绍到这了,更多相关python Joypy嵴线图内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!
精彩评论