资讯专栏INFORMATION COLUMN

数据可视化Seaborn从零开始学习教程(一) 风格选择

testbird / 3397人阅读

摘要:简介同一样,也是进行数据可视化分析的重要第三方包。的五种绘图风格有五种的风格,它们分别是。

作者:xiaoyu
微信公众号:Python数据科学
知乎:python数据分析师


最近在做几个项目的数据分析,每次用到seaborn进行可视化绘图的时候总是忘记具体操作。虽然seaborn的官方网站已经详细的介绍了使用方法,但是毕竟是英文,而且查找不是很方便。因此博主想从零开始将seaborn学习一遍,做一个总结,也希望供大家使用参考。
Seaborn简介

seabornmatplotlib一样,也是Python进行数据可视化分析的重要第三方包。但seaborn是在 matplotlib的基础上进行了更高级的API封装,使得作图更加容易,图形更加漂亮。

博主并不认为seaborn可以替代matplotlib。虽然seaborn可以满足大部分情况下的数据分析需求,但是针对一些特殊情况,还是需要用到matplotlib的。换句话说,matplotlib更加灵活,可定制化,而seaborn像是更高级的封装,使用方便快捷。

应该把seaborn视为matplotlib的补充,而不是替代物。

Seaborn学习内容

seaborn的学习内容主要包含以下几个部分:

风格管理

绘图风格设置

颜色风格设置

绘图方法

数据集的分布可视化

分类数据可视化

线性关系可视化

结构网格

数据识别网格绘图

本次将主要介绍风格管理的使用。

风格管理 - 绘图风格设置

除了各种绘图方式外,图形的美观程度可能是我们最关心的了。将它放到第一部分,因为风格设置是一些通用性的操作,对于各种绘图方法都适用。

让我们先看一个例子。

%matplotlib inline
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt
import seaborn as sns
np.random.seed(sum(map(ord, "aesthetics")))

我们定义了一个简单的方程来绘制一些偏置的正弦波,用来帮助我们查看不同的图画风格是什么样子的。

def sinplot(flip=1):
    x = np.linspace(0, 14, 100)
    for i in range(1, 7):
        plt.plot(x, np.sin(x + i * .5) * (7 - i) * flip)

matplotlib默认参数下绘制结果是这样的:

sinplot()

转换为seaborn默认绘图,可以简单的用set()方法。

sns.set()
sinplot()

Seabornmatplotlib 的参数划分为两个独立的组合。第一组是设置绘图的外观风格的,第二组主要将绘图的各种元素按比例缩放的,以至可以嵌入到不同的背景环境中。

操控这些参数的接口主要有两对方法:

控制风格:axes_style(), set_style()

缩放绘图:plotting_context(), set_context()

每对方法中的第一个方法(axes_style(), plotting_context())会返回一组字典参数,而第二个方法(set_style(), set_context())会设置matplotlib的默认参数。

Seaborn的五种绘图风格

有五种seaborn的风格,它们分别是:darkgrid, whitegrid, dark, white, ticks。它们各自适合不同的应用和个人喜好。默认的主题是darkgrid

sns.set_style("whitegrid")
data = np.random.normal(size=(20, 6)) + np.arange(6) / 2
sns.boxplot(data=data);

sns.set_style("dark")
sinplot()

sns.set_style("white")
sinplot()

sns.set_style("ticks")
sinplot()

移除轴脊柱

whiteticks两个风格都能够移除顶部和右侧的不必要的轴脊柱。通过matplotlib参数是做不到这一点的,但是你可以使用seaborndespine()方法来移除它们:

sinplot()
sns.despine()

一些绘图也可以针对数据将轴脊柱进行偏置,当然也是通过调用despine()方法来完成。而当刻度没有完全覆盖整个轴的范围时,trim参数可以用来限制已有脊柱的范围。

f, ax = plt.subplots()
sns.violinplot(data=data)
sns.despine(offset=10, trim=True);

你也可以通过despine()控制哪个脊柱将被移除。

sns.set_style("whitegrid")
sns.boxplot(data=data, palette="deep")
sns.despine(left=True)

临时设置绘图风格

虽然来回切换风格很容易,但是你也可以在一个with语句中使用axes_style()方法来临时的设置绘图参数。这也允许你用不同风格的轴来绘图:

with sns.axes_style("darkgrid"):
    plt.subplot(211)
    sinplot()
plt.subplot(212)
sinplot(-1)

覆盖seaborn风格元素

如果你想定制化seaborn风格,你可以将一个字典参数传递给axes_style()set_style()的参数rc。而且你只能通过这个方法来覆盖风格定义中的部分参数。

如果你想要看看这些参数都是些什么,可以调用这个方法,且无参数,这将会返回下面的设置:

sns.axes_style()
{"axes.axisbelow": True,
 "axes.edgecolor": ".8",
 "axes.facecolor": "white",
 "axes.grid": True,
 "axes.labelcolor": ".15",
 "axes.linewidth": 1.0,
 "figure.facecolor": "white",
 "font.family": [u"sans-serif"],
 "font.sans-serif": [u"Arial",
  u"DejaVu Sans",
  u"Liberation Sans",
  u"Bitstream Vera Sans",
  u"sans-serif"],
 "grid.color": ".8",
 "grid.linestyle": u"-",
 "image.cmap": u"rocket",
 "legend.frameon": False,
 "legend.numpoints": 1,
 "legend.scatterpoints": 1,
 "lines.solid_capstyle": u"round",
 "text.color": ".15",
 "xtick.color": ".15",
 "xtick.direction": u"out",
 "xtick.major.size": 0.0,
 "xtick.minor.size": 0.0,
 "ytick.color": ".15",
 "ytick.direction": u"out",
 "ytick.major.size": 0.0,
 "ytick.minor.size": 0.0}

然后,你可以设置这些参数的不同版本了。

sns.set_style("darkgrid", {"axes.facecolor": ".9"})
sinplot()

绘图元素比例

有一套的参数可以控制绘图元素的比例。
首先,让我们通过set()重置默认的参数:

sns.set()

有四个预置的环境,按大小从小到大排列分别为:paper, notebook, talk, poster。其中,notebook是默认的。

sns.set_context("paper")
sinplot()

sns.set_context("talk")
sinplot()

sns.set_context("poster")
sinplot()

你可以通过使用这些名字中的一个调用set_context()来设置参数,并且你可以通过提供一个字典参数值来覆盖参数。当改变环境时,你也可以独立的去缩放字体元素的大小。

sns.set_context("notebook", font_scale=1.5, rc={"lines.linewidth": 2.5})
sinplot()

同样的,你可以通过嵌入with语句临时的控制绘图的比例。

总结

介绍了Seaborn的5中绘图风格

移除轴脊柱

临时设置绘图风格

覆盖Seaborn风格元素

绘图元素比例缩放

下一节将会介绍颜色风格的使用。


关注微信公众号Python数据科学,获取 120G 人工智能 学习资料。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/41746.html

相关文章

  • 数据视化Seaborn从零开始学习教程(二) 颜色调控篇

    摘要:使用分类调色板另外一种对分类数据比较友好的调色板来自工具。它们是以在调色板中的主导颜色或颜色命名的。连续调色板调色板系统在亮度和色变变化上具有线性上升或下降的特点。离散色板调色板中的第三类被称为离散。 作者:xiaoyu微信公众号:Python数据科学知乎:python数据分析师 Seaborn学习大纲 seaborn的学习内容主要包含以下几个部分: 风格管理 绘图风格设置 颜...

    李义 评论0 收藏0
  • 数据视化Seaborn从零开始学习教程(四) 分类数据视化

    摘要:分类数据散点图在分类数据的基础上展示定量数据的最简单函数就是。此外,小提琴内还显示了箱体四分位数和四分位距。该函数会用高度估计值对数据进行描述,而不是显示一个完整的条形,它只绘制点估计和置信区间。 作者:xiaoyu微信公众号:Python数据科学知乎:python数据分析师 Seaborn学习大纲 seaborn的学习内容主要包含以下几个部分: 风格管理 绘图风格设置 颜色风...

    CodeSheep 评论0 收藏0
  • 数据视化Seaborn从零开始学习教程(三) 数据分布视化

    摘要:数据集分布可视化当处理一个数据集的时候,我们经常会想要先看看特征变量是如何分布的。直方图在横坐标的数据值范围内均等分的形成一定数量的数据段,并在每个数据段内用矩形条显示轴观察数量的方式,完成了对的数据分布的可视化展示。 作者:xiaoyu微信公众号:Python数据科学知乎:python数据分析师 Seaborn学习大纲 seaborn的学习内容主要包含以下几个部分: 风格管理 ...

    Tamic 评论0 收藏0
  • 【精华分享】:转行数据分析的学习清单

    摘要:数据分析的发展方向一般有商业方向,行业分析业务方向,和机器学习数据挖掘方向。机器学习的书籍推荐统计学习方法,机器学习,机器学习实战三本书。 作者:xiaoyu 微信公众号:Python数据科学 知乎:python数据分析师 上一篇主要分享了博主亲身转行数据分析的经历: 【从零学起到成功转行数据分析,我是怎么做的?】 本篇继上一篇将分享转行数据分析的一些经验和学习方法,看完这篇你将会解...

    suemi 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<