5.13.1. 常用¶
Seaborn is a Python data visualization library based on matplotlib. It provides a high-level interface for drawing attractive and informative statistical graphics.
Seaborn 是一个基于 Matplotlib 的 Python 数据可视化库,专门用于创建具有吸引力和信息丰富度的统计图形。Seaborn 提供了一些高级接口,使得绘制各种常见的统计图变得更加简单,而不需要过多的代码。它支持对数据集中变量之间的关系进行可视化,例如散点图、线性回归图、分布图等。
与 Matplotlib 相比,Seaborn 的设计目标是使图形更加美观,同时提供更多的统计分析功能。它能够轻松处理数据集中的缺失值,同时支持多变量的可视化分析。Seaborn 还提供了一些预设的配色方案,以及对图形元素的控制,使得用户可以轻松地定制图形的外观。
Seaborn 被广泛应用于数据分析、机器学习和统计建模等领域,尤其适用于探索性数据分析和呈现统计结果。它是一个强大而灵活的工具,为用户提供了创建各种各样高质量统计图形的便捷方式。
安装:
pip install seaborn
pip install seaborn[stats]
dependencies:
numpy
pandas
matplotlib
statsmodels, for advanced regression plots
scipy, for clustering matrices and some advanced options
fastcluster, faster clustering of large matrices
使用时建议先导入如下类库:
import numpy as np
import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt
import seaborn as sns
import seaborn.objects as so
Quickstart:
import seaborn as sns
df = sns.load_dataset("penguins")
sns.pairplot(df, hue="species")
df数据:
species island bill_length_mm bill_depth_mm flipper_length_mm body_mass_g sex
0 Adelie Torgersen 39.1 18.7 181.0 3750.0 Male
1 Adelie Torgersen 39.5 17.4 186.0 3800.0 Female
2 Adelie Torgersen 40.3 18.0 195.0 3250.0 Female
3 Adelie Torgersen NaN NaN NaN NaN NaN
4 Adelie Torgersen 36.7 19.3 193.0 3450.0 Female
... ... ... ... ... ... ... ...
339 Gentoo Biscoe NaN NaN NaN NaN NaN
340 Gentoo Biscoe 46.8 14.3 215.0 4850.0 Female
341 Gentoo Biscoe 50.4 15.7 222.0 5750.0 Male
342 Gentoo Biscoe 45.2 14.8 212.0 5200.0 Female
343 Gentoo Biscoe 49.9 16.1 213.0 5400.0 Male