Python数据可视化工具 – seaborn 和 missingno

seaborn是一个基于pyplot的数据可视化库,可以比较简单美观地用于展示基于Pandas数据类型的数据

missingno是一个基于pyplot的用于展示数据空值的直观工具,在处理大数据时也非常有用

 

安装:

pip install seaborn
pip install missingno

使用:

import missingno as msno
import seaborn as sns

 

Mac上的中文显示

plt.rcParams['font.family'] = ['Heiti TC']
plt.rcParams['axes.unicode_minus'] = False

这两行代码可以用于处理mac上中文不能显示的问题,要注意font.family的内容必须系统中有这个字体,这个命令可以查看字体是不是含有:

import matplotlib.font_manager

# Get All fonts from ttf library
for f in matplotlib.font_manager.fontManager.ttflist:
     print(f.name)

有方法可以通过字体替换,永久解决这个问题,详见:Mac OS系统下实现python matplotlib包绘图显示中文(亲测有效)_Jora0427的博客-CSDN博客_mac matplotlib显示中文

 

Missingno显示缺失内容

Missingno提供了四种图来显示图片缺失情况,包含:

  1. 条形图:它显示每一列显示的值的计数,忽略缺失的值
  2. 矩阵:零度矩阵图可以让我们同时了解整个数据集内的数据在所有列中的分布情况,这可以帮助我们更好地了解数据的分布情况。它还显示sparkline,突出显示数据集中具有最大和最小零值的行。
  3. Heatmap:该图表显示数据集列之间的零相关性。它让我们了解一个列中缺失的值与其他列中缺失的值之间的关系。
  4. 树状图:像树状图一样,根据列之间的零度关系将列分组。它把列组合在一起有更多的零关系。

详见:missingno - Visualize Missing Data in Python (coderzcolumn.com)

矩阵图如下,比较直观:

missingno.matrix(starbucks_locations,figsize=(10,5), fontsize=12);

 

Seaborn

Seaborn基于pyplot,可以用来作各种可视化数据图

  • 折线图
# Set the width and height of the figure
plt.figure(figsize=(16,6))

# Line chart showing how FIFA rankings evolved over time 
sns.lineplot(data=fifa_data)

  • 条形图
# Set the width and height of the figure
plt.figure(figsize=(10,6))

# Add title
plt.title("Average Arrival Delay for Spirit Airlines Flights, by Month")

# Bar chart showing average arrival delay for Spirit Airlines flights by month
sns.barplot(x=flight_data.index, y=flight_data['NK'])

# Add label for vertical axis
plt.ylabel("Arrival delay (in minutes)")

  • 散点图
# Path of the file to read
insurance_filepath = "../input/insurance.csv"

# Read the file into a variable insurance_data
insurance_data = pd.read_csv(insurance_filepath)
sns.scatterplot(x=insurance_data['bmi'], y=insurance_data['charges'])

  • 热力图
# Set the width and height of the figure
plt.figure(figsize=(14,7))

# Add title
plt.title("Average Arrival Delay for Each Airline, by Month")

# Heatmap showing average arrival delay for each airline by month
sns.heatmap(data=flight_data, annot=True)

# Add label for horizontal axis
plt.xlabel("Airline")

 

推荐这些文章:

Python Matplotlib

createfig()函数
def create_fig():
plt.figure() # 创建画布
plt.rcParams['font.sans-serif'] = ['SimHei'] # 设置字体,不然中文无法显示
plt.rcParams['axes.unicode_minus'] = False # 解决负号不显示问题

plt.rcParams['figure.figsize'] = (8.0, 4.0) # 设置figure_size尺寸
# figsize(12.5, 4) # 设置 figsize
plt.rcPa...

Python plt 饼图

import matplotlib.pyplot as plt
from matplotlib import rcParams

name_list_en = ['Computer Science', 'Physics', 'Mathematics' ,
'Statistics' , 'Quantitative Biology', 'Quantitative Finance']

num_list = [8594, 6013, 5618, 5206, 587, 249]
colors = ['green', 'yellow', 'blue', ...

Python-线性回归模型

从线性回归(Linear regression)开始学习回归分析,线性回归是最早的也是最基本的模型——把数据拟合成一条直线。数据集使用scikit-learn里的数据集boston,boston数据集很适合用来演示线性回归。boston数据集包含了波士顿地区的房屋价格中位数。还有一些可能会影响房价的因素,比如犯罪率(crime rate)。
加载数据 

from sklearn import datasets
boston = datasets.load_boston()
import pandas as pd
import warnings # 用来忽略seaborn绘图库产生...

Python--Matplotlib简单了解

Python--Matplotlib简单了解
@目录Python--Matplotlib简单了解一、数据挖掘基础环境安装与使用1.1 库的安装1.2 Jupyter Notebook使用1.2.1 Jupyter Notebook介绍1.2.2 为什么使用Jupyter Notebook?1.2.3 Jupyter Notebook的使用-helloworld二、Matplotlib2.1 Matplotlib2.1.1 什么是Matplotlib2.1.2 为什么要学习Matplotlib2.1.3 实现一个简单的Matplotlib画图2.1.4 认识Matplotlib图像结构2.1....

Python用Matplotlib实现数据可视化

在使用 Notebook 环境绘图时,需要先运行 Jupyter Notebook 的魔术命令 %matplotlib inline
 
这条命令的作用是将 Matplotlib 绘制的图形嵌入在当前页面中。而在桌面环境中绘图时,不需要添加此命令,而是在全部绘图代码之后追加 plt.show()
使用 Matplotlib 提供的面向对象 API,需要导入 pyplot 模块,并约定简称为 plt

import matplotlib.pyplot as plt
%matplotlib inline
plt.plot([1, 2,...

Python plt 柱状图

import matplotlib.pyplot as plt
from matplotlib import rcParams

def autolabel(rects):
for rect in rects:
height = rect.get_height()
plt.text(rect.get_x()+rect.get_width()/2. -
0.2, 1.03*height, '%s' % int(height))

name_list_en = ['Computer\n Science', 'Phys...

Python--matplotlib绘图可视化知识点整理

原文:http://michaelxiang.me/2016/05/14/python-matplotlib-basic/
本文作为学习过程中对matplotlib一些常用知识点的整理,方便查找。
参考

matplotlib-绘制精美的图表
matplotlib.pyplot.plt参数介绍

12345678

import matplotlib.pyplot as pltlabels='frogs','hogs','dogs','logs'sizes=15,20,45,10colors='yellowgreen','gold','lightskyblue','lightco...

Python matplotlib 画图入门 06 绘制多图

Matplotlib 绘制多图
我们可以使用 pyplot 中的 subplot() 和 subplots() 方法来绘制多个子图。
subplot() 方法在绘图时需要指定位置,subplots() 方法可以一次生成多个,在调用时只需要调用生成对象的 ax 即可。
subplot
subplot(nrows, ncols, index, **kwargs)
subplot(pos, **kwargs)
subplot(**kwargs)
subplot(ax)
以上函数将整个绘图区域分成 nrows 行和 ncols 列,然后从左到右,从上到下的顺序对每个子区域进行编号 1...N ,左上...

解决报错:AttributeError: module ‘matplotlib’ has no attribute 'figure’

引入Python绘图模块Matplotlibimport
使用了: matplotlib as plt引用了模块。
使用过程中调用 fig = plt.figure(),
报错显示:AttributeError: module ‘matplotlib’ has no attribute 'figure’
解决办法
使用import matplotlib.pyplot as plt引用模块,错误解决

...

文章标题:Python数据可视化工具 – seaborn 和 missingno
文章链接:https://www.dianjilingqu.com/50892.html
本文章来源于网络,版权归原作者所有,如果本站文章侵犯了您的权益,请联系我们删除,联系邮箱:saisai#email.cn,感谢支持理解。
THE END
< <上一篇
下一篇>>