可视化神器Plotly玩转箱形图

17 篇文章 47 订阅
订阅专栏

可视化神器Plotly玩转箱形图

在之前的文章中介绍过如何使用Plotly绘制柱状图、饼图、散点图等,都是比较常用的可视化图表呈现方式。本文介绍的是利用Plotly绘制统计图形中的一种:箱型图。

扩展阅读

Plotly的文章会形成连载系列,前面8篇Plotly可视化文章分别是:

  • 酷炫!36张图爱上高级可视化神器Plotly_Express
  • Plotly玩转散点图
  • Plotly玩转饼图
  • Plotly玩转漏斗图
  • Plotly玩转柱状图
  • Plotly玩转气泡图
  • Plotly玩转股票图
  • Plotly玩转甘特图

箱型图

什么是箱型图

箱型图是一种用作显示一组数据分散情况资料的统计图,它能够快速显示数据中的异常值情况,其形状像盒子,因而得名,也称之为盒须图、盒式图、盒装图或者箱型图。

1977年,美国著名数学家John W. Tukey首先在他的著作《Exploratory Data Analysis》中介绍了箱形图。

四分位数

四分位数是箱型图中最为重要的概念,下面介绍四分位数的相关知识。

四分位数(Quartile)是统计学中分位数的一种,即把所有数值由小到大分成四等份,处于三个分割点位置的数值就是四分位数。

  • 第一四分位数(Q1):也称下四分位数(Lower Quartile),等于该样本中所有数值由小到大排列后第25%的数字。
  • 第二四分位数(Q2):也称中位数(Middle Quartile or Median),等于该样本中所有数值由小到大排列后第50%的数字。
  • 第三四分位数(Q3):也称上四分位数(Upper Quartile),等于该样本中所有数值由小到大排列后第75%的数字。

Q3和Q1的差距称为四分位距(InterQuartile Range, IQR):IQR=Q3-Q1

四分位数计算

在计算四分位数的时候我们需要先计算四分位数的位置,3个四分位数的位置计算:

# n表示样本个数
Q1的位置 = (n+1) / 4
Q2的位置 = (n+1) * 2 / 4
Q3的位置 = (n+1) * 3 / 4

通过一个例子来进行讲解位置的计算,有11个数值无序排列如下:

6, 47, 49, 15, 42, 41, 7, 39, 43, 40, 36

我们先将数值按照从小到大排列:

6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49

那么3个四分位数的位置分别为:

# n=11表示样本个数
Q1的位置 = (11+1) / 4 = 3
Q2的位置 = (n+1) * 2 / 4 = 6
Q3的位置 = (n+1) * 3 / 4 = 9

对应的3个四分位数为:Q1=15,Q2=40,Q3=43,IQR=Q3-Q1=28

如果计算出来位置刚好不是整数,即n+1不是4的整数倍,则一般取该位置两边数的加权平均值(也有直接取平均值的),位置离得越近的数值权重越高,一般权重为:1−小数位。比如对于以下样本:

2,3,4,5

那么计算Q1的位置为:(4+1)/ 4= 1.25,且更靠近2,那么Q1为:

Q1=2 * (1 - 0.25) + 3 * 0.25 = 2.25   # 0.25是小数位 

如果直接取平均值:Q1= (2+3) / 2 = 2.5

4种不同箱型图比较

来自维基百科上4种不同箱型图的比较:

箱型图作用

  • 它可以粗略地看出数据是否具有有对称性
  • 显示数据分布的分散程度等信息,特别可以用于对几个样本的比较。
  • 反映一组或多组连续型定量数据分布的中心位置和散布范围
  • 分析不同类别数据各层次水平差异,还能揭示数据间离散程度、异常值、分布差异等

箱形图最大的优点就是不受异常值的影响,能够准确稳定地描绘出数据的离散分布情况,同时也利于数据的清洗。

数据集

下面介绍各种需求场景下箱型图的绘制,本文中使用的数据大部分是plotly中自带的消费tips数据集:

import pandas as pd
import numpy as np

import plotly_express as px
import plotly.graph_objects as go

# 消费数据集
tips = px.data.tips()
tips.head()

本文绘图使用的也是两种方法:

import plotly_express as px  # 1、px实现
import plotly.graph_objects as go  # 2、go实现

基于px绘制箱型图

基于点的箱体图

使用每个数据的点作为标记marker来绘制箱体图,使用的方法是:px.strip()

# 使用的方法是:px.strip()

fig = px.strip(
    tips,
    x='day',  # 星期
    y='total_bill'  # 总账单
)

fig.show()

# 使用的方法是:px.strip()

fig = px.strip(
    tips,
    x='time',  # 中餐还是晚餐  
    y='tip'  # 小费
)

fig.show()

基础箱型图

fig = px.box(
  tips,  # 数据集
  y="total_bill"  # 针对哪个字段的数据做箱型图
)

fig.show()

分组箱体图

针对有不同分类的组绘制箱体图:

fig = px.box(
  tips,  # 数据集
  y="tip",  # 绘图字段
  color="time"  # 颜色字段
)

fig.show()

再来一个稍微多字段的分组箱体图:

fig = px.box(
    tips,
    x="day",   # 分组的数据
    y="total_bill",  # 箱体图的数值
    color="day"  # 颜色分组
)

fig.show()

带散点的箱体图

有时候我们在绘制箱体图的时候,需要带上散点,散点表示的就是原始数据情况。点的取值有4种情况:

  • all:全部
  • outliers:离群点
  • suspectedoutliers:可疑离群点
  • False:不显示
fig = px.box(
    tips,
    x="day",
    y="total_bill",
    points="all"   # ['all', 'outliers', 'suspectedoutliers', False]
)

fig.show()

带四分位数的箱体图

计算散点插值方法有3种:

  • linear:线性差值方法,默认
  • exclusive:排除算法统计。如果样本是奇数,则不包含任何一半的中位数,Q1是下半部分的中位数,Q3是上半部分的中位数
  • inclusive:包含算法统计;如果样本是奇数,则在两个半部分都包含中位数,Q1是下半部分的中位数,Q3是上半部分的中位数
fig = px.box(
    tips, 
    x="day",
    y="tip",
    color="smoker")

fig.update_traces(quartilemethod="exclusive") # exclusive inclusive linear (默认)

fig.show()

3种不同四分位数显示方法比较

模拟一份数据集:

data = [10,20,30,40,50,60,70,80,90]

pd.DataFrame(dict(
    linear=data,
    inclusive=data,
    exclusive=data
))

# 下面是数据的部分截图

使用melt方法对上面的数据进行合并和转化,使用到了一个melt函数:

  • d_vars:不需要被转换的列名
  • value_vars:需要转换的列名,如果剩下的列全部都要转换,就不用写
  • var_name和value_name是自定义设置对应的列名。
  • col_level:如果列是MultiIndex,则使用此级别
## 3种不同算法之间的比较结果

import plotly.express as px
import pandas as pd

data = [10,20,30,40,50,60,70,80,90]

df = pd.DataFrame(dict(
    linear=data,
    inclusive=data,
    exclusive=data
)).melt(var_name="quartilemethod")  # 宽表转成长表

df

添加数据轨迹和抖动间距jitter:

fig = px.box(
    df, 
    y="value", 
    facet_col="quartilemethod", 
    color="quartilemethod",
    boxmode="overlay", 
    points='all')

# jitter:数据抖动 =0表示没有抖动,点和点的距离是均衡的
fig.update_traces(quartilemethod="linear", jitter=0, col=1)
fig.update_traces(quartilemethod="inclusive", jitter=0, col=2)
fig.update_traces(quartilemethod="exclusive", jitter=0, col=3)

fig.show()

带缺口的箱体图

fig = px.box(
    tips,
    x="day",
    y="tip",
    color="smoker",
    notched=True,  # 显示缺口
    title="小费数据集箱体图",
    hover_data = ["day"]
)

fig.show()

基于go绘制箱型图

基础箱体图绘制

import plotly.graph_objects as go

fig = go.Figure(data=[go.Box(
    y=[0, 1, 1, 2, 4, 7, 9, 15, 21],
    boxpoints='all', # all、outliers 、suspectedoutliers、False
    jitter=0.3, # 数据点之间添加抖动
    pointpos=-1.5   # 点和箱体之间的距离,参数范围:[-2, 2]
      )])

fig.show()

分组箱体图绘制

np.random.seed(1)  # 设置随机种子

y1 = np.random.randn(60) - 1   # 随机生成60个数据
y2 = np.random.randn(60) - 1

fig = go.Figure()

# 添加两个数据轨迹,形成图形
fig.add_trace(go.Box(y=y1)) 
fig.add_trace(go.Box(y=y2))

fig.show()

我们还可以设置图形的颜色:

fig = go.Figure()

# 添加两个数据轨迹,形成图形
fig.add_trace(go.Box(y=y1,  # 数值
                     name="图1",  # 轨迹名称
                     marker_color="red" # 颜色
                    )) 

fig.add_trace(go.Box(y=y2,
                     name="图2",
                     marker_color="lightseagreen"
                    ))

fig.show()

import plotly.graph_objects as go

x = ['day 1', 'day 1', 'day 1', 'day 1', 'day 1', 'day 1',
     'day 2', 'day 2', 'day 2', 'day 2', 'day 2', 'day 2']

fig = go.Figure()

fig.add_trace(go.Box(
    x=x,
    y=[0.2, 0.2, 0.6, 1.0, 0.5, 0.4, 0.2, 0.7, 0.9, 0.1, 0.5, 0.3],
    name='kale',
    marker_color='#3D0970'
))

fig.add_trace(go.Box(
    x=x,
    y=[0.6, 0.7, 0.3, 0.6, 0.0, 0.5, 0.7, 0.9, 0.5, 0.8, 0.7, 0.2],
    name='radishes',
    marker_color='#0F4136'
))

fig.add_trace(go.Box(
    x=x,
    y=[0.1, 0.3, 0.1, 0.9, 0.6, 0.6, 0.9, 1.0, 0.3, 0.6, 0.8, 0.5],
    name='carrots',
    marker_color='#FA851B'
))

fig.update_layout(
    yaxis_title='数值',
    boxmode='group' # 柱状图模式
)
fig.show()

全样式箱体图

import plotly.graph_objects as go

# x轴数据
x_data = ['小明', '小红','小周', '小孙','小张', '小苏']

N = 80

# 生成y轴数据:生成数据同时指定数据类型
y0 = (10 * np.random.randn(N) + 60).astype(np.int)
y1 = (13 * np.random.randn(N) + 78).astype(np.int)
y2 = (11 * np.random.randn(N) + 83).astype(np.int)
y3 = (9 * np.random.randn(N) + 76).astype(np.int)
y4 = (15 * np.random.randn(N) + 91).astype(np.int)
y5 = (12 * np.random.randn(N) + 80).astype(np.int)

y_data = [y0, y1, y2, y3, y4, y5]

# 颜色设置
colors = ['rgba(93, 164, 214, 0.5)', 
          'rgba(155, 144, 14, 0.5)', 
          'rgba(44, 160, 101, 0.5)',
          'rgba(155, 65, 54, 0.5)', 
          'rgba(27, 114, 255, 0.5)',
          'rgba(127, 96, 0, 0.5)']

fig = go.Figure()

# 通过zip函数生成6组不同的函数进行轨迹添加
# 生成不同的轨迹
for xd, yd, cls in zip(x_data, y_data, colors):
        fig.add_trace(go.Box(
            y=yd,  # y轴数据
            name=xd,  # 名称
            boxpoints='all',  # 箱体散点的显示
            jitter=0.5,  # 抖动距离
#             whiskerwidth=0.2,
            fillcolor=cls,  # 颜色
            marker_size=2,  # 标记大小
            line_width=1)  # 线宽
        )

# 布局设置
fig.update_layout(
    title='6名同学成绩比较',
    yaxis=dict(
        autorange=True,
        showgrid=True,  # 显示网格
        zeroline=True,  # 0基准线
        dtick=5,
        gridcolor='rgb(255, 255, 255)',  # 网格和基准线设置
        gridwidth=1,
        zerolinecolor='rgb(255, 255, 255)',
        zerolinewidth=2,
    ),
    margin=dict(
        l=40,
        r=30,
        b=80,
        t=100,
    ),
    paper_bgcolor='rgb(243, 243, 243)',  # 背景设置
    plot_bgcolor='rgb(243, 243, 243)',
    showlegend=True  # 显示图例
)

fig.show()

3种不同方式下四分位数的显示

对3种不同计算方法下四分位数的显示:

import plotly.graph_objects as go

data = [1, 2, 3, 4, 5, 6, 7, 8, 9]
fig = go.Figure()

fig.add_trace(go.Box(y=data, quartilemethod="linear", name="Linear Quartile"))
fig.add_trace(go.Box(y=data, quartilemethod="inclusive", name="Inclusive Quartile"))
fig.add_trace(go.Box(y=data, quartilemethod="exclusive", name="Exclusive Quartile"))

fig.update_traces(
    boxpoints='all',   # ['all', 'outliers', 'suspectedoutliers', False]
    jitter=0  # 没有抖动,点和点的距离是相同的
)

fig.show()

通过上图可以清楚地看到3种不同差值方法的区别。

水平箱型图

x1 = np.random.randn(50)
x2 = np.random.randn(50) + 5

fig = go.Figure()
fig.add_trace(go.Box(x=x1))
fig.add_trace(go.Box(x=x2))

fig.show()

分组水平箱型图

import plotly.graph_objects as go

y = ['day 1', 'day 1', 'day 1', 'day 1', 'day 1', 'day 1',
     'day 2', 'day 2', 'day 2', 'day 2', 'day 2', 'day 2']

fig = go.Figure()

fig.add_trace(go.Box(
    y=y,
    x=[0.2, 0.2, 0.6, 1.0, 0.5, 0.4, 0.2, 0.7, 0.9, 0.1, 0.5, 0.3],
    name='kale',
    marker_color='#3D0970'
))

fig.add_trace(go.Box(
    y=y,
    x=[0.6, 0.7, 0.3, 0.6, 0.0, 0.5, 0.7, 0.9, 0.5, 0.8, 0.7, 0.2],
    name='radishes',
    marker_color='#0F4136'
))

fig.add_trace(go.Box(
    y=y,
    x=[0.1, 0.3, 0.1, 0.9, 0.6, 0.6, 0.9, 1.0, 0.3, 0.6, 0.8, 0.5],
    name='carrots',
    marker_color='#FA851B'
))

fig.update_layout(
#     xaxis_title='数值',
    xaxis=dict(
        title="数值",
        zeroline=False
    ),
    boxmode='group' # 柱状图模式
)

fig.update_traces(orientation='h')  # 水平柱状图
fig.show()

带有均值和方差的箱体图

import plotly.graph_objects as go

fig = go.Figure()
fig.add_trace(go.Box(
    y=np.random.randn(50),
    name='均值',
    marker_color='mediumblue',
    boxmean=True # 仅仅存在均值
))
fig.add_trace(go.Box(
    y=np.random.randn(50),
    name='均值和标准差',
    marker_color='red',
    boxmean='sd' # 表示同时存在均值和标准差
))

fig.show()

4种不同数据点的显示方式

import plotly.graph_objects as go

y_data = [0.75, 5.25, 5.5, 6, 6.2, 6.6, 
       6.80, 7.0, 7.2, 7.5, 7.5, 7.75, 
       8.15,8.15, 8.65, 8.93, 9.2, 9.5, 
       10, 10.25, 11.5, 12, 16, 20.90, 
       22.3, 23.25]

fig = go.Figure()

fig.add_trace(go.Box(
    
    y=y_data,
    
    name="全部数据点",
    jitter=0.3,  # 抖动距离
    pointpos=-1.8,  # 散点和箱体图的距离
    boxpoints='all', #  all:显示全部数据点
    marker_color='rgb(7,40,89)',
    line_color='rgb(7,40,89)'
))

fig.add_trace(go.Box(
    y=y_data,
    name="晶须线",
    boxpoints=False, # 没有数据点,只有晶须线
    marker_color='rgb(109,56,125)',
    line_color='rgb(9,56,125)'
))

fig.add_trace(go.Box(
    y=y_data,
    name="可疑离群点",
    boxpoints='suspectedoutliers', # 可疑离群点
    marker=dict(
        color='rgb(8,81,156)',
        outliercolor='rgba(219, 64, 82, 0.6)',
        line=dict(
            outliercolor='rgba(219, 64, 82, 0.6)',
            outlierwidth=2)),
    line_color='rgb(8,81,156)'
))

fig.add_trace(go.Box(
    y=y_data,
    name="晶须+离群点",
    boxpoints='outliers', # 仅显示离群点
    marker_color='rgb(107,174,14)',
    line_color='rgb(107,174,214)'
))

fig.update_layout(title_text="基于个性化离群值的散点图")
fig.show()

彩虹箱型图

import plotly.graph_objects as go
import numpy as np

N = 40     # 箱体图的个数
c = ['hsl('+str(h)+',50%'+',50%)' for h in np.linspace(0, 360, N)]

具体的绘图代码为:

fig = go.Figure(data=[go.Box(
    # 使用三角函数来绘制图形
    y=3.5 * np.sin(np.pi * i/N) + i/N + (1.5 + 0.5 * np.cos(np.pi*i/N)) * np.random.rand(10),
    marker_color=c[i]
    ) for i in range(int(N))])

# 布局设置
fig.update_layout(
    # xy轴设置
    xaxis=dict(showgrid=True, 
               zeroline=False, 
               showticklabels=False),
    yaxis=dict(zeroline=False, 
               gridcolor='white'),
    # 背景颜色设置
    paper_bgcolor='rgb(233,233,233)',
    plot_bgcolor='rgb(233,233,233)',
)

fig.show()

R语言plotly可视化plotly可视化箱图、并添加抖动数据点jitter(Adding Jittered Points)
data+scenario+science+insight
08-30 281
R语言plotly可视化plotly可视化箱图、并添加抖动数据点jitter(Adding Jittered Points)
Plotly:绘图数据可视化
04-18
数据可视化 1.基本图:线| 酒吧散点图气泡 2.统计图 3. 3D图 交互式和出版质量图(箱形图,直方图和分布图) 4.地图图 Mapbox的叶绿度,填充区域,气泡图和与地图相关的图。 5.森伯斯特图(层次数据) 每个层次结构都由一个环或圆圈表示,其中“最内层”位于层次结构的顶部。 6.动画图(动画图) 7.子图(多个图) 8.仪表板(Dash) Dash Apps提供了指向和点击界面模型。 关于AI和数据科学计划的更快,更具影响力的业务成果。
plotly绘图——箱型图
最新发布
ddDocs的博客
04-06 1175
plotly是一个易于使用,功能强大的python绘图库,用于构建可交互式的图表(可以自行运行后使用鼠标拖拽图片试试),本系列文章将介绍plotly绘制各种类型图的方法,本文将介绍——箱型图
Python可视化---seaborn
UCAS_Leon的博客
07-09 259
什么是Seaborn Seaborn是基于matplotlib的图形可视化python包。它提供了一种高度交互式界面,便于用户能够做出各种有吸引力的统计图表。 Seaborn是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn能做出很具有吸引力的图,而使用matplotlib就能制作具有更多特色的图。应该把Seaborn视为matplotlib的补充,而不是替代物。同时它能高度兼容numpy与pandas数据结构以及scipy与statsmod
使用Ploty库画美观好看的各类图合集
weixin_64567789的博客
07-04 523
在jupyte使用ploty实现数据的可视化
python 可视化 ploty 画3dmesh网格图
热门推荐
weixin_38040408的博客
09-23 1万+
python 可视化 ploty 画3dmesh网格图 最近在工作中遇到python 打印可视化3D图。需求是根据之前用matplotlib打印出来的效果不是很好。发现了非常强大的可视化plotly。附上官方文档链接 https://plot.ly/python/ # -*- coding:utf8 -*- import pandas as pd import numpy as np impor...
plotly绘制简单图形<6>--箱线图
Andy_shenzl的博客
09-27 5089
箱形图(英文:Box plot),又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因型状如箱子而得名。在各种领域也经常被使用,常见于品质管理。不过作法相对较繁琐。 主要包含六个数据节点,将一组数据从大到小排列,分别计算出他的上边缘,上四分位数Q3,中位数,下四分位数Q1,下边缘,还有一个异常值。 普通箱线图 import plotly.plotly a...
python画箱型图plotly_Python一行代码搞定炫酷可视化,你需要了解一下Cufflinks
weixin_39634237的博客
01-30 452
前言学过Python数据分析的朋友都知道,在可视化的工具中,有很多优秀的三方库,比如matplotlib,seaborn,plotly,Boken,pyecharts等等。这些可视化库都有自己的特点,在实际应用中也广为大家使用。plotly、Boken等都是交互式的可视化工具,结合Jupyter notebook可以非常灵活方便地展现分析后的结果。虽然做出的效果非常的炫酷,比如plotly,但是每...
Python百日进阶-数据分析】Day143 - plotly箱线图:px.box()实例
岳涛的博客
12-31 1212
文章目录四、实例4.1 plotly.express箱线图4.1.1 基本箱线图4.1.2 为 x的每个值绘制一个箱线图4.1.3 显示基础数据4.1.4 选择计算四分位数的算法4.1.5 四分位数算法之间的区别4.1.6 风格箱线图4.1.7 Dash中的箱线图 四、实例 箱线图是变量通过其四分位数分布的统计表示。盒子的末端代表下四分位数和上四分位数,而中位数(第二个四分位数)由盒子内的一条线标记。有关数值数据的其他统计表示,请参阅其他统计图表。 用于可视化分布的箱线图的替代方法包括直方图、小提琴图、EC
plotly系列 | 绘制散点图组合箱线图(联合图)
qq_36396757的博客
04-24 4361
目录 Plotly简介 实例: 1 在python中使用pip命令安装 2 导入包 3 读取文件 4 绘制联合图 关注我【生物海洋计算机支线】,获得更多生物海洋学,数据处理,作图等相关知识 Plotly简介 Plotly是一款非常强大好用的数据可视化框架 我们可以从他的官网上找到各种封装好的精美图表 官网地址: https://plotly.com/python/ 不同于seaborn对matplotlib绘图库的封装,他有独特的语法、参数和原理 在生信做图上有较广的
数据可视化学习---plotly基本图形(二)之箱线图、饼图
weixin_44941795的博客
08-31 1617
箱线图 饼图 3.箱线图 import plotly.offline as of import plotly.graph_objs as go x0 = np.random.randn(50) x1 = np.random.randn(50) colors = ['#faee1c', '#f3558e'] trace0 = go.Box( x = x0, name = 'box1', ...
Python数据可视化源码实例Pyecharts库集合】箱形图.zip
07-12
谢谢大家的支持!
Tableau图表 | 11、箱形图
01-07
箱形图又称为盒须图,显示了一组数据的分散情况,可用来快速识别异常值。 (1)中位数:一组数据按顺序排列,居于中间位置的数,即为中位数。 如果这组数据一共有n个,X1,X2……Xn, 如果n为奇数,中位数则为X(n+1...
ArcGIS教程:创建箱形图
03-02
对于不适合其他图表类型(如折线图)的大型(已排序)数据集来说,箱形图十分有用。箱形图可将系列中数据值的变化归结为五个数值 - 中位数、上下四分位数,以及最小值和最大值。箱形图要求数据进行排序。箱形图可以...
Python数据可视化源码实例集合】之Pyecharts库
07-12
30 组合可视化图 31 组合图 Pyecharts库部分: 01 3D纹理图 02 3D散点图 03 3D折线图 04 3D柱状图 05 K线图烛台 06 饼状图 07 词云图 08 地理坐标图 09 地图,3D地图,全球地图 10 关系图 11 极坐标系 12 雷达图 13 ...
plotly系列| 使用plotly在地图上绘制散点图和密度图
qq_36396757的博客
04-16 4858
目录 Plotly简介 在地图上制作散点图和密度图 1 . 在python中使用pip命令安装 2.导入包 3 .读取文件 4 . 在地图上绘制散点图 5 . 绘制密度图,其属性与绘制散点图相似 关注我,不定时更新作图,数据处理等tip Plotly简介 Plotly 是一款非常强大好用的数据可视化框架 我们可以从他的官网上找到各种封装好的精美图表 官网地址: https://plotly.com/python/ 例如基础的图表,散点图,折线图等, ..
python利器-Python 数据可视化利器
q6q6q的专栏
10-28 228
原标题:Python 数据可视化利器(给Python开发者加星标,提升Python技能)作者:zone7(本文来自作者投稿,简介见末尾) 概述前言推荐plotlybokehpyecharts后记前言前段时间有读者向我反映,想看看数据可视化方面的文章,这不?现在就开始写了,如果你想看哪些方面的文章,可以通过留言或者后台告诉我。数据可视化的第三方库挺多的,这里我主要推荐两个,分别是 bokeh、pye...
python plotly 使用教程
m0_59485658的博客
02-15 1278
lotly的Python图形库使互动的出版质量图表成为在线。 如何制作线图,散点图,面积图,条形图,误差线,箱形图,直方图,热图,子图,多轴,极坐标图和气泡图的示例。
Python百日进阶-数据分析】Day142 - plotly箱线图:px.box()语法
岳涛的博客
12-30 754
文章目录一、语法二、参数三、返回值 一、语法 在箱形图中,行data_frame被组合成一个盒须标记以可视化它们的分布。 每个框从四分位数 1 (Q1) 到四分位数 3 (Q3)。第二个四分位数 (Q2) 由框内的一条线标记。默认情况下,胡须对应于盒子的边缘 +/- 1.5 倍的四分位距(IQR:Q3-Q1),其他选项请参见“点”。 plotly.express.box(data_frame=None, x=None, y=No
python 箱形图
09-16
Python箱形图是一种常用的数据可视化工具,可以用于展示数据的分布情况和异常值的检测。箱形图由一个矩形框和两条竖线组成,矩形框表示数据的四分位数范围,竖线表示数据的最大值和最小值。箱形图的中位数标记为一条横线,异常值则以点或者圆圈的形式标记在图表之外。 箱形图主要有以下几个作用: 1. 描述数据的分布情况:箱形图可以直观地展示数据的中位数、四分位数以及离群值的存在情况。根据箱形图的形状,我们可以了解到数据的分布是否对称,是否存在偏态等信息。 2. 检测异常值:箱形图可以帮助我们发现数据中的异常值。异常值是指与大多数数值相比明显不同的数值,可能是数据录入错误或者真实存在的特殊情况,通过箱形图可以快速定位和识别异常值。 3. 数据清洗:通过箱形图可视化结果,我们可以判断哪些数据点是异常值,并据此进行数据清洗和修正,以提高数据的质量和准确性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
写文章

热门文章

  • 超级全的停用词整理 41788
  • 深度学习实战:基于CNN的猫狗图像识别 27542
  • pandas索引的设置与修改 21645
  • 可视化库D3.js(1)-入门篇 18197
  • 统计学知识:相关系数 14741

分类专栏

  • 机器学习 48篇
  • TensorFlow&keras 5篇
  • 可视化工具 9篇
  • Deep Learning 13篇
  • seaborn 1篇
  • 工业AI 1篇
  • kaggle 4篇
  • CV 1篇
  • 爬虫 5篇
  • pandas 51篇
  • sklearn 1篇
  • plotly 17篇
  • 工具 1篇
  • MySQL 1篇
  • pyecharts 1篇
  • LeetCode-SQL 7篇
  • 数据库 13篇
  • 阅读 1篇
  • 电影
  • D3.js教程
  • 生活 3篇
  • Python 43篇

最新评论

  • 基于密度的聚类算法DBSCAN详解!

    CSDN-Ada助手: 算法 技能树或许可以帮到你:https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm

  • 20+个小而精的Python实战案例(附源码和数据)

    m0_74279878: 怎么获取

  • 基于LightGBM的金融信贷数据建模

    凉桥875: 原始数据怎么获取呀

  • 深度学习实战:基于CNN的猫狗图像识别

    虞书欣Esther: 有源码嘛?

  • 可视化神器Plotly玩转桑基图

    尤而小屋: 谢谢支持

您愿意向朋友推荐“博客详情页”吗?

  • 强烈不推荐
  • 不推荐
  • 一般般
  • 推荐
  • 强烈推荐
提交

最新文章

  • 基于密度的聚类算法DBSCAN详解!
  • 强大的机器学习建模扩展包:mlxtend
  • Keras3.0重磅来袭
2024年5篇
2023年18篇
2022年40篇
2021年122篇
2020年14篇
2019年15篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

深圳SEO优化公司沈阳网站推广多少钱淮安百搜标王推荐莆田百度标王价格莱芜高端网站设计报价铜陵网站改版公司迪庆百度竞价多少钱黑河网站改版价格丽水网站改版多少钱宜春seo网站推广价格自贡百度爱采购哪家好滁州网站关键词优化大芬百度标王推荐海口关键词排名包年推广哪家好益阳营销网站哪家好坂田百度seo推荐新余营销型网站建设广安网站改版哪家好丽水百度网站优化推荐漯河外贸网站设计多少钱新余网站设计模板公司宜昌网站关键词优化价格忻州网站优化软件价格塘坑如何制作网站公司丽水模板推广报价内江网站seo优化公司东莞百度seo哪家好仙桃seo排名价格天津网站优化推广哪家好温州英文网站建设公司厦门网站改版歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化