蓝盟IT小贴士,来喽!
绘图是数据分析工作的重要一环,是搜索过程的一部分。 Matplotlib是目前用于数据可视化的最受欢迎的Python软件包之一,本文主要介绍一种叫Matplotlib的数据可视化分析工具。
Matplotlib是一个跨平台库,是一种可视化分析工具,通过数组中的数据创建2D图。 Matplotlib提供了一个面向对象的API,用于通过Python GUI工具包(如PyQt和WxPythonotTkinter )将绘图嵌入到APP中。 也可以在Python、python shell、Jupyter笔记本电脑和web APP服务器上使用。
Matplotlib提供了丰富的数据绘制工具,主要用于绘制散点图、条形图、折线图、饼图、直方图和箱形图等统计图形。
散布图
散点图通常用于回归分析,描述数据点在直角坐标系平面上的分布。 散点图显示了变量随自变量变化的大致趋势,据此可以选择合适的函数对数据点进行拟合。 广告数据分析通常根据散点图分析两个变量之间的数据分布关系。 散布图的主要参数及其说明如表2所示。
条形图
条形图表示具有相同宽度的条形的高度或长度的数据量。 条形图可以是横向或纵向的。 纵向放置时也称为条形图。
折线图
折线图是将工作表中的列或行数据点用直线连接而成的图表。 折线图可以根据典型的比率设置显示随时间变化的连续数据,因此非常适合于显示同一时间间隔内的数据趋势。
饼图
饼图经常在统计学模块中使用。 用于显示数据系列中各个项目的大小及其占各个项目总和的比率。
直方图
直方图也称为质量分布图,是用一系列高度不同的纵向条纹或线段表示数据分布情况的统计报告图。 一般来说,横轴表示数据类型,纵轴表示分布状况。 直方图是将数值数据的分布正确地图形化后得到的,是连续变量(定量变量)的概率分布的推测值,是由卡尔皮尔森(Karl Pearson )最初导入的特殊柱状图。 创建直方图时,第一步是对值的范围进行分段。 也就是说,将整个值范围分割为一系列的间隔,计算各间隔有多少值。 这些值通常指定为连续、不重复的变量间隔,间隔必须相邻,并且通常大小相同。
箱形照片
箱形图也称为箱须图、箱形图或箱线图,是用于显示一系列数据分散状况的统计图,因其形状类似箱子而得名。 它主要用于反映原始数据分布的特征,也可以进行多组数据分布的特征比较。组合图
前面提到的是,可能需要通过在“体形”对象上创建单独的图像来在同一画布上创建多个子图或组合图。 在这种情况下,可以使用add_subplot创建一个或多个子图,也可以使用subplot使用循环语句创建多个子图。
可以使用figure的subplot_adjust方法轻松更改间隔。 其中,w空格和hspace分别用于控制宽度和高度的百分比,可以作为subplot之间的间隔。
文/上海蓝盟 IT外包专家