Excel数据分析可视化必备技能案例视频精讲
上QQ阅读APP看书,第一时间看更新

1.1.2 机台用电量与机台产量有什么关系

给客户做产品报价模型,在做用电量计算时,针对同一个产品、同一个机台的几年耗电量数据进行归纳,想要看看机台用电量与机台产量有什么关系。

一般机台产量越高,用电量越大。但是,如果换算成每小时产量与每小时用电呢?是不是也是这种常规认识?

图1-3是某个机台在生产某个产品的工时、班产量和用电量的数据。

图1-3 机器工时、班产量和用电量的数据

这么多的数据堆积起来,很难看出机台用电量与机台产量有什么关系。先计算小时产量和小时用电量数据,如图1-4所示。

图1-4 计算小时产量和小时用电量数据

可以用小时产量作为X轴,用小时用电量作为Y轴,绘制XY散点图,如图1-5所示。

图1-5 小时产量与小时用电量的关系

从图表中可以看出,机台小时产量主要集中在6000~10000,小时用电量集中在2~6。在这个范围内,呈现出一种杂乱无规律的现象,甚至有些数据像是人为刻意做出来的,如图1-6所示。这些数据点的小时用电量是一样的,但是小时产量却相差很大。

图1-6 一组像是刻意做出来的数据

抛开这些嫌疑数据,分析小时产量和小时用电量到底有没有一定的关系。添加一个线性模型趋势线,如图1-7所示,可以看出,小时用电量与小时产量有一定的正向关系,即小时产量越大,小时用电量越大。

图1-7 添加的趋势线

从这个小时产量和小时用电量分布图(图1-7)中,还可以看出有几个异常数据点远离正常的数据区域,如图1-8所示。如果要使用这个历史数据作为今后计算耗电量的参考,那么这几个异常数据点应该被剔除,以免对计算结果造成较大干扰。

图1-8 几个异常数据点

本案例素材是“案例1-2.xlsx”。