一千个电子表格的死亡:时间序列数据的简单又致密的性质

尽管有很多限制,电子表格是在时间序列数据上执行临时分析的工程师的首选工具。幸运的是,高级分析软件的形式有更好的替代方案。

此内容由供应商直接提交给本网站。

在20世纪70年代中期,该过程制造业从第一个分布式控制系统开始向数字基础设施的转型,这一趋势在20世纪80年代加速了监督控制和数据采集和人机界面系统的激增。配备传感器,数字网络和可编程逻辑控制器,公司开始从其运营中收集和收集大量数据。现在,现在30多年后,流程制造公司为平均工厂生成数据-1TB /日的数据,以及多个工厂的公司的40tb /天(见图1) - 记录流动,温度,压力,水平和两者之间的一切。

这种传感器数据,技术上“时间序列数据”是过程制造中所有分析和优化工作的起点。但是,分析时间序列数据与关键是复杂的,留下许多组织在Excel电子表格的Web中汇集。

时间序列数据的概念很简单:以数据对的形式存储的一段时间内对物理世界的测量-时间戳:值。但这只是表面现象。在过程制造工厂,成千上万的传感器在任何一天的不同时间间隔测量世界。公司必须能够分析所有这些数据以发现关系、调查问题、优化生产并预测结果以防止灾难性故障(图2)。

此外,组织还使用时间序列数据来支持更广泛的业务目标。考虑到过程制造的变化率,如果分析是以及时改进操作,则必须快速发生。这就是时间序列数据突然变得非常复杂的地方。

时间序列数据存储
时间序列数据通常存储在专用应用中,例如过程,数据或企业历史学家。可以在“趋势者”中查看数据,这是用于视觉分析的应用程序,或复制到基于计算的分析的电子表格中。虽然组织受益于合并关系数据,以实现新的和更复杂的关系和相关性,但时间序列数据并不仅仅因为它在一个地方聚合而无法实现更好的洞察力:需要用户输入!

这是因为随着时间序列数据的计算分析取决于用户定义兴趣的关键时间段和相关的上下文 - 所有情况下都在分析时。这就是电子表格,因为时间耗时和繁琐的原因,仍然是工程师执行临时分析的时间序列工具。他们将用户控制有关问题和调查,同时提供已知的分析路径。

然而,电子表格带来了一系列新的问题。协作和版本控制一样困难,而且新的查询必须在数据更改时运行。数据清理和上下文化是一个缓慢的手动过程。一个人在桌面上做的事情可能不会被他的同事发现。时间序列数据的基本问题,如时区、夏令时、插值类型和逻辑,必须由用户在电子表格公式中解决。结果不只是在电子表格的地狱中工作几个小时,而是几周或几个月。

此外,时间序列数据在盈利能力和效率使用情况的更广泛的业务背景下难以调和和分析。传统的商业智能(BI)应用程序对于关系数据集非常重要,但它们不会适应时间序列数据的动态性质。数据科学家无法运行算法,直到数据“准备就绪”,这意味着它们必须首先组装清洁,计算和上下文的时间序列数据模型。对于算法中的所有专业知识,数据科学家没有植物,资产或流程专业知识,以了解数据中正在寻找的内容。这就是为什么流程工程师主题专家提供了第一个原则专业知识的,是业务分析师和数据科学任务的数据准备工作以及与过程相关的分析。

撇开复杂性不谈,时间序列数据对于创新和实现业务目标至关重要。利用时间序列数据来为流程工程师和传统BI应用程序增强和驱动更深层次的上下文和意义是正确的路径,但是今天大多数分析都从相同的起点开始:电子表格。

利用数据洞察力
那么流程工程师和数据科学家如何快速获得他们所需要的洞察力并合作更好,更优化的未来?这是Seeq高级分析软件进出的地方(图3)。

高级分析软件与时间序列数据一样易于使用,以分析,使过程工程师和主题专家进行清洁,上下文化和模型操作数据,以便快速找到正确的见解和基于数据的决策。数据被屏幕访问,从未复制或重复,并用于诊断,预测和描述性分析。

高级分析软件使同事的合作具有发布的报告和仪表板的同事,用于整个组织的见解。在没有遥控的电子表格中通过数十万行。通过高级分析软件,可以快速获取洞察组织需要实现时间序列数据的全部价值。

因此,对于使用PowerBi,Tableeau或其他BI应用程序进行自己的分析或为业务分析做准备时间序列数据,或使用他们的机器学习算法 - 高级分析软件轻拍数据科学中的创新来追赶与时间序列数据有效分析的体积和挑战。对于那些不想用枢轴表和图形放弃电子表格的人来说?SeeQ具有与Microsoft Excel的优异集成,包括通过ODATA将更新从计算到可视化分析。

使用高级分析软件,时间序列数据最终易于分析,因为它是创建的。

公司在本文中
更多的OEE