正如我报告了6月大数据封面故事的基础自动化世界通过读者调查,我明白了两件事:第一,价值不在于收集所有种类的数据,而在于正确数据的分布。其次,制造商需要考虑这些信息赖以生存的老化的基础设施。目前,可能没有足够的网络带宽来支持工业物联网(IIoT)的涌入,也没有一种标准的方式来共享所有这些不同的数据。
虽然有很多关于从智能传感器和设备收集的数据周围放置上下文的谈话,但没有明确的愿景如何实现这一目标。在现场总线网络上发生的事情以及在企业中以及云中收集的内容之间存在真实的断开。
有了这一说,正在努力在厂房楼网和互联网之间建立一座桥梁。就在上个月,OPC基金会和EtherCAT技术集团宣布协议在其技术之间开发开放界面。EtherCAT支持机器和工厂地板控制系统的实时通信,OPC统一架构(OPC UA)可提供可扩展的通信和综合安全,由制造执行系统(MES),企业资源计划(ERP)系统和云提供。
这是朝向正确的方向的一步持续的沟通跨越多个网络层的IIOT。但是公司是否希望从厂房带来大量的机器级信息进入企业,在中央数据库中进行分析?让我们面对它,成千上万的小型传感器可以产生很多大数据,这可以征收网络,并将实时流程放在风险上。
另外,制造商可以选择采用边缘计算技术,使分析发生在设备上或设备附近。边缘计算的概念,也经常被称为分布式分析或雾计算,提供计算、存储和终端设备之间的网络,在数据从源加载时实现实时分析。数据是本地化和上下文感知的,可以过滤,只将相关数据发送回中央数据库或云,用于大数据分析。有很多供应商提供工业物联网分析,AGT International.成为其中之一。
AGT的物联网分析平台旨在通过分级指挥和控制系统预测和管理关键资产的潜在威胁。该系统的第一层提供直接应用于原始物联网传感器数据的分析。额外的处理,如特征提取和视频分析,被应用于交付上下文和价值给最终用户。下一层应用更复杂的分析,如模式识别、事件分类、异常检测和目标跟踪。第三层分析包括复杂的操作能力,如基于模型和数据驱动的预测分析。
当然,所有这一切仍必须与其相关联的基础设施。这就是Apache Hadoop的地方,一个开源分布式处理框架进来。AGT使用Apache技术作为其基础架构的一部分,因为它使局部计算能力跨越低成本商品服务器的集群。虽然Hadoop必须迄今为止能够支持大型数据集的离线批处理,但是一个名为Apache Storm的新产品增加了实时数据处理。现在,Hadoop群集可以从实时处理一系列工作负载到批量交互。
这对制造商来说是一个重要的发展,因为这是一种成本效益高的计算基础设施扩展方式。然而,只有7.4%的大数据调查受访者表示,他们目前正在使用Hadoop开源技术。然而,我怀疑,在不久的将来,我们会听到更多关于Hadoop、迷雾和分布式分析的消息。