一旦决定对生产资产生成的当前和历史数据进行持续分析,分析决策过程才刚刚开始。你最大的决定仍然在前面,围绕着在哪里以及如何最好地进行这些分析。
随着越来越多的公司追求数据分析,混合应用显然被视为最佳选择。在这种情况下,术语混合指的是边缘计算平台和云计算平台执行的分析的组合。最近的研究结果自动化的世界一项针对2018年10月边缘计算、云计算和雾计算使用情况的调查显示,43%的受访者目前正在使用边缘计算实现,51%的受访者正在使用云计算。对调查的回应表明,混合云/边缘应用程序的水平不容小觑。
但是理解混合分析模型的使用只能回答分析体系结构问题的一部分。用户仍然需要确定如何最有效地进行数据分析。换句话说:在一个混合的边缘/云分析环境中,什么类型的数据应该被发送到云端,什么类型的数据应该在边缘进行分析?
为了更深入地了解这个问题,我采访了OSIsoft的工程副总裁克里斯·纳尔逊(Chris Nelson),这家公司长期以来以其在植物数据分析方面的专业知识而闻名。为了帮助最好地确定哪些数据应该进入云端进行分析,哪些数据应该在边缘进行分析,我们评估了五个因素:速度、可靠性、安全性、带宽和复杂性。
速度
就像任何复杂的问题一样,如何在云计算中考虑速度因素和边缘数据分析的决定,这个问题的答案是:视情况而定。之所以不能清楚地给出答案,是因为这个决定没有标准或明确的界限。
Nelson表示,除了带宽成本和连接质量等显而易见的问题之外,所涉及的数据量和类型,以及解决问题所需的时间,都是影响因素。
当考虑要分析的数据的数量和类型时,Nelson说最初会出现两个问题:将数据存储在边缘是否有意义?这个决定需要在几分钟内做出,还是需要一到两周的时间来评估?
为了澄清,Nelson说:“大多数预测性维护问题都可以在边缘处解决。如果工程师或操作员看到性能突然发生变化,他或她通常可以迅速将其缩小到几个原因。在这种情况下,分析实际上是由你的员工提供的。但假设这是一个非常复杂的问题,比如确定为什么某个工厂比其他工厂更有效率,以及该工厂的做法是否有助于减少未来十年的资本支出。那么你谈论的是一个庞大的数学问题,最好通过在云中运行多个场景来解决。因此,分界线实际上是你在看一个人类规模的问题,还是你需要算法来真正解决问题。”
可靠性和安全性
虽然这两个问题明显不同,但它们也明显交织在一起,需要立即作出反应。对快速响应的需求使边缘计算分析成为明显的选择。但云计算仍然可以在这里发挥作用。
Nelson举了一个边缘计算应用的例子:“例如,壳牌公司创建了一个系统,可以在控制台上实时监控防喷器的性能和健康状况。”“如果突然出现井喷或问题,它可以立即堵住油井。通过这个系统,Shell可以看到实时性能以及随着时间的推移的学习性能。同样,食品、制药和水的质量和产品安全也是经典的边缘计算问题。如果一种药品的生产出了问题——比如由于环境因素或混合材料的变化而使生产过程偏离了方向——你就想立即知道。你可以停止生产,解决问题,防止可能昂贵而复杂的召回。”
纳尔逊说,当涉及到长期诊断时,云可以在可靠性和安全问题上发挥作用。“例如,你的系统中是否有什么东西导致了一个反复出现的问题,可以通过改变来永久性地解决这个问题?”
带宽
“带宽质量是远程资产的一个问题,其相关成本也是一个巨大的问题,”Nelson说。“想想风力发电场。在风力涡轮机上,你可能需要监测大约650个参数。如果你每十分钟定位一次,那一天就是九万三千次。这还只是一个涡轮机。有几百个风力发电场。事实上,在美国有超过57,000个涡轮机。你的连接费用将是惊人的,因为你发送大量的数据到云,其中大部分数据只需要在本地使用。一个更好的策略——我们看到很多公司都在采用——是将数据存储在本地,然后将快照发送到云端。”
Nelson指出,一些公司正在使用LTE来降低向云端发送大量数据的成本问题。“森普拉能源最近与诺基亚和OSIsoft在内布拉斯加州的Broken Bow II风力发电场推出了一个实验性的LTE网络,”他说。“如果其中一个螺距轴承装置坏了,可能会花费15万美元。通过OSIsoft的PI系统数据和LTE技术,Sempra可以在问题完全发展之前发现问题,并减少高达90%的修复费用。”
复杂性
确定将标记云和边缘使用之间分界线的复杂性因素是一个复杂的考虑,这并不奇怪。为了帮助澄清,Nelson举了几个例子。
在他的第一个例子中,他提到了匈牙利一家大型炼油公司MOL。“总的来说,他们用PI系统跟踪了大约40万个数据流或标签。MOL一度经历了高温氢攻击。从本质上说,这是当反应堆中松散的氢分子嵌入钢壁并开始削弱它们时。工程师们看到了腐蚀,怀疑这可能是氢气问题,并通过PI数据确认了这一点。他们还使用该系统跟踪修复的进度。他们能够在一周内将其推广到6个单位。试验成功后,他们增加到了50台。这是一个工程师使用PI来解决局部问题的例子——在边缘——然后复制它。后来,MOL提出了在其系统中使用高硫机会原油的想法。 This had the potential to create problems because MOL’s production line was designed for higher grade crudes. Determining whether or not to use opportunity crudes, however, is a titanic math problem involving different simulations and scenarios. How will the daily volume change? Will this increase wear and tear and therefore maintenance costs? What happens if overall market prices dip? To address these questions, MOL took PI System data at the edge and shuttled it to Microsoft Azure. This analysis program is underway.”
纳尔逊举了第二个例子,德舒特啤酒厂的一款啤酒发酵过度。“通过使用PI系统和一个额外的传感器,它基本上找到了水箱中酵母过于活跃的区域。安装了一个补丁,也减少了酿造时间,让德舒特公司在同一条生产线上额外生产了价值约40万美元的啤酒。”这是一个边缘计算分析应用程序的例子,它改善了啤酒厂的生产。
成功之后,Deschutes想要研究每种啤酒的发酵循环。他们想知道的问题包括:鲜榨IPA在什么程度上达到了特定的酒精含量,以及它与黑巴特波特酒(Black Butte Porter)有何不同?Nelson说:“这个数学问题最好在Azure中解决。”
为了帮助总结边缘/云分析分界线问题,Nelson建议这样处理这个问题:“如果问题是用户可以通过良好的信息源自己解决的,那么就把重点放在边缘分析上。如果你讨论的是15个不同的数据流和多个变量,那么这个问题更适合云计算。”