如何应用工业机器学习

了解不同类型的机器学习,支持它们的算法以及如何应用它们对成功实现至关重要。

预测维护是当今机器学习的主要申请,紧随其后的质量控制,需求预测和机器人培训。
预测维护是当今机器学习的主要申请,紧随其后的质量控制,需求预测和机器人培训。

随着我们每天与机器学习的互动越来越多,机器学习的概念也越来越被理解。从Netflix和亚马逊的推荐,到Siri和Cortana的语音识别,再到谷歌Maps旅行时间计算,我们都对机器学习技术越来越熟悉——尽管我们还没有完全意识到。

然而,将机器学习应用于工业则是另一回事。尽管有几家公司正在使用它,但它并不像上面提到的面向消费者的应用程序那么普遍。这就是感应自动化的Kathy Applebaum和Kevin McClusky在2018年点火社区大会上的演讲非常有趣。在他们的演讲中,他们解释了机器学习的主要分支,应用的不同类型的算法,最重要的是,工业用户可以采取什么步骤开始在他们的设施中使用机器学习。

阿普勒鲍姆表示,目前机器学习在工业中的应用状况是预测性维护,其次是质量控制、需求预测和机器人培训。

鉴于对工业应用的机器学习的明确和日益增长的兴趣,McClusky指出,现在可以在此处应用归纳自动化的点火软件。他说,随着点火点火的发布7.9.8,点火的图书馆现在包含覆盖各种用例的机器学习算法。

机器学习类型
Applebaum表示,首先要理解有三种主要技术类型作为机器学习,而且在这三个中的重叠中没有争论不足。这三种类型是:

  • AppleBaum说,分析是知识发现。“您可能已经在进行描述性分析(即,从数据库运行报告)。诊断分析添加了“为什么”组件来描述性分析以确定问题的原因(例如,机器分解为什么?)。预测分析看起来会在将来发生什么,并且通常是非常具体的,而是基于之前发生的事情。最后,通过推荐下一步解决问题,规定的分析在预测分析上建立了预测分析。“
  • 机器学习本身是指自动使用数据来学习和改善经验。
  • Applebaum说,人工Lntelligence包括模拟人类智能的计算任务。

算法
为了说明不同的算法是如何实现机器学习的,McClusky首先展示了Ignition的机器学习应用程序如何将不同的数据点组合在一起。在这个演示中,他使用了生产过程中单个部件的质量数据测量(如温度和湿度)。通过在Ignition的图表中显示这些数据,McClusky向用户展示了如何在2D空间中从多个角度查看数据。他说:“点火系统会对来自传感器的数据进行分类,以便在图形比较中使用,这样你就可以看到每一组(数据)相互比较时的表现。”

麦克卢斯基在这个例子中使用的机器学习算法被称为K-means,它对数据点进行聚类。“K-means不知道类别代表什么,它只是通过计算每个数据点在哪里以及它们之间的距离来计算中心,”他解释道。这种能力使得K-means对缺陷分析的数据进行分类很好。例如,当一个新零件通过[生产]时,你可以使用它的数据,看看它是否符合已建立的“质量良好”参数,以确定该零件是否合格或需要进一步分析。

另一种机器学习算法类型被称为决策树。AppleBaum表示,该算法非常强大,因为它可以引导您的逐步来确定数据的类别或公式。决策树对预测性维护有用,因为您可以使用它们来查看决策的作用。此外,您可以将其与其他算法结合使用。

回归分析是一种机器学习算法,可用于过程调整和生产预测。“对于流程调整,使用回归分析可以采取手动过程,并使系统生成推荐的设定值[用于手动应用程序]或者使设定值直接进入PLC,”McClusky说。“您甚至可以为正在进行调整的高级过程控制中使用此功能。”

他补充说,回归分析可用于基于当前变量集的生产预测(即任何数据点)来确定,例如,将在单线或总体上整体产生的内容。“也可以完成基于过去的过去的经验的长期预测,例如:从现在开始,生产一周或一个月的生产如何?您甚至可以像SAP一样输入其他系统的变量。对于机器学习[回归分析的应用],您使用的变量越多,您的结果越好 - 提供了数据,当然,“他所说”是良好的,“他说。

Applebaum说,神经网络算法模拟了我们认为我们的大脑工作的方式。神经网络通常用于工业中的一种方式是视觉系统。使用神经网络,您可以在线或流程中查看特定项目,并使用现有传感器推断出从这些区域进行数据以简化进程。

McClusky在Frito-Lay在Frito-Lay的点火说,参考视觉系统机器学习应用程序表示,该公司将其应用于一条规模定位的线的区域来称量土豆。Frito-Lay希望使用视觉系统来确定线上的土豆的密度,以便为每批来调整烹饪时间。他们能够成功地做到这一点,让他们消除倾倒一部分用于称重的土豆。

无论您计划使用哪种机器学习应用程序或使用哪种算法,您都需要从一开始就有良好的数据,这意味着您需要找到正确的数据并处理它的策略,以确保其质量。麦克卢斯基说:“用统计学来抽样数据,来判断它是不是好的。”“你需要了解你正在处理的整个宇宙,以获得良好的结果。所以你不能只依靠历史数据;你必须研究取样技术,相关性和因果关系。然后,考虑你的结果有多好。这就是领域知识和过程知识的重要性所在。领域专家——而不是数据科学家——知道什么类型的数据有希望,什么时候结果没有意义。”

实施
在很好地了解了机器学习的类型和支持它们的算法之后,下一步是开始考虑应用程序。Applebaum概述了机器学习实现成功的五个步骤:确定您想要解决的问题,收集数据,创建模型,部署模型,并监控是否成功。

为了找出问题,阿普勒鲍姆说,最好选择一个你想回答的问题。例如,你是否想要改进一个特定的过程,减少缺陷等等?她提醒说,在这样做的时候,要注意高价值的决定和容易的决定。她建议:“首先要简单的实施,因为高价值的项目可能很难开始。”

尽管如此,Applebaum强调,即使是简单的机器学习项目,确保获得一些价值仍然很重要,而不是让它成为一个仅仅为了展示技术而存在的项目。“理解成本函数——基于你试图做的事情,预测和实际结果之间的差异。”

这是领域知识的另一个领域可以扮演着重要的角色在机器学习应用程序而言,为项目选择有用的数据,获取丢失的数据,确保质量数据输入和识别因变量(即数据点是相互联系的,如温度和时间)。

McClusky补充说,在实施机器学习项目时,一定要使用提取转换负载(ETL)来获取数据,而不是使用生产数据库本身。自动化数据获取过程[使用ETL],以便自动获取、清理数据并处理缺失值。

然后开始以点火为点火进行可视化以帮助了解它,因此您可以查看您想要应用的算法,AppleBaum建议,添加“,不要害怕尝试多个[算法]。”点火提供K-Means,数据库扫描,神经网络和简单的回归。亚马逊Web服务,Microsoft Azure和Google Cloud提供其他工具以进一步分析。

“很多人试图吝啬这个测试过程,”Applebaum指出。“但不这样做。确保您的模型实际上预测您之前没有看到的事情。尽可能多地重新测试并重新测试以获得有用的模型。在这里花时间更好地搞定,而不是稍后解决问题。“

本文中的公司
更多的数据