消费者和工业机器学习的区别

处理时间序列数据是工业机器学习有别于消费应用的关键要求。因此,需要特定的标准,使工业机器学习适用于吞吐量的提高,减少停机时间,操作员安全和产品质量的应用。

消费者和工业机器学习的区别
消费者和工业机器学习的区别

机器学习可能听起来像一个技术我们将来会在某些时候使用。但是,如果我们大多数人每天都在互动,这是一种技术。如果您已将Siri要求“呼叫回家”或看到姓名标记建议,同时将照片发布到Facebook或Instagram,您遇到了机器学习。在SIRI示例中,那种机器学习被称为自然语言处理,而标记建议是图像识别的示例。其他主流机器学习示例包括关于亚马逊的购买建议,并在Google上搜索优化。

虽然这些机器学习的例子使用了神经网络、决策树和其他技术,但工业操作需要更专业的工具。原因是工业机器学习必须利用机器和生产系统产生的数据,这意味着它必须能够处理时间序列数据。

“几乎所有操作系统 - 例如制造线,工业设备,数据中心和手持设备 - 以传感器读数,日志条目或活动迹线的形式产生流或时间序列数据的流或爆发,”博士说,博士说,博士说。Falkonry的首席执行官和创始人,机器学习系统和预测分析技术的供应商。

但将这些数据用于机器学习并不简单。梅塔说:“单个信号的行为很少能说明一个复杂系统中正在发生什么。”“大多数情况下,数据代表的是从一组信号中采样的值,这些信号的值随时间不断变化。此外,信号数据可以以可变和不规则的速率连续采样或以不可预测的突发采样。它们也可能含有丰富的高频内容。”

Mehta说,当使用时间序列数据进行机器学习时,为了提高产量、减少停机时间、操作员安全或产品质量,确定系统未来状态的唯一方法是在一段时间内检查多个信号。然而,对时间序列数据进行处理的挑战在于,“数据中的时间模式出现在时间窗口上,而不是在单个快照中,”他补充道。

在普通机器学习方法中使用时间序列数据造成的问题之一是,标准分析中间件不提供从时间序列数据提取特征的功能。这样做的原因包括这样一个事实,即信号数据可能需要被缓冲,以向模型中提供一个先前历史记录的窗口;或者在处理多个信号时可能需要实现同步,每个信号可能有不同的采样率;或者信号数据中可能有缺口。

这就需要将时间序列数据分类为状态或条件。“这些情况是断断续续的,”梅塔说。“它们开始于某个时间,结束于某个较晚的时间。在实际应用中,几乎从来没有一个定义良好的训练集,在这个训练集中,所有的条件都是在一个范围内始终准确已知的。通常,我们可能只知道正常条件的一些周期和非常少的近似问题条件周期。例如,维护日志中的停机事件。”

因此,时间序列机器学习需要支持无监督和半监督模型,它需要能够从少量的示例条件构建识别,Mehta说。

他表示:“传统的机器学习项目方法,即数据科学家在几个月的时间内构建一个定制模型,然后将其交给工业主题专家(SMEs),对于大多数操作问题都不实用,也无法扩展。”“最佳的解决方案是,当机器学习系统可以被工业中小企业自己使用时,不需要太多的努力。中小型企业可以向机器学习系统输入操作产生的现有多变量时间序列数据,并根据系统提供的预测见解和警报,确定要采取的纠正措施。”

本文中的公司
更多的网络