5数据质量差的原因

从人为错误到糟糕的集成,有几个因素会阻碍数据的价值以及依赖于它的数字转换。

虽然网络设备就像行业4.0的静脉和动脉,但数据肯定是它的生命困难。毕竟,数据是每个先进的制造操作的内在。在没有运行数据的情况下无法完成更好的决策和过程改进。

鉴于现代制造业及其未来的数据的内在价值,需要将数据汇总和分析为尽可能清洁和正确。但如果您知道可以包含数据完整性的关键因素,您只能评估数据的清洁度。

Michael Simms,哥伦布全球数据与分析实践总监。Michael Simms,哥伦布全球数据与分析实践总监。Michael Simms,Data和Analytics的实践总监哥伦布全球该公司表示,造成数据质量下降的原因有五个:

  • 人为错误:“人们会犯错误,当你手动键入数据时,可能会出现错误,比如遗漏细节、打字或将数据放入错误的字段,”西姆斯说。
  • 不一致的数据录入标准:如果您的公司没有关于如何输入或捕获数据的标准,数据质量将不可避免地受到影响。“我曾经和一家公司在数据迁移方面合作过,我们一开始是根据邮政编码和州划分他们的数据。在对数据进行几分钟的梳理后,我立即发现了一个问题:数据显示253个州,因为没有输入州名的固定方法。每个状态以多种格式出现多次;例如,内布拉斯加州,内布拉斯加州。西姆斯说。

  • 请收听本期播客如何从数据分析软件中获得快速的ROI。


  • 缺乏权威数据源:这是权威数据源所需的单一版本。SIMMS说:“如果您的数据存在问题,但修复源未发生修复,则另一端不会可靠。例如,随着上述状态数据问题,如果在报告中进行了修复,但没有人返回并确保在源中清理数据,公司将继续遇到该问题,浑浊的任何报告.正确的数据治理和设置要修复数据问题的协议需要到位。
  • 可怜的数据集成。重要的是要认识到,数据质量可能会在您从所有系统中提取数据的过程中发生巨大变化。Simms指出,重复的数据是面临的一个重要挑战,因为这些重复会扭曲任何分析。
  • 没有及时更新数据。”数据被抛弃和遗忘,”西姆斯说。“确保它不会。”为了缓解这一问题,Simms建议保持产品名称、供应商和员工信息、电子邮件地址和其他相关信息的更新,确保这些领域中没有重复、错误或过时的信息。

确保数据质量的一个关键步骤是确保IT不拥有它。你没看错,simms建议IT不要拥有你公司的数据。

“您的IT团队可能是足智多谋的,他们可能在确保一切顺利运行方面做得很好,”Simms说,“但他们不应该是数据的保管者。数据应该由那些每天都在使用数据的人来管理,那些知道数据意味着什么以及拥有可靠信息的重要性的人。”

为了为公司的决策建立一个可靠的基础,Simms说要对高质量数据进行规划,包括将所有权交给管理层,并为数据质量改进过程寻找一个值得信赖的合作伙伴。


读这篇文章更好地理解工业分析软件


本文中的公司
在IIoT