黑暗数据如何影响大数据世界

作者: Roger Morrison
创建日期: 20 九月 2021
更新日期: 1 七月 2024
Anonim
上海小红楼案与嫖娼大数据||上海小红楼案撕掉上海文明的外衣||躺平叔聊上海小红楼案
视频: 上海小红楼案与嫖娼大数据||上海小红楼案撕掉上海文明的外衣||躺平叔聊上海小红楼案

内容


资料来源:Agsandrew / Dreamstime.com

带走:

暗数据是从未见过的数据,但是这些长期以来被忽视的数据可能对组织有用。

有两种方法可以查看暗数据在大数据世界中的影响:

  1. 作为隐藏在大数据中的机会
  2. 由于存在风险,因此暗数据构成了

几乎所有公司都存储了不同时间长度的暗数据,而没有进行任何分析。在这样做的同时,他们失去了获得未分析数据可能揭示的见解的机会。长时间存储暗数据还存在一些风险,例如法律,财务,声誉和竞争优势的丧失。公司需要更好地利用其黑暗数据存储库,不仅可以提高业务效率,还可以最大程度地降低风险。

什么是暗数据?

几乎每家公司都会收集大量数据,以期获得对诸如客户行为,软件开发流程,会议时间和生产力以及网站可用性等事物的更多见解。这些见解可帮助公司做出响应,以提供改进的产品和服务。但是,令人惊讶的是,很大一部分数据长时间未使用。公司只是存储它而不进行任何分析。此类数据称为暗数据,并且此类数据量很大。 IDC估计生成的总数据中有90%是暗数据-这是一个重要发现。 Gartner将暗数据定义为

“信息资产组织在常规业务活动期间进行收集,处理和存储,但通常无法将其用于其他目的(例如,分析,业务关系和直接获利)。与物理学中的暗物质相似,暗数据通常包含大多数组织的信息资产。因此,组织经常保留暗数据,仅用于合规目的。存储和保护数据通常会带来比价值更高的费用(有时甚至更大的风险)。”

什么样的数据没有分析?已发现以下类别的数据符合深色数据类别的要求:

  • 原始调查输入
  • 客户资料
  • 以前的员工数据
  • 财务报表
  • 对话
  • 聊天记录
  • 呼叫中心成绩单
  • 帐户资料

大数据与暗数据之间的区别

暗数据是大数据的子集。因此,收集的大数据有两个部分:已分析和未分析。未分析的数据是暗数据。有趣的是,未经分析的数据构成了大数据的最大部分。


公司建立黑暗数据库存的原因

上面给出的数据类型列表可能为公司提供很多价值。尽管如此,令人惊讶的是它们无人值守。造成这种情况的原因很多,但最重要的似乎是缺乏投资。下面列出了造成黑暗数据存储增加的一些原因。

当没有人关心软件质量时,您就无法提高编程技能。

原因与缺乏投资有关。如果数据收集是由彼此不交互的技术执行的,则这将阻止组织创建全面的数据策略。许多具有落后技术的组织都在努力整合从不同来源收集的数据,例如呼叫中心聊天记录,网站点击数据和视频会议数据。要处理和集成不同的格式,您需要适当的技术。

黑暗数据潜力

如果90%的大数据是暗数据,这可能是一片未被发现,被忽视的机会的天才。正如上述原因所指出的,公司之所以没有利用暗数据是因为它们提供的价值不大,而是由于公司自身的局限性。因此,可以确定暗数据具有很大的潜力。让我们尝试在制造业的帮助下了解这种潜力。

根据弗若斯特沙利文(Frost&Sullivan)的研究,“物联网,服务互联网,大数据和集成产业将对制造业价值链的各个部分产生决定性影响。”制造业将从以下方面获得有价值的数据:

  • 机器日志
  • 设备传感器
  • 产品远程信息处理
  • 消费者点击流
  • 社交媒体

预测需求并解决问题

通过准确地分析客户的点击流数据并获得产品远程信息处理,公司可以准确地预测需求并通过优化商品供应做出适当的响应。公司还可以借助传感器和远程信息处理产生的暗数据来隔离问题,从而解决问题。

建立更智能的供应链

为了准确知道需求的时间和数量并适当地响应需求,公司需要一个聪明而强大的供应链。一种具有这种方式的方法是获得供应链各个组成部分的详细信息。精细的信息使公司能够实现质量以及及时交付。而且只有暗数据才能提供有关供应链的详细信息。

通过客户反馈提高产品质量

在这些瞬息万变的时代,客户不再是只消费产品的人。从某种意义上说,客户是可以通过口口相传,推荐和社交媒体推销产品的品牌大使。对于产品管理,设计和工程团队来说,利用客户反馈并提高产品质量至关重要。暗数据可以通过提供产品的360度视图以及在市场上的视图方式来帮助制造公司。那公司能做什么呢?


  • 拥有设计良好的分析框架,该框架可利用暗数据并为所有利益相关者提供对该框架的访问。
  • 借助可预测故障或产品故障的传感器数据和远程信息处理,减少计划外,不可预见的产品开发停机时间。
  • 将远程信息处理与社交媒体集成在一起,以便可以实时捕获客户反馈,并将数据传输到相关部门。
  • 使用数据以敏捷的方式改善产品功能。

结论

毫无疑问暗数据的潜力。但是,公司还需要牢记无限期存储和处理暗数据的风险。暗数据可能包含敏感信息,任何无意或蓄意的信息泄漏都可能带来麻烦。公司需要具有良好的数据标记和结构化技术,以便对数据进行识别和分类。即使他们不打算对其业务进行分析,这也是必要的。否则,财务,监管,竞争优势的丧失和法律问题可能很快就会出现。