数据仓库101

作者: Robert Simon
创建日期: 24 六月 2021
更新日期: 22 六月 2024
Anonim
101 尚硅谷 Hive 优化  Explain查看执行计划
视频: 101 尚硅谷 Hive 优化 Explain查看执行计划

内容



带走:

数据仓库为合并历史,当前和将来的数据提供了坚实的基础,从而使组织能够生成报告,进行高级分析并进行一些数据挖掘。

许多企业不断收集大量数据。但是,为了使用该信息,必须采用一套功能性的过程和程序来使其有意义。

无论您是数据仓库开发人员,还是第一次听说数据仓库一词,了解数据仓库的基础知识(包括含义,用途和用途)都是至关重要的。

一旦对数据进行了正确的分析,就可以用来更清晰地了解常见趋势和模式对企业的正面和负面影响。这听起来很简单,但是确保数据有用是数据仓库中的主要挑战之一。

什么是数据仓库?

数据仓库是一个集中式存储单元(数据库),用于定义和组装数据及其所有详细信息。这些详细信息可能包括与使用集成数据模型的组织客户群,服务提供商,供应商,交易或业务流程有关的信息。 (要了解业务流程管理,请参阅BPM和SOA:它们如何推动业务。)

数据仓库拉从跨企业提供各种来源的数据;然后可以通过多种不同方式来分析这些数据。数据仓库是集成的,非易失性的,时变的和面向主题的信息集合。这意味着数据仓库应实现以下目标:

  • 捕获并提供对业务元数据的访问
  • 提高数据质量并最大程度减少生成的报告不一致
  • 集成来自许多不同来源的数据并提供数据共享
  • 通过有效并高效地合并历史数据和当前数据,提高所有报告需求的速度和性能

资料类型

数据仓库通过从各种来源获取数据并允许业务用户从一个共享位置快速访问关键数据来提供增强的商业智能技术。在特定时间段内,数据仓库中收集的数据类型是面向主题的,集成的,标识的或同步的。

在数据仓库方面,有四种关键数据类型:

当没有人关心软件质量时,您就无法提高编程技能。

时变数据

时变数据可确保存储在数据仓库中的所有信息都是最新的并实时生成。数据仓库中的所有关键结构都通过从地平线的角度(例如过去的5到10年)提供信息来包含时间要素。

面向主题的数据

面向主题的数据是根据企业的主要主题类别(例如客户,销售,产品和服务)进行组织的。主题定位通过关注组织的主要决策者将使用的模型和数据分析,提供对特定主题问题的简单而简洁的评估。


综合数据

集成数据由多个混合源组成,例如关系数据库,在线交易记录和平面文件。成功集成指定的源之后,将应用数据清理。这样可以通过数据转换确保属性度量,命名约定,编码结构和关键术语的一致性。

业务分析和报告生成

数据仓库基于多维数据建模。多维数据模型以数据多维数据集的形式创建各种不同的视图,从而允许对数据进行审核并通过多个维度进行查看。数据仓库是组织扩展和发展时使用的第一步。它主要在公司决定开始对业务分析进行投资时使用。业务分析采用公司使用的各种技术应用程序和程序,以根据统计数据查找和识别业务需求以及改进。

业务分析可帮助组织发现和识别可用于预测,塑造和改善业务成果的模式。但是,通过此过程收集的结果确实很重要,因为这些结果用于建议创建,实施和管理新策略。 (有关背景知识,请参阅《商业智能入门》。)

业务分析解决方案采用基于事实的定量和统计数据来评估过去的绩效,并为将来的业务计划和替代方案做准备。业务数据的收集通常是由机器或应用程序通过使用统计软件生成。这就是为什么许多公司使用统计软件基于分析进行改进的原因。

统计软件和商业智能

统计软件也称为商业智能(BI)软件。对于许多公司来说,目前还没有具体的软件选择过程,而其他由企业遵守标准或有一个数据库或已经到位的报告工具,只是需要被激活。选择适当的分析软件时使用的过程始于创建BI策略并遵守已经制定的总体业务需求。

业务经理和分析师在选择合适的软件并确保他们的业务分析技术将它们按正确的方向启动方面发挥着重要作用。众所周知,诸如Amazon之类的企业会跟踪客户之间的购买行为趋势,以找出目标市场最满意的价格范围。这样,企业就可以有效地决定具有竞争力的价格,而不会对其整体利润率造成太大影响。如果没有预定义的BI策略,通常所购买的软件类型将无法为组织提供所需的适当自定义功能。

数据挖掘

数据挖掘涉及对数据的深入研究,以产生有用的见解,以做出证据和基于事实的决策。用技术术语来说,数据挖掘可用于从大型关系数据库中查找各个字段之间的相关性或模式。更具体地说,它是从多个角度分析信息并将其汇总为有用数据的过程。在最佳情况下,这些见解可以帮助企业削减成本,增加销售额并影响其他关键绩效指标。


数据挖掘是一项强大的技术,可用于发现不同数据源和记录之间存在的几个不同维度,类别和关系。例如,在零售部门,数据挖掘可以帮助公司识别销售模式和客户行为,从而使他们能够利用信息来发挥自己的优势。一个臭名昭著的例子是零售商Targets能够确定可能期望哪个购物者,从而使商店能够在父母倾向于购物时赠予婴儿用品优惠券。

简而言之,数据仓库

当集成和应用数据仓库技术,业务分析方法使企业能够提升企业整体业务战略,并允许优化决策通过使用BI软件的制作。分析起到任何组织了至关重要的作用,和许多不同的程序,包括数据挖掘等各种分析方法,可以用来支持并产生相应的数据收集服务和营销。通过改善客户服务,简化库存管理,交叉推广满足个人客户需求的产品以及提供关键的产品和服务分析,通过数据仓库技术探索新的机会和可能性。

数据仓库使组织能够找到大数据集中复杂问题的答案。那就是数字数据收集和存储的力量。