开源大数据分析

作者: Laura McKinney
创建日期: 1 四月 2021
更新日期: 14 可能 2024
Anonim
内幕 | 报价上万的大屏数据可视化,成本只有10分钟?(附18套可视化模板)
视频: 内幕 | 报价上万的大屏数据可视化,成本只有10分钟?(附18套可视化模板)

内容

定义-开源大数据分析是什么意思?

开源大数据分析是指使用开源软件和工具来分析大量数据,以收集组织可以用来实现其业务目标的相关且可操作的信息。开源大数据分析中最大的参与者是Apaches Hadoop –它是使用最广泛的软件库,用于使用分布式进程进行并行处理跨计算机集群处理大量数据集。


Microsoft Azure和Microsoft Cloud简介在本指南中,您将了解什么是云计算,以及Microsoft Azure如何帮助您从云迁移和运行业务。

Techopedia解释了开源大数据分析

开源大数据分析利用开源软件和工具来执行大数据分析,方法是使用整个软件平台或各种开源工具来执行数据分析过程中的不同任务。 Apache Hadoop是最著名的大数据分析系统,但是在将真正的分析系统组合在一起之前,还需要其他组件。

Hadoop是Google和Yahoo率先推出的MapReduce算法的开源实现,因此它是当今大多数分析系统的基础。许多大数据分析工具都使用开源,包括健壮的数据库系统,例如开源MongoDB,这是一个非常适合大数据应用程序以及其他应用程序的复杂且可扩展的NoSQL数据库。

开源大数据分析服务包括:

  • 资料收集系统
  • 管理和监视集群的控制中心
  • 机器学习和数据挖掘库
  • 应用协调服务
  • 计算引擎
  • 执行框架