数据科学还是机器学习?继承人如何发现差异

作者: Laura McKinney
创建日期: 3 四月 2021
更新日期: 14 可能 2024
Anonim
万有引力定律为啥是科学的?爱因斯坦为什么要提出广义相对论?李永乐老师告诉你
视频: 万有引力定律为啥是科学的?爱因斯坦为什么要提出广义相对论?李永乐老师告诉你

内容


资料来源:Elnur / Dreamstime.com

带走:

数据科学和机器学习在关键方面有所不同。在某些方面,一个可以看作是另一个的子集。两者对于当前的IT进步都很重要。

在人工智能和数据管理的新世界中,很容易与IT世界中最常用的一些术语混淆。

例如,数据科学和机器学习之间有很多关系。不足为奇的是,许多仅对这些学科有较深了解的人会很难弄清它们之间的差异。

这是将数据科学与机器学习分开的最佳方法,这是一种原理和技术方法。

数据科学与机器学习:广义术语

首先,数据科学实际上是广泛的,总体的技术类别,涵盖了许多不同类型的项目和创作。 (有关数据科学工作涉及的内容的更多信息,请参见工作角色:数据科学家。)

数据科学本质上是处理大数据的实践。它随着摩尔定律的出现而出现,更高效的存储设备的激增导致公司和其他各方收集了大量数据。然后,像Hadoop这样的大数据平台和工具开始通过更改数据管理的工作方式来重新定义计算。现在,借助云和容器化以及全新的模型,大数据已成为我们工作和生活方式的主要驱动力。

从最简单的形式来看,数据科学是我们管理数据的方式,从清理和完善数据到以见解形式使用数据。

机器学习的定义要狭窄得多。在机器学习中,技术采用数据并将其放入算法中,以模拟被描述为“学习”的人类认知过程。换句话说,在接受数据并对其进行训练后,计算机能够提供自己的结果,该技术似乎是从程序员所采用的流程中学到的。

数据科学和机器学习技能集

对比数据科学和机器学习的另一种方法是查看对这两个领域中的专业人员最有价值的不同技能。

没有错误,没有压力-在不破坏生活的情况下创建可改变生活的软件的分步指南

当没有人关心软件质量时,您就无法提高编程技能。

人们普遍达成共识,数据科学家将从深厚的分析和数学技能,数据库技术的动手经验以及诸如Python或其他用于解析大数据的软件包的编程语言的知识中受益。


Simplilearn的Srihari Sasikumar写道:“对在(数据科学)领域建立强大职业感兴趣的任何人都应该在三个部门获得关键技能:分析,编程和领域知识。” “更深入一点,以下技能将帮助您开拓数据科学家的利基市场:精通Python,SAS,R(和)Scala的知识,SQL数据库编码的动手经验,处理来自非结构化数据的能力视频和社交媒体等各种来源,了解多种分析功能(以及机器学习知识)。”

在机器学习方面,专家经常将数据建模技能,概率和统计知识以及更广泛的编程技能作为机器学习工程师工具包中的有用工具。

如何发现机器学习

这里的关键是,各种各样的事情都构成了数据科学的工作,但这不是机器学习,除非您设置了非常严格的方案来帮助计算机从输入中学习。

到位后,它将构成一些功能强大的系统,对我们的生活产生广泛的影响。

据报道,亚马逊创始人杰夫·贝佐斯(Jeff Bezos)说:“我们对机器学习所做的大部分工作都是在地下进行的。”他指出了这类系统的某些应用。 “机器学习驱动着我们的算法,用于需求预测,产品搜索排名,产品和交易推荐,商品放置,欺诈检测,翻译等等。尽管不那么明显,但机器学习的大部分影响将属于这种类型-悄悄但有意义地改善了核心操作。”

这里最有用的例子之一是神经网络的出现-这是设置机器学习过程的一种常见且流行的方法。

在最基本的形式中,神经网络由人工神经元层组成。每个单独的人工神经元都具有与生物神经元相同的功能-但它具有输入,激活功能和最终输出,而不是突触和树突。

使神经网络像人脑一样工作,并且机器学习专业人员经常利用此模型来创建机器学习结果。

但是,这并不是进行机器学习的唯一方法。一些更基础的机器学习项目仅包括向计算机显示各种各样的照片(或向其提供其他原始数据),通过使用监督的机器学习和标签数据的过程输入想法,并最终使计算机能够区分视野中的各种形状或物品。 (有关机器学习的基础知识,请参阅机器学习101。)

两个前沿学科

总之,机器学习是数据科学的重要组成部分。但是数据科学代表着更广阔的领域和发生机器学习的弊端。

在某种程度上,您可以说没有大数据就不会发生机器学习。但是,大数据本身并不能创造机器学习功能;相反,在我们汇总了如此多的数据以至于我们几乎不知道该怎么做之后,高层思想就把这些生物模拟过程作为一种增强的方式提出来了。提供见解。


这里要记住的另一件好事是,数据科学可以以两种主要方式应用:我们可以拥抱机器学习和人工智能,让计算机为我们思考,或者我们可以将数据科学带回以人为本的方法计算机只是呈现结果,而我们作为人类来做决定。

这就导致包括今天的一些顶尖创新者在内的一些专家呼吁对我们使用这些技术的方式进行更生动的描述。

引用埃隆·马斯克(Elon Musk)的话说:“(AI)的能力远远超过几乎任何人都知道,而且改进的速度呈指数级增长。”他警告说,机器学习和AI程序需要监督。

无论如何,数据科学和机器学习都是我们当今社会在技术上取得进步的核心部分。