内容
- 定义-未标记数据是什么意思?
- Microsoft Azure和Microsoft Cloud简介在本指南中,您将了解什么是云计算,以及Microsoft Azure如何帮助您从云迁移和运行业务。
- Techopedia解释了未标记的数据
定义-未标记数据是什么意思?
未标记数据是未标记有特征,特性或分类的标签的数据的标记。未标记的数据通常用于各种形式的机器学习中。
Microsoft Azure和Microsoft Cloud简介在本指南中,您将了解什么是云计算,以及Microsoft Azure如何帮助您从云迁移和运行业务。
Techopedia解释了未标记的数据
在称为无监督机器学习的机器学习类型中,机器学习程序通过评估未标记数据集来运行。由于数据没有标签,因此机器学习程序必须根据其属性和特征识别每个数据。
解释这一点的最佳方法之一是使用水果盘隐喻。假设机器学习程序正在学习识别三种不同的水果-香蕉,葡萄和苹果。如果标记了初始训练集中的数据,则机器学习程序将从该角度进行工作-将连续图像匹配到这三个类别之一。
但是,如果所有数据都没有标有三个水果名称(香蕉,葡萄和苹果),则机器学习程序将需要通过评估每个图像并查看颜色(黄色,红色或紫色),形状等特征来工作。长而细,圆形或成簇–以及其他特征。
从该示例可以很容易地看出,标记数据如何为使用机器学习算法获得决策结果提供了更轻松的机会。但是,处理未标记数据的复杂的无监督机器学习程序也可以产生惊人的准确结果。