概述
什么是机器学习?
提供了机器学习的两种定义。 亚瑟·塞缪尔(Arthur Samuel)将其描述为:“研究领域使计算机无需进行明确编程即可学习。” 这是一个较旧的非正式定义。
汤姆·米切尔(Tom Mitchell)提供了一个更现代的定义:“如果某计算机程序在T任务上的性能(由P来衡量)随着经验E的提高而提高,那么据说计算机程序可以从经验E中学习一些任务T和性能指标P。 ”
例如:玩跳棋。
E =玩过许多跳棋游戏的经验
T =扮演跳棋的任务。
P =程序将赢得下一场比赛的概率。
通常,可以将任何机器学习问题分配给以下两个广泛的分类之一:
监督学习和无监督学习。
监督学习
在监督学习中,我们得到了一个数据集,并且已经知道我们正确的输出应该是什么样子,并认为输入和输出之间存在关系。
监督学习问题分为“回归”和“分类”问题。在回归问题中,我们试图预测连续输出中的结果,这意味着我们试图将输入变量映射到某个连续函数。在分类问题中,我们改为尝试预测离散输出中的结果。换句话说,我们正在尝试将输入变量映射为离散类别。
范例1:
给定有关房地产市场上房屋大小的数据,请尝试预测其价格。价格作为规模的函数是一个连续的输出,因此这是一个回归问题。
我们可以通过输出有关房屋是否“以高于或低于要价的价格出售”的输出,从而将这个示例转变为分类问题。在这里,我们将根据价格将房屋分为两类。
范例2:
(a)回归-给定一个人的照片,我们必须根据给定的照片来预测他们的年龄
(b)分类-对于患有肿瘤的患者,我们必须预测肿瘤是恶性还是良性的。
无监督学习
无监督学习使我们几乎或根本不了解结果应该是什么样。 我们可以从数据中获得结构,而不必知道变量的影响。
我们可以通过基于数据中变量之间的关系对数据进行聚类来推导此结构。
在无监督学习的情况下,没有基于预测结果的反馈。
例子:
聚类:收集1,000,000个不同的基因,然后找到一种方法,将这些基因自动分组为通过不同变量(例如寿命,位置,角色等)在某种程度上相似或相关的组。
非集群:“鸡尾酒会算法”,使您可以在混乱的环境中找到结构。 (即在鸡尾酒会上从一连串的声音中识别出个人的声音和音乐)。
根据我的想法,监督学习一般用于带有标签的输入,可以理解为自变量,而无监督学习则相反,为一般无聚类特征的输入,不带有标签根据机器学习算法将其归类。
内容来源于coursea 吴恩达机器学习
仅仅用于学习记录,欢迎交流
最后
以上就是彪壮蚂蚁为你收集整理的机器学习笔记\2.19的全部内容,希望文章能够帮你解决机器学习笔记\2.19所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复