我是靠谱客的博主 内向小懒猪,最近开发中收集的这篇文章主要介绍机器学习实战-第一章,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

机器学习的价值在于发现数据背后的价值,将杂乱的数据转化为信息。

因为我们无法建立精确的模型,所以我们要应用统计学。

关键术语:

在监督学习中:特征,目标值,目标值也叫作类别。

无监督学习(我现在对无监督学习的理解就是聚类):聚类,寻找描述数据统计值的过程称为密度估计。无监督学习可以减少数据特征的维度。


如何选择合适的算法:

1、目的:想要完成什么工作。(无监督学习情况下,如果想分成离散的组用聚类算法,如果估计数据与每个分组的相似程度用密度估计算法)

2、数据:充分了解数据可以减少算法选择的时间。


开发机器学习应用程序的步骤:

1、收集数据

2、准备输入数据

3、分析输入数据(发现垃圾数据,能用二、三维图像分析最好)

4、训练算法

5、测试算法(问题常常跟数据的收集和准备有关)

自己的理解:

1、问题跟数据的预处理有关,最终跟自己对业务的理解有关?

2、如果算法结果满意,想优化算法,那么“可以使用其他的机器学习技术来改进其性能“是什么意思?

3、第九页说的”最好的算法“是不是一个算法经过自己反复优化?自己还要改动算法?


python的有点:

1、语法清晰2、易于操作纯文本文件3、使用广泛,存在大量的开发文档

python的缺点:

效率不如c语言,前期使用python实现,后期更改为c语言(书中提供了方法)。

最后

以上就是内向小懒猪为你收集整理的机器学习实战-第一章的全部内容,希望文章能够帮你解决机器学习实战-第一章所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(37)

评论列表共有 0 条评论

立即
投稿
返回
顶部