我是靠谱客的博主 俊秀饼干,最近开发中收集的这篇文章主要介绍机器学习进阶day1,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

最大似然估计的概念

最大似然估计就是在已知样本的前提下,找出使得样本发生最大的概率的参数值。
求解最大似然估计的步骤:
(1) 概率密度函数相乘得到似然函数
(2) 对似然函数取对数得到对数似然函数
(3) 对对数似然函数求导
(4)求解

赔率

公平赔率为概率的倒数
真实赔率为公平赔率×α(小于1的系数)

PCA的理解

实际操作,将样本在某个方向上进行投影,使得样本降维
主方向:使得在某个方向投影后的方差最大的方向称为PCA的主方向

One-hot编码

对一些文本类别转换成数值类型的数据,会导致样本特征膨胀
函数
pd.get_dummies(data)
get_dummies 是利用pandas实现one hot encode的方式
指定列进行one-hot编码
pd.get_dummies(df.列名)

pd.Categorical() 识别数据中的不同数据的个数
x.categories——返回类别
x.codes——返回序号

最后

以上就是俊秀饼干为你收集整理的机器学习进阶day1的全部内容,希望文章能够帮你解决机器学习进阶day1所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(58)

评论列表共有 0 条评论

立即
投稿
返回
顶部