概述
最大似然估计的概念
最大似然估计就是在已知样本的前提下,找出使得样本发生最大的概率的参数值。
求解最大似然估计的步骤:
(1) 概率密度函数相乘得到似然函数
(2) 对似然函数取对数得到对数似然函数
(3) 对对数似然函数求导
(4)求解
赔率
公平赔率为概率的倒数
真实赔率为公平赔率×α(小于1的系数)
PCA的理解
实际操作,将样本在某个方向上进行投影,使得样本降维
主方向:使得在某个方向投影后的方差最大的方向称为PCA的主方向
One-hot编码
对一些文本类别转换成数值类型的数据,会导致样本特征膨胀
函数
pd.get_dummies(data)
get_dummies 是利用pandas实现one hot encode的方式
指定列进行one-hot编码
pd.get_dummies(df.列名)
pd.Categorical() 识别数据中的不同数据的个数
x.categories——返回类别
x.codes——返回序号
最后
以上就是俊秀饼干为你收集整理的机器学习进阶day1的全部内容,希望文章能够帮你解决机器学习进阶day1所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复