无聊鲜花

文章
7
资源
0
加入时间
3年1月10天

机器学习的几个算法

一、C4.5C4.5,是机器学习算法中的一个分类决策树算法,它是决策树(决策树也就是做决策的节点间的组织方式像一棵树,其实是一个倒树)核心算法ID3的改进算法,所以基本上了解了一半决策树构造方法就能构造它。决策树构造方法其实就是每次选择一个好的特征以及分裂点作为当前节点的分类条件。C4.5相比于ID3改进的地方有:1、用信息增益率来选择属性。ID3选择属性用的是子树的信息增益,这里...

hive初始化

①mysql要配置成远程可访问②初始化(只需要一次)schematool -dbType mysql -initSchema③hive --service metastore &(每次都需要,对接mysql需要)④启动hive