悦耳天空

文章
7
资源
1
加入时间
2年10月18天

机器学习相关面试题为什么需要对数值类型的特征做归一化?类别型特征如何处理的?距离/相似度如何计算?K-Means算法的缺陷和优点是什么?K-Means算法的应用场景K-Means算法如何确定K值?K-Means算法实现-伪代码还有哪些其他的聚类算法?K近邻法(Knn)与k-Means的区别?有哪些分类算法?信息熵 条件熵 信息增益 信息增益比 GINI系数ID3、C4.5、CART三种决策树的区别前剪枝后减枝决策树和随机森林过拟合与欠拟合分类算法有哪些评估指标?ACC、ROC、AUC是什么?

絮叨两句:博主是一名数据分析实习生,利用博客记录自己所学的知识,也希望能帮助到正在学习的同学们人的一生中会遇到各种各样的困难和折磨,逃避是解决不了问题的,唯有以乐观的精神去迎接生活的挑战少年易老学难成,一寸光阴不可轻。最喜欢的一句话:今日事,今日毕机器学习面试题为什么需要对数值类型的特征做归一化?类别型特征如何处理的?距离/相似度如何计算?欧几里得距离(Eucledian Distance)曼哈顿距离(Manhattan Distance)明可夫斯基距离(Minkowski distance).