day1 AI面试刷题1、简述机器学习项目的一般流程2、哪些机器学习算法需要做特征归一化,哪些不需要?为什么?3、One-hot的作用是什么?为什么不直接使用数字作为表示?4、什么是数据不平衡?如何解决?5、请比较欧氏距离与曼哈顿距离
day1 AI面试刷题1、简述机器学习项目的一般流程2、哪些机器学习算法需要做特征归一化,哪些不需要?为什么?3、One-hot的作用是什么?为什么不直接使用数字作为表示?4、什么是数据不平衡?如何解决?5、请比较欧氏距离与曼哈顿距离1、简述机器学习项目的一般流程机器学习项目的流程数据获取(爬虫,第三方,自产)数据分析与清洗(观察样本数据特征,数据类型;洗去样本异常值,去除或填补缺失值)特征工程(筛选重要特征,或融合产生新的、更重要的特征)建模(训练模型,选择合适的模型,注意分类,聚类还是回归