苗条月饼

文章
9
资源
0
加入时间
3年0月28天

SparkML机器学习之特征工程(一)特征提取(TF-IDF、Word2Vec、CountVectorizer)特征工程特征提取

特征工程我们都知道特征工程在机器学习中是很重要的,然而特征工程到底是什么?怎么样通俗的理解它呢?打个比方,即使你有再好的渔具,如果给你一片没有鱼的池塘,那也是白费力气的。而特征工程就是找有鱼的那片水域。所以我们可以这么理解,特征是数据中抽取出来的对结果预测有用的信息(水域),而特征工程就是使用专业知识来处理数据,筛选出具有价值的特征(从100个水域中挑...