概述
特征工程
特征工程指的是把原始数据转变为模型的训练数据的过程,它的目的就是获取更好的训练数据特征,使得机器学习模型逼近这个上限。特征工程能使得模型的性能得到提升,有时甚至在简单的模型上也能取得不错的效果。特征工程在机器学习中占有非常重要的作用,一般认为括特征构建、特征提取、特征选择三个部分。特征构建比较麻烦,需要一定的经验。
其中,以标签为目标,根据标签的不同属性做特征工程是特征工程中重要的一环
如在本次项目中,用相关性探索在is标签下,各个标签的相关性,并绘制热力图
或者在推荐系统中,探索是否点击这个标签与广告位置这一特征的关系
因此可以筛选出跟标签相关性高的特征,删去相关度低的特征,增加模型的泛化能力,避免过拟合。
但是在进行预测的过程中,常常可能会遇到一种情况,比如该特征在训练集上较为均匀,但是在测试集上可能集中于某一部分,这种可能会对模型的预测带来不好的影响,因此需要删去特征在两者相差过大的区间,避免模型预测时出现过拟合或欠拟合。
同时,每个人做特征工程的手法各有千秋,为此需要大量练习,从多个角度分析特征的性质,帅选出最优特征。
预测
模型的最终的一步即是对数据进行预测,每个模型都有自己适合的数据集,因此需要多个模型进行对比,得到最终结果
最后
以上就是能干黑夜为你收集整理的金融时序预测-task5,6 特征工程,建模预测的全部内容,希望文章能够帮你解决金融时序预测-task5,6 特征工程,建模预测所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复