我是靠谱客的博主 心灵美灰狼,这篇文章主要介绍特征既有类型(nominal)变量又有数据/数字(ratio)变量的时候,该怎么进行特征处理呢?不妨试试sklearn的DictVectorizerReference,现在分享给大家,希望可以做个参考。

直接上代码,然后就着代码分析

>>> from sklearn.feature_extraction import DictVectorizer
>>> v = DictVectorizer(sparse=False)
>>> D = [{'性别': '男', '年龄': 2}, {'性别': '女', '年龄': 23}]
>>> X = v.fit_transform(D)
>>> X
array([[ 2.,
0.,
1.],
[23.,
1.,
0.]])
>>> v.inverse_transform(X) == [{'年龄': 2.0, '性别=男': 1.0},
...
{'年龄': 23.0, '性别=女': 1.0}]
>>> v.transform({'性别': '男', '年龄': 267})
array([[267.,
0.,
1.]])

代码中的D是字典类型的特征数据,sparse=False表示输出的不是稀疏矩阵。

Reference

  1. sklearn.feature_extraction.DictVectorizer

最后

以上就是心灵美灰狼最近收集整理的关于特征既有类型(nominal)变量又有数据/数字(ratio)变量的时候,该怎么进行特征处理呢?不妨试试sklearn的DictVectorizerReference的全部内容,更多相关特征既有类型(nominal)变量又有数据/数字(ratio)变量内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(129)

评论列表共有 0 条评论

立即
投稿
返回
顶部