我是靠谱客的博主 心灵美灰狼,最近开发中收集的这篇文章主要介绍特征既有类型(nominal)变量又有数据/数字(ratio)变量的时候,该怎么进行特征处理呢?不妨试试sklearn的DictVectorizerReference,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

直接上代码,然后就着代码分析

>>> from sklearn.feature_extraction import DictVectorizer
>>> v = DictVectorizer(sparse=False)
>>> D = [{'性别': '男', '年龄': 2}, {'性别': '女', '年龄': 23}]
>>> X = v.fit_transform(D)
>>> X
array([[ 2.,
0.,
1.],
[23.,
1.,
0.]])
>>> v.inverse_transform(X) == [{'年龄': 2.0, '性别=男': 1.0},
...
{'年龄': 23.0, '性别=女': 1.0}]
>>> v.transform({'性别': '男', '年龄': 267})
array([[267.,
0.,
1.]])

代码中的D是字典类型的特征数据,sparse=False表示输出的不是稀疏矩阵。

Reference

  1. sklearn.feature_extraction.DictVectorizer

最后

以上就是心灵美灰狼为你收集整理的特征既有类型(nominal)变量又有数据/数字(ratio)变量的时候,该怎么进行特征处理呢?不妨试试sklearn的DictVectorizerReference的全部内容,希望文章能够帮你解决特征既有类型(nominal)变量又有数据/数字(ratio)变量的时候,该怎么进行特征处理呢?不妨试试sklearn的DictVectorizerReference所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(56)

评论列表共有 0 条评论

立即
投稿
返回
顶部