特征既有类型（nominal）变量又有数据/数字（ratio）变量的时候，该怎么进行特征处理呢？不妨试试sklearn的DictVectorizerReference

378 阅读 0 评论 250 点赞

我是靠谱客的博主心灵美灰狼，这篇文章主要介绍特征既有类型（nominal）变量又有数据/数字（ratio）变量的时候，该怎么进行特征处理呢？不妨试试sklearn的DictVectorizerReference，现在分享给大家，希望可以做个参考。

直接上代码，然后就着代码分析

>>> from sklearn.feature_extraction import DictVectorizer
>>> v = DictVectorizer(sparse=False)
>>> D = [{'性别': '男', '年龄': 2}, {'性别': '女', '年龄': 23}]
>>> X = v.fit_transform(D)
>>> X
array([[ 2.,
0.,
1.],
[23.,
1.,
0.]])
>>> v.inverse_transform(X) == [{'年龄': 2.0, '性别=男': 1.0},
...
{'年龄': 23.0, '性别=女': 1.0}]
>>> v.transform({'性别': '男', '年龄': 267})
array([[267.,
0.,
1.]])

代码中的D是字典类型的特征数据，sparse=False表示输出的不是稀疏矩阵。

Reference

sklearn.feature_extraction.DictVectorizer

最后

以上就是心灵美灰狼最近收集整理的关于特征既有类型（nominal）变量又有数据/数字（ratio）变量的时候，该怎么进行特征处理呢？不妨试试sklearn的DictVectorizerReference的全部内容，更多相关特征既有类型（nominal）变量又有数据/数字（ratio）变量内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(250)

本文分类：# sklearn
浏览次数：378 次浏览
发布日期：2023-11-16 00:55:03

相关文章

【数据挖掘特征选择】特征选择常用方法

【数据挖掘特征选择】特征选择常用方法

实战项目：KNN算法进行车辆满意度测评选用经典的Car Evaluation Database数据集

实战项目：KNN算法进行车辆满意度测评选用经典的Car Evaluation Database数据集

数据挖掘流程_数据流挖掘 1-简介 (1- Introduction) 2-分类 (2- Classification) 3聚类 (3 Clustering) 4频繁项集挖掘 (4 Frequent Itemset mining) 5汇总表 (5 Summary Table) 六，结论 (6 Conclusion)

数据挖掘流程_数据流挖掘 1-简介 (1- Introduction) 2-分类 (2- Classification) 3聚类 (3 Clustering) 4频繁项集挖掘 (4 Frequent Itemset mining) 5汇总表 (5 Summary Table) 六，结论 (6 Conclusion)

数据挖掘--数据流挖掘

特征既有类型（nominal）变量又有数据/数字（ratio）变量的时候，该怎么进行特征处理呢？不妨试试sklearn的DictVectorizerReference

特征既有类型（nominal）变量又有数据/数字（ratio）变量的时候，该怎么进行特征处理呢？不妨试试sklearn的DictVectorizerReference

基于数据流的挖掘算法研究第二章时间序列相似性挖掘研究现状及评述

基于数据流的挖掘算法研究第二章时间序列相似性挖掘研究现状及评述

python评论情感分析计算分数值_使用python对淘宝评论进行情感分析并绘制词云

python评论情感分析计算分数值_使用python对淘宝评论进行情感分析并绘制词云

基于大数据技术构建数仓模型实践

基于大数据技术构建数仓模型实践

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部