sklearn 抽样

389 阅读 0 评论 257 点赞

我是靠谱客的博主霸气钻石，这篇文章主要介绍sklearn 抽样，现在分享给大家，希望可以做个参考。

1 交叉验证包中的train_test_split

设置测试集比例，在原始数据中随机采样，但是所得样本中各个类别比例保持与原样本一致。如下例所示

import numpy as np
data_x=[['this is class 1 ']]*100 + [['this is class 2']]*50
data_y=[[1]]*100 + [[2]]*50
data_y

X_train, X_test, y_train, y_test = train_test_split(data_x,data_y,test_size = 0.3)
X_train
#sum(y_train==1)/len(y_train)

print('numbers of positive class in training data:', sum( np.mat(y_train)==1 )[0],'/',len(y_train) )
print('numbers of negative class in training data:', sum( np.mat(y_train)==2 )[0],'/', len(y_train))
print('numbers of positive class in test data:',sum(np.mat(y_test)== 1 ),'/',len(y_test))

numbers of positive class in training set: [[74]] / 105
numbers of negative class in training set: [[31]] / 105
numbers of positive class in test data: [[26]] / 45

待更新

最后

以上就是霸气钻石最近收集整理的关于sklearn 抽样的全部内容，更多相关sklearn内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(257)

本文分类：机器学习
浏览次数：389 次浏览
发布日期：2023-07-29 18:50:04

相关文章

python四种抽样方法的使用：随机抽样、聚类抽样、系统抽样、分层抽样示例代码

python四种抽样方法的使用：随机抽样、聚类抽样、系统抽样、分层抽样示例代码

python按照某个字段，对目标按照给定的比例进行分层抽样

python按照某个字段，对目标按照给定的比例进行分层抽样

Python对数据集进行随机抽样sample()方法

Python对数据集进行随机抽样sample()方法

idea2020.2中@test是怎么测试的_Sklearn 划分训练集和测试集

idea2020.2中@test是怎么测试的_Sklearn 划分训练集和测试集

sklearn 抽样

R语言对dataframe（data.table）数据分层随机抽样实战R语言对dataframe（data.table）数据分层随机抽样实战

R语言对dataframe（data.table）数据分层随机抽样实战R语言对dataframe（data.table）数据分层随机抽样实战

纯随机采样(train_test_split)和分层采样(StratifiedShuffleSplit)| sklearn库实现

纯随机采样(train_test_split)和分层采样(StratifiedShuffleSplit)| sklearn库实现

Sklearn中不同的数据抽样验证方式1. 普通交叉随机抽样验证：train_test_split()：2. K折交叉抽样验证：KFold()：3. 分层K折抽样验证：StratifiedKFold()：4. 分层随机抽样验证：StratifiedShuffleSplit()：指标验证方式：

Sklearn中不同的数据抽样验证方式1. 普通交叉随机抽样验证：train_test_split()：2. K折交叉抽样验证：KFold()：3. 分层K折抽样验证：StratifiedKFold()：4. 分层随机抽样验证：StratifiedShuffleSplit()：指标验证方式：

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部