python按比例抽样质检,python – 如何在scikit中进行抽样学习？

360 阅读 0 评论 238 点赞

我是靠谱客的博主故意嚓茶，这篇文章主要介绍python按比例抽样质检,python – 如何在scikit中进行抽样学习？，现在分享给大家，希望可以做个参考。

我会选择使用

Pandas DataFrame和

numpy.random.choice来执行此操作.通过这种方式,可以轻松地进行随机抽样以生成大小相同的数据集.一个例子：

import pandas as pd

import numpy as np

data = pd.DataFrame(np.random.randn(7, 4))

data['Healthy'] = [1, 1, 0, 0, 1, 1, 1]

该数据有两个非健康和五个健康样本.要从健康人群中随机挑选两个样本,您可以：

healthy_indices = data[data.Healthy == 1].index

random_indices = np.random.choice(healthy_indices, 2, replace=False)

healthy_sample = data.loc[random_indices]

要自动选择与非健康组相同大小的子样本,您可以执行以下操作：

sample_size = sum(data.Healthy == 0) # Equivalent to len(data[data.Healthy == 0])

random_indices = np.random.choice(healthy_indices, sample_size, replace=False)

最后

以上就是故意嚓茶最近收集整理的关于python按比例抽样质检,python – 如何在scikit中进行抽样学习？的全部内容，更多相关python按比例抽样质检,python内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(238)

本文分类：python按比例抽样质检
浏览次数：360 次浏览
发布日期：2023-07-29 19:10:03

相关文章

sklearn 抽样

R语言对dataframe（data.table）数据分层随机抽样实战R语言对dataframe（data.table）数据分层随机抽样实战

R语言对dataframe（data.table）数据分层随机抽样实战R语言对dataframe（data.table）数据分层随机抽样实战

纯随机采样(train_test_split)和分层采样(StratifiedShuffleSplit)| sklearn库实现

纯随机采样(train_test_split)和分层采样(StratifiedShuffleSplit)| sklearn库实现

Sklearn中不同的数据抽样验证方式1. 普通交叉随机抽样验证：train_test_split()：2. K折交叉抽样验证：KFold()：3. 分层K折抽样验证：StratifiedKFold()：4. 分层随机抽样验证：StratifiedShuffleSplit()：指标验证方式：

Sklearn中不同的数据抽样验证方式1. 普通交叉随机抽样验证：train_test_split()：2. K折交叉抽样验证：KFold()：3. 分层K折抽样验证：StratifiedKFold()：4. 分层随机抽样验证：StratifiedShuffleSplit()：指标验证方式：

python按比例抽样质检,python – 如何在scikit中进行抽样学习？

python按比例抽样质检,python – 如何在scikit中进行抽样学习？

pandas实现对dataframe抽样随机抽样分层抽样

pandas实现对dataframe抽样随机抽样分层抽样

如何python设置确定的随机种子：

如何python设置确定的随机种子：

python random.seed()函数（生成固定随机数）random.seed(None)（取消固定随机数种子）

python random.seed()函数（生成固定随机数）random.seed(None)（取消固定随机数种子）

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部