我是靠谱客的博主 故意嚓茶,这篇文章主要介绍python按比例抽样质检,python – 如何在scikit中进行抽样学习?,现在分享给大家,希望可以做个参考。

我会选择使用

Pandas DataFrame和

numpy.random.choice来执行此操作.通过这种方式,可以轻松地进行随机抽样以生成大小相同的数据集.一个例子:

import pandas as pd

import numpy as np

data = pd.DataFrame(np.random.randn(7, 4))

data['Healthy'] = [1, 1, 0, 0, 1, 1, 1]

该数据有两个非健康和五个健康样本.要从健康人群中随机挑选两个样本,您可以:

healthy_indices = data[data.Healthy == 1].index

random_indices = np.random.choice(healthy_indices, 2, replace=False)

healthy_sample = data.loc[random_indices]

要自动选择与非健康组相同大小的子样本,您可以执行以下操作:

sample_size = sum(data.Healthy == 0) # Equivalent to len(data[data.Healthy == 0])

random_indices = np.random.choice(healthy_indices, sample_size, replace=False)

最后

以上就是故意嚓茶最近收集整理的关于python按比例抽样质检,python – 如何在scikit中进行抽样学习?的全部内容,更多相关python按比例抽样质检,python内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(133)

评论列表共有 0 条评论

立即
投稿
返回
顶部