我是靠谱客的博主 故意嚓茶,最近开发中收集的这篇文章主要介绍python按比例抽样质检,python – 如何在scikit中进行抽样学习?,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

我会选择使用

Pandas DataFrame和

numpy.random.choice来执行此操作.通过这种方式,可以轻松地进行随机抽样以生成大小相同的数据集.一个例子:

import pandas as pd

import numpy as np

data = pd.DataFrame(np.random.randn(7, 4))

data['Healthy'] = [1, 1, 0, 0, 1, 1, 1]

该数据有两个非健康和五个健康样本.要从健康人群中随机挑选两个样本,您可以:

healthy_indices = data[data.Healthy == 1].index

random_indices = np.random.choice(healthy_indices, 2, replace=False)

healthy_sample = data.loc[random_indices]

要自动选择与非健康组相同大小的子样本,您可以执行以下操作:

sample_size = sum(data.Healthy == 0) # Equivalent to len(data[data.Healthy == 0])

random_indices = np.random.choice(healthy_indices, sample_size, replace=False)

最后

以上就是故意嚓茶为你收集整理的python按比例抽样质检,python – 如何在scikit中进行抽样学习?的全部内容,希望文章能够帮你解决python按比例抽样质检,python – 如何在scikit中进行抽样学习?所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(55)

评论列表共有 0 条评论

立即
投稿
返回
顶部