舒适小蝴蝶

文章
5
资源
0
加入时间
2年10月17天

Python 循环与定义函数

breakfor i in range(10): if i == 2: break print i01continuefor i in range(10): if i == 2: continue print i013456789函数def square_sum(a,b): c = a**2...

Python pandas 分层抽样 超简洁

这段时间在打一个机器学习比赛,遇到分层抽样的需求。在网上查了一下,虽然也有前辈用pandas写出来过,但代码有很多冗余,于是我又重写了一个超简洁的版本。注释应该还算清晰,各位可以自取。seed随机抽取与打乱顺序时用到的随机数种子,默认为None。当输入一个数字的时候,输出的样本及样本顺序都会固定。返回的是训练样本和测试样本,两个样本不重叠,且合在一起包含了全部样本。sample_data原始数据,示例中‘label’列是分层依据。train_proportion训练集抽取比例,默认70%....