背后小丸子

文章
5
资源
0
加入时间
2年10月21天

为什么要进行数据分箱?(转)

一般在建立分类模型时,需要对连续变量离散化,特征离散化后,模型会更稳定,降低了模型过拟合的风险。比如在建立申请评分卡模型时用logsitic作为基模型就需要对连续变量进行离散化,离散化通常采用分箱法。分箱的重要性及其优势离散特征的增加和减少都很容易,易于模型的快速迭代;稀疏向量内积乘法运算速度快,计算结果方便存储,容易扩展;离散化后的特征对异常数据有很强的鲁棒性:比如一个...

netty-websocket-spring-boot-starter基于netty的轻量级的高性能socket服务器

netty老生常谈,干啥的?一个网络通信协议框架,自己可以各种自定义,具体的,网上一捞一大把。两大特性:NIO和零拷贝。netty-websocket-spring-boot-starter版本约定:0.9.5基于此版演绎的,因为每个版本有轻微区别官方文档:直达网站https://gitee.com/Yeauty/netty-websocket-spring-boot-starter这是个开源的框架。通过它,我们可以像spring-boot-starter-websocket一样使用注解进行开