概述
之前,我一直使用R语言实现随机森林等机器学习模型,在遇到报错情况时想和身边朋友交流,发现一个很尴尬的事情,擅长使用R的朋友不懂机器学习,而擅长机器学习的只用Python。所以,掌握Python来实现机器学习,是与同行顺畅交流的前提,现在开始总结用Python实现随机森林。
数据来源:波士顿房价数据boston
操作流程如下:
首先,载入boston数据,并取出数据矩阵X与响应变量y,
Boston = load_boston()
X = pd.DataFrame(Boston.data, columns = Boston.feature_names)
y = Boston.target
其次,随机抽取30%的数据作为测试集
X_train, X_test, y_train,y_test = train_test_split(
X,y,test_size=0.3, random_state=1)
接着,使用sklearn的BaggingRegression类,进行袋袋法估计:
model = BaggingRegressor(base_estimator=
DecisionTreeRegressor(random_state=123),
n_estimators=500, oob_score=True, random_state=0)
其中,参数“base…123”表示以回归树作为基学习器,参数“n_…500”表示共有500课树,而参数“oob…True”表示保留OOB的袋外估计结果,
最后
以上就是天真发箍为你收集整理的用Python实现机器学习:随机森林的全部内容,希望文章能够帮你解决用Python实现机器学习:随机森林所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复