【目录】七周成为数据分析师 第一周数据分析师思维第二周业务分析第三周Excel分析第四周数据可视化第五周MySQL数据库第六周统计学第七周Python第八周三大作业转载于:https://www.cnblogs.com/hankleo/p/9973292.html... 数据库 2024-06-23 44 点赞 0 评论 66 浏览
如何判断强化学习算法是否收敛 如何判断强化学习算法是否收敛1. 策略熵对于随机性策略(PPO等)可以用策略熵来表示策略是否“确定”。在训练过程中随着策略提升,策略变得越来越确定,此时熵应该是随着逐渐降低的,熵曲线趋于平缓。2. loss指标(网络收敛好坏)这是DL中的直观指标,虽然不能直接用在DRL来说明策略好坏,但loss是在一直下降还是已经趋于平缓了,可以一定程度上说明网络模型的学习程度,看模型是“学会了”还是“学废了”,趋于平缓可能就是已经训练差不多了,当然“训练差不多”不代表“策略最优”,有些可能loss还在掉,但 RL 2023-11-28 44 点赞 0 评论 66 浏览
Hive常用命令总结 1.建表#建表(默认是内部表)create table trade_detail(id bigint, account string, income double, expenses double, time string) row format delimited fields terminated by '\t';#建分区表#普通表和分区表区别:有大量数据增加的需要建分区表cr Linux_hadoop 2023-10-04 47 点赞 0 评论 71 浏览
pip报错:Cannot open D:\Anaconda3\Scripts\pip-script.py pip报错:Cannot open D:\Anaconda3\Scripts\pip-script.py 工具 2023-09-09 52 点赞 0 评论 78 浏览