Llama7B

首页

文章中心

Llama7B

【新智元导读】Meta、UC伯克利、NYU共同提出元奖励语言模型，给「超级对齐」指条明路:让AI自己当裁判，自我改进对齐，效果秒杀自我奖励模型。LLM对数据的大量消耗，不仅体现

Llama7B 2024年08月11日 232 点赞 3 评论 351 浏览