月之暗面推出全新SOTA模型k1.5:可同时处理不同模态信息 据报道,月之暗面公司正式宣布推出其全新的SOTA模型k1.5多模态思考模型,在多模态推理和通用推理能力上都实现了突破。k1.5多模态思考模型具备多模态推理能力,能够同时处理 多模态模型 2025年02月10日 170 点赞 2 评论 257 浏览
Kimi硬刚多模态满血版o1,首曝训练细节!强化学习scaling新范式诞生 【新智元导读】来了来了,月之暗面首个「满血版o1」来了!这是除OpenAI之外,首次有多模态模型在数学和代码能力上达到了满血版o1的水平。AI大神Karpathy曾说过,「英文是最热 多模态模型 2025年02月10日 144 点赞 2 评论 218 浏览
多模态模型学会打扑克:表现超越GPT-4v,全新强化学习框架是关键 只用强化学习来微调,无需人类反馈,就能让多模态大模型学会做决策!这种方法得到的模型,已经学会了看图玩扑克、算“12点”等任务,表现甚至超越了GPT-4v。这是来自UC伯克利 多模态模型 2024年06月25日 172 点赞 2 评论 260 浏览
多模态模型再进化,已学会看图玩扑克、算“12点” 在科技领域,多模态模型的决策能力一直是研究的热点。UC伯克利等高校的研究团队提出了一种名为RL4VLM的全新强化学习框架,成功地提升了多模态大模型在决策任务上的表现。这 多模态模型 2024年06月25日 148 点赞 2 评论 224 浏览