GPT-4整顿学术圈!撤稿预测与人类95%一致 中国人民大学和浙江大学的研究团队进行了一项有趣的研究,他们发现GPT-4在预测学术论文撤稿方面的能力与人类审稿人有着惊人的相似性,准确度高达95%。这项研究不仅展示了大 GPT-4 2024年05月04日 266 点赞 4 评论 403 浏览
开源大模型Llama 3王者归来!最大底牌4000亿参数,性能直逼GPT-4 扎克伯格:「有了Llama3,全世界就能拥有最智能的AI。」ChatGPT拉开了大模型竞赛的序幕,Meta似乎要后来居上了。也许只有OpenAI的GPT-5才能压下开源模型了。 GPT-4 2024年05月01日 151 点赞 2 评论 228 浏览
发布几小时,微软秒删媲美GPT-4开源大模型!竟因忘记投毒测试 【新智元导读】前段时间,微软公布并开源了最新一代大模型WizardLM-2,号称性能堪比GPT-4。还未上线一天,模型权重和公告全被删除了,原因竟是......上周,微软空降了一个堪 GPT-4 2024年04月28日 184 点赞 2 评论 278 浏览
研究显示,GPT-4可以自主利用安全漏洞,具备攻击性 每周至少有一次,生成式人工智能都会给我们带来新的恐惧。虽然我们仍在焦急地等待OpenAI发布的下一个大型语言模型,但与此同时,GPT-4似乎比你想象的更具备能力。”他们还指 GPT-4 2024年04月28日 136 点赞 2 评论 206 浏览
击败GPT-4的那群人 很少有人注意到Claude3兼顾安全的努力以及背后深刻动机。还有他们客户群体的特点。然后另一家公司会说,不,我们的模型是最安全的。 GPT-4 2024年04月26日 156 点赞 2 评论 236 浏览
GPT-4时代已过?全球网友实测Claude 3,只有震撼 性能比GPT-4强很多。大模型的纯文本方向,已经卷到头了?昨晚,OpenAI最大的竞争对手Anthropic发布了新一代AI大模型系列——Claude3。随着新系列模型的进一步优化和应用,我 GPT-4 2024年04月26日 166 点赞 2 评论 251 浏览
全球大模型易主GPT-4被超越:Claude 3可接受超过100万Tokens输入 近Anthropic刚刚发布了震撼消息:全新Claude3家族登场!最强版本Claude3Opus在推理、数学、编码、多语言理解和视觉等领域已经超越了包括GPT-4在内的所有大模型,展现出接近 GPT-4 2024年04月24日 128 点赞 1 评论 193 浏览
现金流耗尽之前,OpenAI能否做出GPT-5?Altman暴露7万亿帝国野心,但投资人犹豫了 就在刚刚,GPT-4被从大模型铁王座上扯下来了!OpenAI最强竞对Anthropic发布的Claude3系列模型,已经实现了对GPT-4的全面超越。网友表示:GPT-4时代已经终结,OpenAI可以请出Q GPT-4 2024年04月23日 177 点赞 2 评论 268 浏览
全球大模型易主!GPT-4被超越:Claude 3理解能力已接近人类 有明确伦理底线 这是GPT-4发布之后,第一次在纸面上被完全碾压。OpenAI最强竞争选手Anthropic发布了旗下最新大模型家族Claude3。还有人在线点名Altman,可以发布GPT-5了。 GPT-4 2024年04月23日 126 点赞 1 评论 190 浏览
估值40亿的Pi大更新:性能接近 GPT-4,日均使用时长已经超过 Instagram 当OepnAI和马斯克连日互杠、Google因文化偏见麻烦缠身、号称抢走GPT-4王位的Claude3全力瞄准企业级部署的时候,在另一个角落,致力于「为每个人开发服务型AI」的人工智能初 GPT-4 2024年04月23日 169 点赞 2 评论 256 浏览
谷歌推出”自我发现“框架,极大增强GPT-4等大模型推理能力 随着ChatGPT的出现,大语言模型在生成连贯文本和遵循指令方面获得了巨大技术突破。然后在推理和解决复杂内容方面,面临内容不准确、安全等难题。每次只需要一个查询获得相似 GPT-4 2024年04月15日 198 点赞 3 评论 300 浏览
GPT-4“荣升”AI顶会同行评审专家?斯坦福研究:ICLR/NeurIPS等竟有16.9%评审是ChatGPT生成 斯坦福的一篇案例研究表示,提交给AI会议的同行评审文本中,有6.5%到16.9%可能是由LLM大幅修改的这些趋势可能在个体级别上难以察觉。LLM在飞速进步的同时,人类也越来越难以 GPT-4 2024年04月14日 130 点赞 1 评论 196 浏览
华人开源「AI 程序员」炸场,让 GPT-4 自己修 Bug! 自从“AI程序员”Devin问世之后,近期的一大趋势就是程序员们争先恐后地要让自己失业,试图抢先造出比自己更强大的程序员。普林斯顿大学为软件工程界迎来了一位新星——SWE GPT-4 2024年04月11日 121 点赞 1 评论 183 浏览
大模型实时打《街霸》捉对PK,GPT-4居然不敌3.5,新型Benchmark火了 让大模型直接操纵格斗游戏《街霸》里的角色,捉对PK,谁更能打?GitHub上一种你没有见过的船新Benchmark火了。与llmsys大模型竞技场中,两个大模型分别输出答案,再由人类评 GPT-4 2024年04月11日 163 点赞 2 评论 246 浏览
研究发现:GPT-4在临床推理中表现优于医生,但也更经常出错 在一项新研究中,美国贝斯以色列医疗中心的科学家们将一种大型语言模型与人类医生进行了临床推理能力的比较。研究人员使用了修订后的IDEA评分,这是一种常用工具,用于评估 GPT-4 2024年04月10日 160 点赞 2 评论 242 浏览