阿里云栖大会发布新一代人工智能模型 技术指标全球领先
9月24日 杭州电
在今日开幕的2025云栖大会上,阿里巴巴集团正式发布了其最新研发的Qwen3-Max人工智能模型。根据官方公布的数据显示,该模型在多项国际权威测试中表现优异,技术指标已进入全球领先行列。
据了解,Qwen3-Max分为指令优化和推理增强两个版本。目前其预览版本已在国际知名的人工智能基准测试平台Chatbot Arena中排名第三,正式版本有望实现进一步突破。
作为通义千问系列的最新旗舰产品,Qwen3-Max采用了36万亿token的超大规模预训练数据,模型参数量突破万亿级别。特别值得注意的是,该模型在编程代码生成和智能工具调用方面展现出显著优势。
在SWE-Bench Verified测试中,Qwen3-Max指令版本以69.6分的成绩位居全球前列;而在Tau2-Bench工具调用能力测试中,该模型更是以74.8分的成绩超越了多个国际知名产品。
Qwen3-Max模型在多项测试中表现优异
特别值得关注的是,Qwen3-Max的推理增强版本在数学推理能力测试中取得突破性进展。在AIME 25和HMMT两项专业数学测试中均获得满分,这在国内人工智能领域尚属首次。
技术专家介绍,该模型之所以能在数学推理方面取得优异成绩,主要得益于其创新的工具调用机制和并行计算技术。模型能够通过编写代码来求解数学问题,同时优化的计算资源分配也显著提升了整体表现。
Qwen3-Max在数学推理测试中获得满分
目前,通义千问系列已经形成了从基础版到高端版的完整产品矩阵,包含300余个不同规模的模型,能够满足各类应用场景的需求。
即日起,用户可以通过通义千问官方平台免费体验Qwen3-Max模型,企业用户也可以通过阿里云服务平台获取专业的API接口服务。
(举报)
- 相关推荐
-
荐AI日报:生数科技推出Vidu Q2;火山引擎推出炉米Lumi;通义千问开源300+模型
本文汇总了近期AI领域多项重要进展:生数科技推出Vidu Q2模型,显著提升视频生成中细微表情的真实感;火山引擎发布炉米Lumi平台,支持视觉模型LoRA微调以定制独特风格;阿里云通义千问开源超300个模型,下载量突破6亿次;百度开源多模态视觉理解模型Qianfan-VL,适配不同场景需求;微软在Copilot中引入Anthropic模型,拓展AI助手功能;OpenAI计划在美国新建五个数据中心以加速Stargate项目;英伟达开源Audio2Face模型,提升实时面部动画生成效果;Meta发布具备沙箱推演能力的32B代码世界模型CWM,优化代码调试效率。这些动态展示了AI技术在视觉、多模态、开源生态及硬件支持等方面的快速迭代与创新突破。
-
2025 云栖大会|云通信+AI:释放通信新动能
2025年9月25日,阿里云成功举办“云栖大会云通信分论坛”,聚焦大模型在云通信中的创新应用与全球化实践。论坛汇聚Meta、雨果跨境等生态伙伴,探讨行业趋势,剖析技术机遇与挑战。阿里云发布Chat App AI助理和智能联络中心2.0,展示智能化探索成果,强调合规化与智能化并重,推动通信服务从基础功能向个性化、自动化升级。通过AI与消息引擎结合,助力企业打通公域到私域的全链路增长,实现高效全球化运营与本地化深耕。
-
中科天玑成2025云栖大会焦点,凭数据能力出圈!
2025云栖大会于9月24-26日在杭州召开,以“云智一体·碳硅共生”为主题,聚焦AI技术演进与产业落地。大会汇聚全球2000多位嘉宾,围绕Agentic AI、Physical AI等前沿话题展开探讨。中科天瞳作为数据智能领军企业,展示了数据引擎、智能体等核心产品,通过现场演示验证其技术实力,吸引阿里云高层及行业代表关注。展位互动热烈,体现了中科天瞳在构建“数据到智能”闭环解决方案上的行业引领地位,为千行百业数字化注入新动能。
-
荐AI日报:阿里推多模态模型Qwen3-Omni;谷歌推出AP2协议;百度推出Qianfan-VL 模型
本期AI日报聚焦多领域技术突破:阿里云推出全球首个全模态AI模型Qwen3-Omni,支持文本、图像、音频和视频统一处理;百度发布多尺寸视觉理解模型Qianfan-VL,优化企业级应用。苹果扩展Image Playground平台,引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议,推动AI支付安全创新。钉钉上线AI表格助手,支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型,性能显著提升。Kimi推出Agent会员服务,智元机器人开源全球首个通用具身智能模型GO-1,降低技术门槛促进行业创新。
-
云栖大会智舱黑科技:全球首个全模态端侧大模型解决方案,斑马智行首发
9月24日,2025云栖大会在杭州开幕,主题为“云智一体·碳硅共生”,汇聚全球50多国2000余位嘉宾探讨AI、云计算与产业应用趋势。阿里云发布7款通义大模型,其中Qwen3-Omni作为行业首个端到端全模态AI大模型,在36项基准测试中实现22项SOTA,性能全面突破。大会聚焦多模态技术,斑马智行宣布率先接入Qwen3-Omni,并与阿里云、高通联合推出端到端全模态端侧大模型方案Auto+Omni,具备主动智能、断网可用、隐私无忧三大特点,推动汽车智能座舱从指令交互向Always-on主动服务升级。首批搭载方案车型将于2026年量产,标志着汽车智能化迈入“自主行动”新阶段。大会将持续至26日,预计更多创新技术将亮相。
-
荐AI日报:国产版Nano Banana?即梦图片4.0发布;阿里巴巴发布 Qwen3-Max-Preview;上海重磅发布AI广告扶持政策
AI日报栏目聚焦人工智能领域最新动态。主要内容包括:即梦图集4.0发布,新增文生图、图像编辑等功能;阿里巴巴推出超万亿参数语言模型Qwen3-Max-Preview;小米AI眼镜上线支付宝“看一看”支付功能;微软开源14B参数模型rStar2-Agent在数学推理领域表现突出;MiniMax启动股权激励计划覆盖核心员工;谷歌明确Gemini使用限制,免费用户每日最多5次提示;上海发布AI广告扶持政策,最高补贴500万元。这些进展展示了AI技术在图像处理、语言模型、智能支付等领域的创新应用。
-
雷军:小米17 Pro Max很多门店已经缺货
小米17系列于9月27日正式开售,仅5分钟便刷新2025年国产手机全价位段新机首销纪录。其中,17 Pro+Max表现尤为抢眼,打破今年国产手机首销全天销量与销售额纪录,并在系列中占据超50%销量份额。小米创始人雷军透露该机型已缺货,推荐用户尝试17 Pro。全系搭载第五代骁龙8至尊版处理器,性能强劲。17系列针对不同用户需求:17适合注重手感的小屏用户,17 Pro主打旗舰体验,17 Pro+Max专为追求极致科技的大屏用户打造。价格方面,17起售价4499元,17 Pro起售价4999元,17 Pro+Max起售价5999元,市场反响热烈。
-
性能超越GPT-4o及Qwen2.5-VL,百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face热度第一
百度发布超轻量级文字识别模型PP-OCRv5,仅0.07B参数却实现媲美700亿参数大模型的OCR精度。在多项测试中超越GPT-4o等通用视觉大模型,尤其在文本定位和边界框精度上表现优异。该模型支持5种文字类型识别,适用于教育、医疗、法律等多行业数字化需求,累计下载量超900万,是GitHub上唯一Star数超5万的中国OCR项目。
-
荐AI日报:阿里云开源通义DeepResearch;夸克推医师考试大模型
本期AI日报聚焦多项前沿动态:阿里云开源轻量级AI代理DeepResearch,性能媲美OpenAI;夸克推出国内首个全阶段医师考试大模型测试集;微软Copilot将上线类ChatGPT记忆管理功能;迪士尼等巨头起诉MiniMax侵犯版权;OpenAI提升ChatGPT搜索准确性;Notion推出个性化AI助手;谷歌发布更小巧高效的时间序列预测模型TimesFM-2.5;Figma推出AI设计功能简化创作流程。整体展现AI技术在开源、医疗、�
-
1分43秒384!小米YU7 Max成为浙赛100万以内最速SUV
9月25日,雷军发布小米汽车2025年度演讲,重点介绍家用SUV小米YU7。该车型运动性能突出,YU7 Max在浙江国际赛车场圈速达1分43秒384,超越兰博基尼Urus,位列赛道总榜第62名、SUV细分榜单第5名,成为百万内最快SUV。测试使用原厂轮胎,若换装半热熔胎有望进一步提升。此外,YU7续航表现优异,满电行驶里程达784公里,高速工况下为652公里,在25万级别纯电SUV中属于顶尖水平。小米汽车正挑战纽北赛道,旨在验证全球顶级性能。
今日大家都在搜的词:
- 人生重开模拟器
- 显卡天梯图
- 国内云服务器哪家好
- 高通骁龙处理器排名
- 手机CPU天梯图
- 单反相机天梯图
- 安兔兔手机跑分排行榜
- 笔记本电脑排行榜
发表评论取消回复