
2026年6月下旬,国产大模型赛道迎来了一次罕见的集中爆发。字节跳动在火山引擎FORCE大会上推出豆包2.1 Pro,编程能力追平Claude Opus 4.7;智谱AI的GLM-5.2在代码测评中跻身全球前列,港股市值突破万亿港元;Seedance 2.5将AI视频生成带入30秒时代;阿里达摩院的胃癌筛查AI模型则将大模型的能力边界拓展到了基层医疗。四条战线同时推进,资本市场热度高涨——国产大模型正在从”追赶者”变为”领跑者”。
核心发现:本次集中更新呈现出三个趋势——国产大模型在核心能力上已与国际顶尖模型持平甚至超越;应用场景从通用AI加速向垂直领域渗透;成本持续下降使得大规模商业化成为可能。
一、豆包2.1 Pro:编程与Agent能力的质变
6月23日,火山引擎在北京举办2026夏季FORCE原动力大会,集中发布豆包大模型2.1系列,包括豆包2.1 Pro和豆包2.1 Lite两个版本。这是字节跳动在大模型领域最重要的一次版本更新。
1.1 编程能力追平Claude Opus 4.7
豆包2.1 Pro在Terminal Bench 2.1、SWE-Pro等权威代码评测中进入全球第一梯队,多项评测成绩稳定超越Claude Opus 4.6,与Claude Opus 4.7处于可比区间。火山引擎总裁谭待在会上表示,全球第一个跨越Coding与Agent领域质变点的模型是Anthropic的Claude Opus 4.6,而豆包2.1 Pro是第二个实现这一跨越的模型。
在实际编程场景中,豆包2.1 Pro能够独立完成过去需要不同工程师分段接手、反复协调才能完成的复杂任务——从需求理解到代码编写、从调试修复到测试验证,一个模型即可端到端闭环交付。
1.2 多智能体协同:数百个Agent同步协作
豆包2.1 Pro专为自动化Swarm(群体智能/多Agent编排)工作流优化,支持端到端闭环交付与复杂任务编排。这意味着它可以协调数百个AI智能体同步协作,每个Agent负责不同的子任务,共同完成一个大型工程。
对于企业级应用,这直接改变了AI的部署方式——不再是”一个模型处理一个任务”,而是”一群模型协同处理一个项目”。
1.3 成本暴降80%,日均调用量180万亿Token
豆包2.1 Pro综合使用成本比国际竞品低近80%。面向高频场景的豆包2.1 Lite定价更低。截至2026年6月,豆包大模型日均Token调用量已突破180万亿,过去一年增长超10倍。IDC数据显示,在中国公有云MaaS服务市场,火山引擎以49%的份额位居第一。
关键数据:豆包2.1 Pro综合成本比国际竞品低近80%,编程能力与Claude Opus 4.7持平,多Agent编排支持数百个智能体协同。180万亿日均Token调用量,意味着国产大模型已经在规模上建立了绝对优势。
1.4 打车生活服务同步上线
与模型更新同步,豆包上线了打车等生活服务功能。这标志着豆包从”AI对话助手”向”AI生活平台”的转型——用户可以直接在豆包中完成打车、订餐、查询等日常操作,AI不再只是”回答问题”,而是”帮你做事”。
二、智谱GLM-5.2:代码能力全球第二,市值突破万亿港元
如果说豆包2.1 Pro代表了字节跳动的AI野心,那么智谱GLM-5.2则代表了国产大模型在资本市场的最强音。
2.1 代码能力:全球可用模型排名第一
6月17日,智谱上线并开源新一代旗舰大模型GLM-5.2,主攻”长程任务”——让AI不再只做即时问答,而能像人一样连续工作数小时、自主跑完一个完整的大型工程。
在全球百万用户参与盲测的Code Arena编程能力测评中,GLM-5.2取得全球可用模型第一的表现,排名全球第2,仅次于Claude Fable 5(High),高于Claude Opus 4.7(Thinking)和Claude Opus 4.8(Thinking)。在Terminal-Bench 2.1等Agent代码评测中,GLM-5.2保持开源SOTA,与Claude Opus 4.8处于可比区间。
| 模型 | Code Arena排名 | 开源 | 推理速度 | 调用成本 |
|---|---|---|---|---|
| GLM-5.2 | 全球第2 | 是 | 300 tokens/s | 海外顶尖模型1/10 |
| Claude Fable 5 (High) | 全球第1 | 否 | – | 高 |
| Claude Opus 4.8 | 全球第3 | 否 | – | 高 |
| 豆包2.1 Pro | 第一梯队 | 否 | – | 低(比国际低80%) |
2.2 港股市值突破万亿港元,上市半年涨18倍
6月22日港股收盘,智谱(2513.HK)股价收于2410港元,总市值一举冲破1.07万亿港元关口,成为港股历史上第一家迈过万亿门槛的AI大模型公司,也是目前国内仅次于腾讯、阿里、字节的第四大科技市值主体。
智谱于2026年1月上市,发行价约130港元。短短5个多月,股价涨幅超过18倍。五天内狂增5800亿港元市值,资本市场的狂热程度可见一斑。
风险提示:智谱股价在突破万亿港元后,6月23日盘中一度跌超17%。高市值对应的是高预期,投资者需理性看待国产大模型的商业化进度与盈利能力。
三、Seedance 2.5:AI视频生成的30秒革命
与豆包2.1 Pro同步发布的,还有字节跳动的视频生成模型Seedance 2.5。这是AI视频生成赛道的一次规格跃迁。
3.1 核心升级:30秒直出 + 50个参考素材
Seedance 2.5支持单段原生30秒视频直出,可同时导入50个全模态参考素材(图像+视频+音频),实现可控性更强、精细化程度更高的视频生成与编辑。前代Seedance 2.0已同步升级,具备原生4K视频生成能力。
在推理成本方面,Seedance 2.5实现了大幅降低。结合豆包2.1 Pro在编程和多模态能力上的提升,字节跳动正在构建一个从”文本理解”到”视频生成”到”音频同步”的全链路AI内容生产体系。
3.2 短视频与数字人行业适配增强
Seedance 2.5在短视频和数字人场景的适配性显著增强。30秒的时长足以承载一个完整的短视频内容,50个参考素材的容量使得角色一致性和品牌元素保持成为可能。对于短视频创作者、电商直播、数字人应用等行业,这直接降低了AI视频的生产门槛和成本。
关键发现:Seedance 2.5的30秒时长打破了AI视频”只能做素材”的局限,使其首次具备了”做成品”的能力。配合推理成本的大幅降低,AI视频生成正在从”尝鲜玩具”走向”生产工具”。
四、阿里达摩院:AI胃癌筛查落地基层医疗
当所有人都在关注大模型的编程能力和视频生成时,阿里达摩院选择了一条不同的路——将AI的能力延伸到了拯救生命的领域。
4.1 全球首个平扫CT胃癌筛查AI模型
阿里达摩院联合浙江省肿瘤医院推出了DAMO GRAPE——全球首个基于平扫CT识别早期胃癌的AI模型。该模型突破了传统影像学的限制,通过深度学习技术分析非增强CT影像,能够高效筛查出传统方法难以发现的早期胃癌病灶。
更值得关注的是,达摩院的多癌筛查AI已从单一癌种扩展至多癌联合检测——通过单张普通CT平扫,同步筛查胰腺癌、胃癌、结直肠癌、肝癌、食道癌五种恶性肿瘤,顺带筛查冠脉钙化、肺结节、脂肪肝、骨质疏松等多种慢性隐匿疾病。
4.2 落地基层医疗:一次扫描,多病预警
传统防癌检查需要分项拍片、多次缴费,耗时长、开销大,且受医师经验与肉眼局限容易漏诊早期病灶。达摩院的AI筛查方案依托单次普通CT平扫,借助AI深度学习算法全域解析影像,一次扫描实现多病同步预警。
目前,该技术已进入50家医院试点阶段,并已为全球10个国家和地区的医疗机构提供超过200次AI辅助筛查服务。此前,该项技术已获联合国AI for Good创新案例奖,并被世界卫生组织(WHO)数字健康合作中心选中合作,向发展中国家和地区推广。
意义:大模型的价值不仅在于写代码和生成视频。阿里达摩院的胃癌筛查AI证明了,当AI技术与医疗场景深度结合时,它能够解决的是”生死攸关”的问题。一次CT扫描、五种癌症同步筛查、成本极低、适合基层推广——这才是AI技术最应该被使用的方式。
五、国产大模型的集体跃迁
将这四条战线放在一起看,一个更宏大的图景浮出水面:
| 维度 | 豆包2.1 Pro | GLM-5.2 | Seedance 2.5 | 达摩院胃癌AI |
|---|---|---|---|---|
| 核心能力 | 编程+多Agent | 长程代码任务 | 30秒视频生成 | CT影像多癌筛查 |
| 对标对象 | Claude Opus 4.7 | Claude Fable 5 | HappyHorse/Kling | 传统影像学 |
| 成本优势 | 低80% | 1/10 | 大幅降低 | 极低(平扫CT) |
| 应用场景 | 企业开发 | 开源社区 | 短视频/数字人 | 基层医疗 |
| 市场信号 | 日均180万亿Token | 市值万亿港元 | 30秒质变 | 50家医院落地 |
三个关键趋势
- 能力持平甚至超越:在编程、代码、视频生成等核心维度上,国产大模型已经与国际顶尖模型处于同一水平线,部分指标甚至领先
- 垂直领域加速渗透:从通用AI到编程开发、视频创作、医疗诊断,国产大模型正在快速进入各个垂直行业
- 成本优势建立壁垒:豆包2.1 Pro成本低80%、GLM-5.2调用成本仅海外1/10、达摩院用普通CT替代高端设备——成本优势正在成为国产大模型的核心竞争力
“2026年6月这一周,可能是国产大模型发展史上最重要的一个节点。不是因为某一个模型的突破,而是因为四个不同赛道的同步跃迁——编程、视频、医疗、多Agent——共同证明了国产AI已经不再是追赶者。”
六、对行业和用户意味着什么
对于不同群体,这次集中更新带来的影响各不相同:
- 对开发者:豆包2.1 Pro和GLM-5.2的出现意味着国产AI编程工具已经可以替代昂贵的海外方案,且成本更低、中文支持更好
- 对内容创作者:Seedance 2.5的30秒直出和成本下降,使得AI视频从”实验性工具”变成了”日常生产力”
- 对医疗行业:达摩院的胃癌筛查AI为基层医疗提供了一种低成本、高效率的筛查方案,有望大幅降低胃癌的漏诊率
- 对投资者:智谱万亿港元市值的背后,是对国产大模型商业化前景的巨大预期,但也需要警惕估值泡沫
理性看待:能力追平不等于生态追平。在开发者工具链、企业级服务、国际化部署等方面,国产大模型仍有差距。但这次集中更新至少证明了一件事——差距正在以肉眼可见的速度缩小。
写在最后:从豆包2.1 Pro的编程质变,到GLM-5.2的万亿市值,到Seedance 2.5的30秒视频,再到达摩院胃癌筛查AI的基层落地——2026年6月的这一波集中更新,是国产大模型从”技术追赶”到”生态构建”的转折点。技术能力已经到位,接下来的战场是:谁能更快地将技术转化为真实的生产力,谁能更低成本地服务更多用户,谁能率先在垂直领域建立不可替代的护城河。
延伸阅读
- Seedance 2.5深度测评:字节跳动豆包视频生成模型的30秒革命 — 本文概述了Seedance 2.5的核心升级,如需了解其在画质、运动连贯性、色彩准确度等方面的详细测评,可参阅此文
- HappyHorse 1.1深度测评:阿里AI视频生成模型的全面升级 — Seedance 2.5在AI视频赛道的核心竞争对手,本文从技术架构到实测表现进行了全面对比
- Token套餐选购指南:横向对比各家大模型API定价 — 豆包2.1 Pro成本低80%,本文系统对比了各家大模型的Token定价策略
- TRAE Work + WorkBuddy + QoderWork实战指南 — 豆包2.1 Pro的多Agent协同能力如何落地到实际工作流?本文提供了完整的实操方案
