
跟着Agent时间到来,大模子将在本质寰宇判辨更大作用。豆包2.0(Doubao-Seed-2.0)围绕大边界分娩环境下的使用需求作念了系统性优化,依托高效推理、多模态连气儿与复杂指示实行才调,更好地完成真正寰宇复杂任务。
豆包2.0系列包含Pro、Lite、Mini三款通用Agent模子和Code模子,活泼适配各样业务场景:
豆包2.0 Pro面向深度推理与长链路任求实行场景,全濒临标GPT 5.2与Gemini 3 Pro;
2.0 Lite兼顾性能与资本,抽象才调超越上一代主力模子豆包1.8;
2.0 Mini面向低时延、高并发与资本敏锐场景;
Code版(Doubao-Seed-2.0-Code)专为编程场景打造,与TRAE纠合使用驱散更佳。
当今,豆包2.0 Pro已在豆包App、电脑端和网页版上线,用户聘用「大众」格式即可对话体验;豆包2.0 Code接入了AI编程居品TRAE;面向企业和建树者,火山引擎也已上线豆包2.0系列模子API管事。
多模态连气儿才调全面升级,多数基准达 SOTA 水平
豆包 2.0 全面升级了多模态才调,在各样视觉连气儿任务上均达到寰宇顶尖水平,视觉推理、感知才调、空间推理与长高下文连气儿才调判辨尤为杰出,豆包 2.0 Pro 在大多数干系基准测试中取得最高分。

濒临动态场景,豆包 2.0 强化了对时分序列与贯通感知的连气儿才调,在 TVBench 等关键测评中处于最初位置,且在 EgoTempo 基准上高出了东说念主类分数,标明它对“变化、动作、节拍”这类信息的捕捉更为褂讪,在工程侧可用性更高。
长视频场景中,豆包 2.0 在大多评测上超越了其他顶尖模子,且在多个流式及时问答视频基准测试中判辨优异,能动作 AI 助手完成及时视频流分析、环境感知、主动纠错与情怀奉陪,终了从被迫问答到主动领导的交互升级,可诳骗于健身、穿搭等奉陪场景。
{jz:field.toptypename/}LLM 与 Agent 判辨大幅强化,长程任求实行才调进步
进步长程任求实行才调,需要丰富的真正寰宇常识。通过加强长尾边界常识,乐鱼体育官网豆包 2.0 Pro 在 SuperGPQA 上分数高出 GPT 5.2,并在 HealthBench 上拿到第又名,在科学边界的举座收获与 Gemini 3 Pro 和 GPT 5.2 相称。
在推理和 Agent 才调评测中,豆包 2.0 Pro 在 IMO、CMO 数学奥赛和 ICPC 编程竞赛中赢得金牌收获,也超越了 Gemini 3 Pro 在 Putnam Bench 上的判辨,展现了建壮的数学和推理才调。在 HLE-text(东说念主类的终末检修)上,豆包 2.0 Pro 取得最高分 54.2 分,在器用调用和指示罢免测试中也有出色判辨。

豆包 2.0 还进一步缩小了推理资本。其模子驱散与业界顶尖大模子相称,但 token 订价缩小了约一个数目级。在本质寰宇的复杂任务中,由于大边界推理与长链路生成将蓦地遍及 token,这一资本上风将变得更为关键。
Code 模子进步建树服从,快速搭建复杂诳骗
豆包 2.0 Code 是基于 2.0 基座模子,针对编程场景进行优化的版块。其强化了代码库解读才调,还进步了诳骗生成才调。此外,豆包 2.0 Code 还增强了模子在 Agent 责任流中的纠错才调。
该模子已上线 TRAE 中国版动作内置模子,援手图片连气儿和推理。
以建树一个「TRAE 春节小镇 · 马年庙会」互动样貌为例。这是一个比拟复杂的场景,可是通过 TRAE+ 豆包 2.0 Code,只需要 1 轮教唆词,就能构建出基本的架构和场景,再经由几次调试,所有 5 轮教唆词,就可完成这个作品。
字节高出官方称,豆包大模子 2.0 系列的更新,是面向本质寰宇复杂任务的新来源。曩昔,团队将连接面向真正场景迭代模子,抑遏探索智能上限。
