大模型三箭齐发、芯片岗位低调招聘,字节跳动不只想赢下AI“春节档”

花花2026-02-20债务科普217

春节试炼场已然铺开。Agent(智能体)时代,正在加速走来。

豆包2.0的升级路径,延续字节一贯的技术思路。

火山引擎总裁谭待曾在2025年12月发布豆包1.8时接受包括《每日经济新闻》在内的媒体采访时表示,多模态能力的提升是模型成为复杂Agent的关键。“多模态其实代表着模型的应用进入更深的领域。”

此番豆包2.0的突破,正是沿着这一方向展开。

本次发布的豆包大模型2.0提供了多种选择:包含Pro、Lite、Mini三款多模态通用模型,以及面向开发者的Code模型。其中,旗舰款豆包2.0 Pro定位于复杂深度推理、Agent等高难度任务。

在推理和Agent能力评测中,豆包2.0 Pro在IMO、CMO数学奥赛和ICPC编程竞赛中获得金牌成绩,超越了Gemini 3 Pro在Putnam基准测试上的表现。此外,在HLE-text(人类的最后考试)中,豆包2.0 Pro取得最高分54.2分。

据官方介绍,豆包2.0还重点强化了指令遵循能力,可保持较强的一致性与可控性,作为Agent模型能够在长链路、多步骤任务中严格按约束条件执行。对此,《每日经济新闻》记者对豆包大模型2.0 Pro(专家版)进行了实测。

测试由DeepSeek设计,聚焦多轮复杂指令遵循与稳定性。记者以“请帮我规划一个为期3天的北京旅游行程,预算3000元,独自一人”为初始条件,并在对话过程中不断加入新约束,观察模型是否会遗忘或混淆信息。

面对初始条件,豆包2.0 Pro经过不到2分钟思考,便给出了一份信息完备的规划,具体到每个景点的预约方式和游玩路线。由于未指定具体日期,模型自动按旺季价格标准进行了预算测算。

记者又先后补充了“第一天晚餐换成北京评分高的湘菜或者川菜”“带上母亲出游,预算调整为5000元,住宿需要更换为双床房”“第三天不去长城,换个轻松一点的地方逛”等多个条件。

在保持行程框架不变的前提下,豆包2.0 Pro在收到“带上长辈”的信息后,主动调整了景点内的游览路线,增加了游船、园内电动车等适老选项;在满足第一晚吃辣需求的同时,还核验了备选餐厅是否有适合长辈的食物。

多模态理解是此次升级的另一重头戏。从测试成绩来看,在空间理解MMSIBench、运动理解MotionBench、视频理解VideoMME等测评集上,豆包2.0 Pro均略胜Gemini 3 Pro一筹;在图表理解CharXiv-RQ 上能力也再次大幅提升。

而在实际应用能力上,豆包2.0亦有所提升。据字节官方介绍,面对动态场景,豆包2.0强化了对时间序列与运动感知的理解能力,对“变化、动作、节奏”等信息的捕捉更为稳定,工程侧可用性更高。

在长视频场景中,豆包2.0可作为AI助手完成实时视频流分析、环境感知、主动纠错与情感陪伴,实现从被动问答到主动指导的交互升级,可应用于健身、穿搭等陪伴场景。

价格方面,豆包2.0 Pro仍按照“输入长度”区间定价,32k以内输入为3.2元/百万tokens,输出为16元/百万tokens,相较Gemini 3 Pro和GPT 5.2具备明显成本优势。豆包2.0 Lite则主打性价比,综合性能超越两个月前发布的上一代主力豆包1.8,百万tokens输入价格为0.6元。

目前,豆包2.0 Pro已在豆包App(应用程序)、电脑端、网页版上线,火山引擎同步开放API(应用程序编程接口)服务。

相比前两次迭代,此次豆包2.0没有发布会也没有进行过多的预热。

而春节前夕也恰逢国内大模型密集上新期。阿里1月26日发布Qwen3-Max-Thinking旗舰推理模型;1月27日,月之暗面Kimi K2.5发布;之后,阶跃星辰发布新一代开源Agent基座模型Step 3.5 Flash;2月12日,MiniMax正式上线最新旗舰编程模型MiniMax M2.5,作为全球首个为Agent场景原生设计的生产级模型,其编程与智能体性能直接对标国际顶尖模型Claude Opus 4.6。

行业迭代提速,而字节连发三款核心模型,亮出的是全栈AI布局的底牌。

2月12日,已在国内外引发热议的Seedance 2.0视频模型正式登场。次日,Seedream 5.0 Lite图像模型上线,首次支持实时检索增强能力,可通过联网获取最新知识和资讯。

然而,模型能力提升的同时,算力消耗也在水涨船高。Seedance 2.0全面上线后,不少用户反馈排队现象严重。但值得一提的是,2月14日,记者在即梦平台体验Seedance 2.0时发现,模型上新了Seedance 2.0 Fast版本,而其生成视频消耗平台积分相对更少。

_字节在跳动表情包_字节跳是什么东西

相关文章

日化护肤年报|巨额营销侵吞利润:逸仙电商销售费用率60%登顶 丸美生物、上美股份超5成收入用于营销

日化护肤年报|巨额营销侵吞利润:逸仙电商销售费用率60%登顶 丸美生物、上美股份超5成收入用于营销

日化护肤行业公司销售费用普遍较高,巨额营销侵吞利润,是行业高毛利、低净利的根本原因。 特别是在互联网环境下,新锐品牌依靠电商平台、社交媒体等媒介,使营销与产品均能快速触达到广泛的消费者群体,在短时间内...

推荐几个好用的投诉平台,帮你快速找到最适合的维权路径

推荐几个好用的投诉平台,帮你快速找到最适合的维权路径

二、行业性投诉平台:专业聚焦,精准高效 除了综合性平台,针对特定行业的投诉渠道往往更具针对性。例如,如果你遇到电商购物纠纷,除了向12315反映,还可以通过电商平台自身的投诉机制(如淘宝“小二介入”、...

108万拍下LABUBU!“童趣经济”为何让成年人疯狂买单?

108万拍下LABUBU!“童趣经济”为何让成年人疯狂买单?

长着9颗尖牙、一对尖耳朵,“诡异又可爱”,拉布布(LABUBU)突然爆火,“童趣经济”以旋风之姿引发关注。过去以儿童消费品为底色的“童趣经济”,在新IP、新概念、新技术赋能下,消费场域及市场外延持续...

“一切国资尽可能证券化”,湖北国资改革的背后深意

“一切国资尽可能证券化”,湖北国资改革的背后深意

突然刷屏的“三资”改革:一场从湖南复制到湖北的化债实验 作者 | 付琪森 来源 | #融中财经(ID:thecapital) 武汉洪山人工智能大厦,6年前还是一栋入住率不到30%的“鬼楼“,如今已是...

“优等生”民生人寿股权难寻买家,收到罚单亟须提升合规风控能力

“优等生”民生人寿股权难寻买家,收到罚单亟须提升合规风控能力

近年来,中小保险公司股权多次登上司法拍卖平台。既有股东方因自身经营陷入困境,被迫通过司法途径处置所持股权以缓解压力;也有部分股东因不符合监管层对保险公司股东资质的最新要求,被依法要求清退股权;或保险公...

“东数西算”新支点  “中国算谷”正崛起

“东数西算”新支点 “中国算谷”正崛起

随着全球AI算力需求爆发性增长,中国西部悄然崛起一座“绿色智算高地”。 近日,《证券日报》记者走进位于甘肃庆阳的燧弘华创庆阳绿色智算中心(以下简称“智算中心”)。推开智算中心的防电磁屏蔽门,记者目睹了...