大模型三箭齐发、芯片岗位低调招聘,字节跳动不只想赢下AI“春节档”

花花2026-02-20债务科普67

春节试炼场已然铺开。Agent(智能体)时代,正在加速走来。

豆包2.0的升级路径,延续字节一贯的技术思路。

火山引擎总裁谭待曾在2025年12月发布豆包1.8时接受包括《每日经济新闻》在内的媒体采访时表示,多模态能力的提升是模型成为复杂Agent的关键。“多模态其实代表着模型的应用进入更深的领域。”

此番豆包2.0的突破,正是沿着这一方向展开。

本次发布的豆包大模型2.0提供了多种选择:包含Pro、Lite、Mini三款多模态通用模型,以及面向开发者的Code模型。其中,旗舰款豆包2.0 Pro定位于复杂深度推理、Agent等高难度任务。

在推理和Agent能力评测中,豆包2.0 Pro在IMO、CMO数学奥赛和ICPC编程竞赛中获得金牌成绩,超越了Gemini 3 Pro在Putnam基准测试上的表现。此外,在HLE-text(人类的最后考试)中,豆包2.0 Pro取得最高分54.2分。

据官方介绍,豆包2.0还重点强化了指令遵循能力,可保持较强的一致性与可控性,作为Agent模型能够在长链路、多步骤任务中严格按约束条件执行。对此,《每日经济新闻》记者对豆包大模型2.0 Pro(专家版)进行了实测。

测试由DeepSeek设计,聚焦多轮复杂指令遵循与稳定性。记者以“请帮我规划一个为期3天的北京旅游行程,预算3000元,独自一人”为初始条件,并在对话过程中不断加入新约束,观察模型是否会遗忘或混淆信息。

面对初始条件,豆包2.0 Pro经过不到2分钟思考,便给出了一份信息完备的规划,具体到每个景点的预约方式和游玩路线。由于未指定具体日期,模型自动按旺季价格标准进行了预算测算。

记者又先后补充了“第一天晚餐换成北京评分高的湘菜或者川菜”“带上母亲出游,预算调整为5000元,住宿需要更换为双床房”“第三天不去长城,换个轻松一点的地方逛”等多个条件。

在保持行程框架不变的前提下,豆包2.0 Pro在收到“带上长辈”的信息后,主动调整了景点内的游览路线,增加了游船、园内电动车等适老选项;在满足第一晚吃辣需求的同时,还核验了备选餐厅是否有适合长辈的食物。

多模态理解是此次升级的另一重头戏。从测试成绩来看,在空间理解MMSIBench、运动理解MotionBench、视频理解VideoMME等测评集上,豆包2.0 Pro均略胜Gemini 3 Pro一筹;在图表理解CharXiv-RQ 上能力也再次大幅提升。

而在实际应用能力上,豆包2.0亦有所提升。据字节官方介绍,面对动态场景,豆包2.0强化了对时间序列与运动感知的理解能力,对“变化、动作、节奏”等信息的捕捉更为稳定,工程侧可用性更高。

在长视频场景中,豆包2.0可作为AI助手完成实时视频流分析、环境感知、主动纠错与情感陪伴,实现从被动问答到主动指导的交互升级,可应用于健身、穿搭等陪伴场景。

价格方面,豆包2.0 Pro仍按照“输入长度”区间定价,32k以内输入为3.2元/百万tokens,输出为16元/百万tokens,相较Gemini 3 Pro和GPT 5.2具备明显成本优势。豆包2.0 Lite则主打性价比,综合性能超越两个月前发布的上一代主力豆包1.8,百万tokens输入价格为0.6元。

目前,豆包2.0 Pro已在豆包App(应用程序)、电脑端、网页版上线,火山引擎同步开放API(应用程序编程接口)服务。

相比前两次迭代,此次豆包2.0没有发布会也没有进行过多的预热。

而春节前夕也恰逢国内大模型密集上新期。阿里1月26日发布Qwen3-Max-Thinking旗舰推理模型;1月27日,月之暗面Kimi K2.5发布;之后,阶跃星辰发布新一代开源Agent基座模型Step 3.5 Flash;2月12日,MiniMax正式上线最新旗舰编程模型MiniMax M2.5,作为全球首个为Agent场景原生设计的生产级模型,其编程与智能体性能直接对标国际顶尖模型Claude Opus 4.6。

行业迭代提速,而字节连发三款核心模型,亮出的是全栈AI布局的底牌。

2月12日,已在国内外引发热议的Seedance 2.0视频模型正式登场。次日,Seedream 5.0 Lite图像模型上线,首次支持实时检索增强能力,可通过联网获取最新知识和资讯。

然而,模型能力提升的同时,算力消耗也在水涨船高。Seedance 2.0全面上线后,不少用户反馈排队现象严重。但值得一提的是,2月14日,记者在即梦平台体验Seedance 2.0时发现,模型上新了Seedance 2.0 Fast版本,而其生成视频消耗平台积分相对更少。

_字节在跳动表情包_字节跳是什么东西

相关文章

“铜师傅”冲刺IPO,雷军迎来好消息!

“铜师傅”冲刺IPO,雷军迎来好消息!

雷军投资 “铜师傅”创始人俞光曾在媒体专访中透露,他创业的原因是出于一次购买“未果”。 2013年,俞光在杭州为朋友挑选乔迁礼物时,遍寻市场却找不到一尊兼具品质与性价比的铜制关公像。高端作品标价动辄数...

德银预警欧元或飙升至1.30 指出美元走弱三大因素

德银预警欧元或飙升至1.30 指出美元走弱三大因素

自特朗普就任以来,美元已大幅贬值。德意志银行的外汇专家George Saravelos在一份重新评估报告中写道,“现在已经具备了美元显著下跌的条件”。欧元将成为受益者。 本周初,欧元兑美元汇率为1.1...

马斯克称xAI已收购 X,对这家社交媒体网站的估值为330亿美元

马斯克称xAI已收购 X,对这家社交媒体网站的估值为330亿美元

要点: 马斯克周五表示,他将把旗下的两家公司 xAI 和 X 合并为一个实体。 马斯克在 X 上发帖称,xAI 是收购方,在此次交易中估值为 800 亿美元,而 X 的估值为 330 亿美元。 马斯...

并购重组潜力股曝光,仅24只!

并购重组潜力股曝光,仅24只!

2025年以来,并购重组市场明显提速,涉及公司数量显著增加。从大背景来看,无论是政策端的大力推动,还是市场主体的积极参与,都使得并购重组愈发活跃。数据显示,本轮并购重组浪潮呈现四大特征:规模更大、双创...

三宁化工殷银华:持续推动AI与实体经济深度融合,共同打造开放、共赢、可持续的工业智能新生态

三宁化工殷银华:持续推动AI与实体经济深度融合,共同打造开放、共赢、可持续的工业智能新生态

专题:2025中控技术全球新品发布暨工业AI创新发展大会 9月28日,“释放AI效能,共创增长范式——2025工业具身智能TPT+UCS落地应用成果展示大会”在宜昌举办。本次大会将首次系统展示由中控...

德马克称标普500指数涨势将尽 熊市将至

德马克称标普500指数涨势将尽 熊市将至

资深技术策略师汤姆・德马克表示,美国股票市场将再次下跌,并最终在未来几个月内进入熊市。德马克准确地预测到了今年 2 月股票市场的高点以及随后 4 月的低点。 德马克是一位备受关注的分析师,曾为包括保罗...