出品 | 科技《魄力》栏目
作家 | 李姝
剪辑 | 丁广胜
当DeepSeek以开源计谋席卷拓荒者社区时,火山引擎用闭源的花式展示了另一种可能性。
“约束2025年3月底,豆包大模子日均tokens调用量已卓绝12.7万亿,是2024年12月的3倍,是一年前刚刚发布时的106倍。”
4月17日,在火山引擎FORCE LINK AI革命巡展上,火山引擎总裁谭待亮出一组数据,为闭源大模子的生活战注入强心剂。
如今,豆包大模子已成为雄伟企业AI转型的中枢利器。就在巡展当日,面向企业阛阓,全新的豆包1.5·深度想考模子崇拜登场,同期升级文生图模子3.0及视觉相识模子,还推出了OS Agent贬责决策和AI云原生推理套件。
这一系列行动标明,在模子性能竞赛转向 “Agent生态卡位战” 确当下,火山引擎已精确锚定新的发展场所。
加量不涨价,豆包深度想考模子通达API
官方本领论说走漏,豆包深度想考模子遴荐MoE架构,总参数200B,激活参数仅20B,以较小参数竣事了忘形顶尖模子的后果。收货于高效算法和高性能推理系统,豆包模子的API工作在保证高并发的同期,将延长降至20毫秒,现在已通至极山引擎通达供用户体验。
在数学推理、编程竞赛、科学推理等专科边界,豆包模子的性能与OpenAI o3-mini-high、Gemini 2.5 Pro等模子不相凹凸。
在通用任务上,豆包深度想考模子的东谈主类评估进展比DeepSeek R1逾越8%,单元推理本钱更是镌汰了50%,完满竣事了性能与着力的均衡。
相较于仅限翰墨相识的 DeepSeek,豆包深度想考模子的多模态才调上风权臣。
谭待先容,升级后的豆包・视觉相识模子具备纷乱的视觉相识才调,使模子不仅 “会看会想”,还能进行立体想考。从识别菜单实质,字据用户口味和过敏食品提供点餐推选,到分析航拍图上的花式、体式等信息并蚁集地貌进行深度研判,豆包的多模态应用场景丰富且实用。
豆包・文生图模子3.0相同进展亮眼,其翰墨排版和图像生成才调进一步增强,支握2K高清图片生成,在影视、海报、绘图等边界应用等闲。在最新的文生图边界巨擘榜单Artificial Analysis竞技场中,豆包・文生图3.0模子已置身人人第一梯队。
豆包这一次放的大招,可谓威力澈底。现在豆包照旧在AppStore内免费APP名次榜到手登顶,超越位居第三的DeepSeek和第九的腾讯元宝。
招待Agent元年,“应用Agent”+“OS Agent”双管发力
纷乱的模子性能为AI Agent的发展奠定了坚实基础。
谭待指出:“AI Agent应用主要分为应用型Agent和OS Agent两个场所。应用型Agent专注于特定边界任务,如客服Agent、数据Agent、代码Agent 等;OS Agent则具备跨场景通用性和天真性,可操作浏览器、电脑、手机等诞生,完成复杂任务。”
在应用型Agent边界,面向专科拓荒者的代码Agent——Trae重磅推出。相较于传统AI插件居品,Trae将AI与IDE深度和会,带来更智能的拓荒体验。
在OS Agent方面,火山引擎崇拜发布OS Agent贬责决策,迪士尼彩乐园860整合豆包UI-TARS模子,以及veFaaS函数工作、云工作器、云手机等居品,竣事对代码、浏览器、电脑、手机及其他Agent的高效操作。
针对Agent带来的大批推理虚耗问题,火山引擎推出ServingKit推理套件,可在2分钟内完成671B DeepSeek R1的下载和预热,13秒完成推理引擎加载。
同期,通过优化火山引擎EIC,将KV cache掷中率提高10倍,在100% cache掷中场景下,TPS浑沌量栽植至5倍以上;对算子、AI网关、VKE编排疗养的升级,也大幅镌汰了GPU虚耗。
关于GPU的折旧问题,谭待觉得:“要是把软件层面的责任作念好,硬件的生命周期是不错拉长的。并且不同的场景对模子的延长、浑沌条件是不一样的。更紧迫的是在软件层面和运营层面作念好关系责任,这么就能使硬件的生命周期和投资陈说率(ROI)王人达到最好情状。”
模子横暴比开源闭源更要津,对豆包充满信心
“模子横暴,与开源闭源无关。火山引擎在适配DeepSeek方面进展出色,对豆包充满信心。”火山引擎总裁谭待在采访中直言。
靠近豆包大模子日均tokens调用量百倍的增长,谭待暗示,本领发展短期易被高估、恒久易被低估,tokens增长量取决于模子摧毁,如视觉推理、Agent等方面的进展,对将来模子调用量百倍增长握严慎乐不雅魄力。
2025年被称为Agent元年,但谭待觉得:“能写诗的不是Agent,能跑通供应链的才是。” 这一不雅点突显了火山引擎的求实布局。
谭待指出,“咱们但愿AI大略贬责更复杂,更完整的问题,不再只是是对信息的感知、处理和生成,而是能端到端的处理任务。AI能作念到这些,才能称之为一个及格的Agent。”
他觉得,竣事这一讨论需完成三大本领摧毁:领先最中枢的是要有更强的模子。要作念好Agent,模子需要有才调作念好想考、策动和反想,并且要一定得支握多模态。其次,拓荒OS Agent架构体系,竣事数字与物理寰宇的双向交互。临了,通过AI云原生本领竣事推理本钱与延长的指数级下落,撑握大边界应用落地。
现在,火山引擎已支握MCP条约,妥洽条约有助于镌汰拓荒本钱、加快行业发展。将来,火山引擎不仅会推出数据智能体Data Agent等垂直类Agent居品,还将为通用Agent拓荒提供用具和决策。在谭待看来,判断真确的Agent,要津要看其能否完成复杂任务、是否利用深度想考模子。
当闭源模子凭借本钱上风挑战开源阵营,当开源生态反哺交易革命,这场大模子竞争早已超越本领层面,演变为组织才调与生态运营的全场所较量。
不错猜测的是,在Agent战场中,惟一那些将本领深度融入行业各个措施的参与者,才能最终脱颖而出。