只管大型语言模子(LLMs)和大型视觉 - 语言模子(VLMs)在视频剖析和长语境处置惩罚方面取得了显著希望,,,但它们在处置惩罚信息麋集的数小时长视频时仍显示出局限性。。。
本文提出了一种新颖的智能体 Deep Video Discovery (DVD),,,通过将长视频支解为更短的片断并将其视作情形,,,使用 LLM 先进的推理能力来思索问题并自主妄想,,,选择具有适当参数的工具来从情形中逐步获守信息,,,最终回覆问题。。。在最新的推理模子OpenAI o3的资助下,,, DVD以这一精练有用的 agentic 框架在很是具有挑战性的LVBench上以74.2%的准确率大幅逾越了之前的事情。。。这一事情将以MCP Server的形式开源。。。
差别于之前的视频智能体框架依赖于手动设计的牢靠事情流程,,,DVD 强调其作为智能体的自主性,,,即通过自主妄想,,,决媾和行动来解决问题。。。
为了充分使用这一自主性,,,我们将原始的长视频转换为多粒度视频数据库,,,并提供了一套以搜索为中心的工具使得智能体在差别阶段搜集差别粒度的信息。。。详细来说该系统主要由三个焦点组件组成:多粒度视频数据库、以搜索为中心的工具集以及作为智能体协调器的 LLM。。。
在 “多粒度视频数据库构建” 阶段,,,系统将超长视频转换为一个结构化数据库,,,通过统一将视频支解成短片断(例如 5 秒),,,并提取全局、片断和帧级别的多粒度信息,,,包括主题中心化摘要、片断字幕及其嵌入向量,,,以及原始解码帧...。。。
(2)片断搜索(Clip Search)工具,,,实现通过片断形貌 Embedding 对视频内容举行高效语义检索,,,并返回排名靠前的相关视频片断及其字幕和时间规模。。。
LLM 作为焦点认知驱动器,,,在迭代的 “视察 - 推理 - 行动” 循环中,,,凭证累积的知识和推理证据接纳行动,,,从而付与智能体自主、证据指导和无邪的行念头制,,,有用地将原始盘问剖析为逐步细化的子盘问来解答问题。。。
该系统在多个长视频基准测试上举行了周全评估,,,展现了其卓越的效率和强盛的性能。。。在极具挑战性的 LVBench 数据集上,,,DVD 智能体取得了 74.2% 的最新准确率,,,大幅逾越了所有现有事情,,,包括先前的最先进模子 MR. Video(13.4% 的提升)和 VCA(32.9% 的提升)。。。在辅助转录的资助下,,,准确率进一步提高到 76.0%。。。在 LongVideoBench、Video MME Long 子集和 EgoSchema 等其他长视频基准测试中,,,DVD 也一连逾越了先前的最先进性能。。。
图 3:差别基础模子在智能体中的行为剖析。。。图中可以显着看出差别基础模子体现出显著的行为模式差别,,,不具有推理能力 GPT-4o 体现出很是简单的行为模子。。。
消融研究证实了工具设计的有用性,,,并强调了推理模子在整个智能系一切中的要害作用:替换推理模子(如使用 OpenAI o4-mini 或 GPT-4o)会导致性能下降,,,这批注 LLM 推理能力的缺失会导致智能体行为瓦解。。。对智能体推理行为的剖析也展现了差别模子在工具挪用模式、推理深度和准确性之间的关联,,,例如 GPT-4o 体现出太过自信和行为瓦解,,,倾向于过早竣事推理。。。这些行为模式的剖析进一步为未来的智能体设计以及基础语言模子的生长提供了实践参考。。。
《憧憬成为魔法少女》对此,该记者向比亚迪方面求证,对方表示:“‘比亚迪人形机器人代号尧舜禹’‘第七代原型机在深圳和长沙工厂实地测试’‘约150台上岗,目标年内自用2万台’等消息均不属实。”相较传统的辊压法晶圆级 NIL,PL-AS 通过面施力保障晶圆上每一个纳米级单元受力完全一致,将 RLT 偏差控制到<2nm,同时其吞吐量显著高于步进式的佳能 NIL 设备。《憧憬成为魔法少女》《《爸爸的希奇书房》小说》教研的本质是发现、梳理并解决教学难题的动态过程。课堂是教师教研的主阵地,教学真实问题是教研的核心方向,学生全面健康成长是教研的终极目标。总冠军戒指,向来是后世评判NBA传奇的重要标尺。詹姆斯手握四冠,迈克尔・乔丹坐拥六冠。即便詹姆斯早已稳坐历史巨星行列,但若能拿下第五座总冠军,在所有历史地位的讨论中,他的说服力都会再上一个台阶。
20260607 ? 《憧憬成为魔法少女》奥兹努尔表示产品隐私防护措施完善:应用生成的所有随笔内容仅用户本人可见;用户可随时删除个人数据,自主选择想要绑定接入的谷歌服务项目。逐日大赛24小时爆料集百度看现年31岁的他依旧是欧洲豪门的引援目标,巴萨、马竞都在积极求购。据TA四月份报道,B席目前没有赴美踢球的计划;倘若后续改变主意,同属曼城系的纽约城将是他的首选,这位英超名将大概率要在日后才登陆美职联。
20260607 ? 《憧憬成为魔法少女》工程和产品团队是裁员的“重灾区”。一位“幸存”员工说,团队规模较小的Manager(经理)基本都遭遇了Flatten(扁平化),被要求转为IC(个人贡献者,Individual Contributor)。他们的手下要么被裁掉,要么被强制转岗至AAI(Applied AI Engineering,应用AI工程团队),全组四分五裂,工作流程必须重新整理。《《头等舱:客服特殊待遇》韩剧》例如,当发现用户即将参加重要会议时,Scout能够提前整理背景资料;当交通拥堵可能影响行程时,它能够主动提醒最佳出发时间。