东方钢绞线一米多少公斤 AI智能体不是越多越强: 信息冗余组成了LLM Agent Scaling的瓶颈

发布日期:2026-03-12 点击次数:61
钢绞线

连年来,基于大言语模子的多智能体系统(LLM-based Multi-Agent Systems, MAS)被无为用于复杂理任务。典型作念法是让多个 agent 立生成并通过投票或辩说等机制聚方案,从而在算术理、知识断与业问答中培植准确率。

跟着 test-time compute(理时缱绻)成为常见的智商培植技艺,个当然的问题随之出现:MAS 是否能通过束缚加多 agent 数目而合手续变强?直观上,这个设计似乎建设:访佛 ensemble 或 self-consistency 的「屡次采样 + 聚」常常能提遮盖正确谜底的概率。

来自上海交通大学、UC Berkeley、加州理工学院以及约翰・霍普金斯大学的联盘问论文 Understanding Agent Scaling in LLM-Based Multi-Agent Systems via Diversity 标明:多智能体系统「扩不动」的实在原因,并不是 Agent 不够多,而是信息冗余。 系统实验发现,单纯堆限制收益赶紧粗重,而引入各样不错显贵减速弥散、以少的 Agent 获取强的能。

论文标题:Understanding Agent Scaling in LLM-Based Multi-Agent Systems via Diversity

GitHub 代码:https://github.com/SafeRL-Lab/Agent-Scaling

同质推广的失:

限制带来的收益赶紧弥散

论文先径直试验「加多 agent 数是否有」。在同质确立下,通盘 agent 分享相通底座模子与系统辅导( persona 各异,建立致),汲取两类常见结合机制:

Vote:单轮立生成后大王人投票;

Debate:多轮交互后再给出终谜底(交互 4 轮)。

仅改变 agent 数 N,在 7 个基准任务(GSM8K、ARC、Formal Logic、TruthfulQA、HellaSwag、WinoGrande、Pro Medicine)上评估。

效果在不同任务与模子上度致:当 N 从 1 增至 2 或 4 时东方钢绞线一米多少公斤,能常常显豁培植;但链接加多 N 后,准确率赶紧插足平台期,角落收益接近 0,部分确立以致出现回落。这讲解:在同质建立下,单纯堆叠多 agent calls 并不成合手续注入新的有信息。

各样带来的对照风物:

极少异质 agent 胜过大限制同质系统

与同质推广的快速弥散造成昭彰对比的是,各样建立下的实验效果。论文向上相比了两类系统:类由同模子屡次立入手组成,另类则由不同 backbone 模子或不同 persona prompt 组成。在匹配缱绻预算(固定总 agent calls)的前提下,异质系统在同预算下举座,况兼在大的 N 上仍能保合手增益。

为了系统地清醒这风物,作家在实验中将各样拆解为不同起头,包括 persona 各样、模子各样,以及二者结的各样,并在统确立下进行对比。

在 GSM8K、ARC、HellaSwag、TruthfulQA 等七个基准任务上,作家系统相比了:

Agent 致(L1)

Agent Persona 各样(L2)

Base Model 各样(L3)

Persona各样兼Base Model各样(L4)

效果暴露,每引入层新的各样,系统举座能王人会显贵上移;其中,模子各样和 persona 各样各自王人具有立孝顺,而二者结时果为显贵。

这趋势在率层面体现得尤为显豁:在多个任务上,仅使用 2 个异质的 agent东方钢绞线一米多少公斤,就不错达到以致过 16 个同质 agent 的平均能。

抑制多智能体推广的不是限制

而是信息冗余

天津市瑞通预应力钢绞线有限公司

将这些实验效果串联起来,论文在教导层面得出了个了了论断:多智能体系统的推广瓶颈并不来自 agent 数目不及,而来自 agent 输出之间的度推敲。在同质建立下,多个 agent 常常沿着雷同的理旅途生成谜底,新增调用所带来的大多是叠加信息;而各样的作用,在于引入互补视角,裁减输出冗余,使系统随机在相通以致小的缱绻预算下获取多有凭据。

基于这系列实验风物,作家向上提议信息论分析框架,锚索引入「有信息通说念」等见解,对「限制失」与「各样势」给出统讲解注解。与其说这项职责提议了新的 agent 架构,不如说它明确指出:多智能体系统里实在稀缺的资源不是调用次数,而黑白冗余的信息起头。

信息论视角:

能由「有信息」而非「调用次数」主

作家推敲个包含 N 个大模子智能体的多智能体系统,每个智能体具有自身建立,包括基座模子(backbone model)、系统辅导词(system prompt)、角设定(persona)与器用智商(tool access)。系统汲取问题输入 X,按预设职责流实行若干次理(记为 n 次),终输出谜底。

从信息论角度,得到正确谜底 Y 的收着力并不浅近由 N 与 n 决定,而取决于系统随机提供若干对于 Y 的信息。作家用要求熵 H (Y|X) 描述任务的内在难度:在给定问题 X 的情况下,正确谜底 Y 仍然存在的剩余不笃定。

在同质建立下,即便新增智能体,常常也仅仅在雷同理旅途下叠加采样,因而对裁减不笃定匡助有限;

在异质建立下,新增智能体可能引入新的理旅途,与既有旅途互补,从而有地减少不笃定。

为描述这各异,作家界说:

在该设定下,作家基于若干建模假定出个近似口头,用于描述趋势而非精准展望。作家以为,系统可获取的有信息量(并据此关联收着力)主要受如下量行使:

该效果强调:影响系统能的重要不在于 “智能体数目或理次数”,而在于系统中有信息通说念的数目 —— 也等于各样化所带来的非冗余信息限制。它也讲解注解了为何实验中常见「角落益递减」:当有信息通说念增长受限时,新增调用带来的有信息增量会快速衰减。

作家还给出了在实验中测度有信息通说念 K 的法,并在 GSM8K、ARC、Formal Logic、HellaSwag、WinoGrande、Pro Medicine 等数据集上考据:教导收着力与表面展望总体吻。

向上地,作家将系统输出拆分为「正确理旅途」与「失实理旅途」,永诀估算其对应的有信息通说念数目。实验致标明:当正确理旅途对应的有信息通说念多时,多智能体系统推崇好。这意味着系统设计不应盲目追求各样自身,而应追求与任务推敲的理各样 —— 即培植与正确理推敲的有信息通说念数。

回归

论文的中枢教导论断是:多智能体推广的重要不在于把 N 作念大,而在于让新增调用带来新的有凭据。只消输出度推敲,同质推广就会很快插足平台期;而各样随机培植率,是因为它可能产生互补理旅途。换句话说,多智能体系统里稀缺的不是调用次数,而黑白冗余信息。

实验上不错用个浅近尺度指推广:当加多 agent 主要带来「同念念路的叠加」 时,应住手堆同质数目,转而引入可控的异质(法互补的 persona、不同模子族、器用智商互补);独一当这些改换确乎带来很是增益时,再链接扩大限制。

相关词条:储罐保温     异型材设备     钢绞线厂家    玻璃丝棉厂家    万能胶厂家

1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定东方钢绞线一米多少公斤,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。

首页
电话咨询
QQ咨询
联系瑞通