东方钢绞线一米多少公斤 AI智能体不是越多越强: 信息冗余组成了LLM Agent Scaling的瓶颈

发布日期：2026-03-12 点击次数：64

连年来，基于大言语模子的多智能体系统（LLM-based Multi-Agent Systems, MAS）被无为用于复杂理任务。典型作念法是让多个 agent 立生成并通过投票或辩说等机制聚方案，从而在算术理、知识断与业问答中培植准确率。

跟着 test-time compute（理时缱绻）成为常见的智商培植技艺，个当然的问题随之出现：MAS 是否能通过束缚加多 agent 数目而合手续变强？直观上，这个设计似乎建设：访佛 ensemble 或 self-consistency 的「屡次采样 + 聚」常常能提遮盖正确谜底的概率。

来自上海交通大学、UC Berkeley、加州理工学院以及约翰・霍普金斯大学的联盘问论文 Understanding Agent Scaling in LLM-Based Multi-Agent Systems via Diversity 标明：多智能体系统「扩不动」的实在原因，并不是 Agent 不够多，而是信息冗余。系统实验发现，单纯堆限制收益赶紧粗重，而引入各样不错显贵减速弥散、以少的 Agent 获取强的能。

论文标题：Understanding Agent Scaling in LLM-Based Multi-Agent Systems via Diversity

GitHub 代码：https://github.com/SafeRL-Lab/Agent-Scaling

同质推广的失：

限制带来的收益赶紧弥散

论文先径直试验「加多 agent 数是否有」。在同质确立下，通盘 agent 分享相通底座模子与系统辅导（ persona 各异，建立致），汲取两类常见结合机制：

Vote：单轮立生成后大王人投票；

Debate：多轮交互后再给出终谜底（交互 4 轮）。

仅改变 agent 数 N，在 7 个基准任务（GSM8K、ARC、Formal Logic、TruthfulQA、HellaSwag、WinoGrande、Pro Medicine）上评估。

效果在不同任务与模子上度致：当 N 从 1 增至 2 或 4 时东方钢绞线一米多少公斤，能常常显豁培植；但链接加多 N 后，准确率赶紧插足平台期，角落收益接近 0，部分确立以致出现回落。这讲解：在同质建立下，单纯堆叠多 agent calls 并不成合手续注入新的有信息。

各样带来的对照风物：

极少异质 agent 胜过大限制同质系统

与同质推广的快速弥散造成昭彰对比的是，各样建立下的实验效果。论文向上相比了两类系统：类由同模子屡次立入手组成，另类则由不同 backbone 模子或不同 persona prompt 组成。在匹配缱绻预算（固定总 agent calls）的前提下，异质系统在同预算下举座，况兼在大的 N 上仍能保合手增益。

为了系统地清醒这风物，作家在实验中将各样拆解为不同起头，包括 persona 各样、模子各样，以及二者结的各样，并在统确立下进行对比。

在 GSM8K、ARC、HellaSwag、TruthfulQA 等七个基准任务上，作家系统相比了：

Agent 致（L1）

Agent Persona 各样（L2）

Base Model 各样（L3）

Persona各样兼Base Model各样(L4)

效果暴露，每引入层新的各样，系统举座能王人会显贵上移；其中，模子各样和 persona 各样各自王人具有立孝顺，而二者结时果为显贵。

这趋势在率层面体现得尤为显豁：在多个任务上，仅使用 2 个异质的 agent东方钢绞线一米多少公斤，就不错达到以致过 16 个同质 agent 的平均能。

抑制多智能体推广的不是限制

而是信息冗余

天津市瑞通预应力钢绞线有限公司

将这些实验效果串联起来，论文在教导层面得出了个了了论断：多智能体系统的推广瓶颈并不来自 agent 数目不及，而来自 agent 输出之间的度推敲。在同质建立下，多个 agent 常常沿着雷同的理旅途生成谜底，新增调用所带来的大多是叠加信息；而各样的作用，在于引入互补视角，裁减输出冗余，使系统随机在相通以致小的缱绻预算下获取多有凭据。

基于这系列实验风物，作家向上提议信息论分析框架，锚索引入「有信息通说念」等见解，对「限制失」与「各样势」给出统讲解注解。与其说这项职责提议了新的 agent 架构，不如说它明确指出：多智能体系统里实在稀缺的资源不是调用次数，而黑白冗余的信息起头。

信息论视角：

能由「有信息」而非「调用次数」主

作家推敲个包含 N 个大模子智能体的多智能体系统，每个智能体具有自身建立，包括基座模子（backbone model）、系统辅导词（system prompt）、角设定（persona）与器用智商（tool access）。系统汲取问题输入 X，按预设职责流实行若干次理（记为 n 次），终输出谜底。

从信息论角度，得到正确谜底 Y 的收着力并不浅近由 N 与 n 决定，而取决于系统随机提供若干对于 Y 的信息。作家用要求熵 H (Y|X) 描述任务的内在难度：在给定问题 X 的情况下，正确谜底 Y 仍然存在的剩余不笃定。

在同质建立下，即便新增智能体，常常也仅仅在雷同理旅途下叠加采样，因而对裁减不笃定匡助有限；

在异质建立下，新增智能体可能引入新的理旅途，与既有旅途互补，从而有地减少不笃定。

为描述这各异，作家界说：

在该设定下，作家基于若干建模假定出个近似口头，用于描述趋势而非精准展望。作家以为，系统可获取的有信息量（并据此关联收着力）主要受如下量行使：

该效果强调：影响系统能的重要不在于 “智能体数目或理次数”，而在于系统中有信息通说念的数目 —— 也等于各样化所带来的非冗余信息限制。它也讲解注解了为何实验中常见「角落益递减」：当有信息通说念增长受限时，新增调用带来的有信息增量会快速衰减。

作家还给出了在实验中测度有信息通说念 K 的法，并在 GSM8K、ARC、Formal Logic、HellaSwag、WinoGrande、Pro Medicine 等数据集上考据：教导收着力与表面展望总体吻。

向上地，作家将系统输出拆分为「正确理旅途」与「失实理旅途」，永诀估算其对应的有信息通说念数目。实验致标明：当正确理旅途对应的有信息通说念多时，多智能体系统推崇好。这意味着系统设计不应盲目追求各样自身，而应追求与任务推敲的理各样 —— 即培植与正确理推敲的有信息通说念数。

回归

论文的中枢教导论断是：多智能体推广的重要不在于把 N 作念大，而在于让新增调用带来新的有凭据。只消输出度推敲，同质推广就会很快插足平台期；而各样随机培植率，是因为它可能产生互补理旅途。换句话说，多智能体系统里稀缺的不是调用次数，而黑白冗余信息。

实验上不错用个浅近尺度指推广：当加多 agent 主要带来「同念念路的叠加」时，应住手堆同质数目，转而引入可控的异质（法互补的 persona、不同模子族、器用智商互补）；独一当这些改换确乎带来很是增益时，再链接扩大限制。

相关词条:储罐保温异型材设备钢绞线厂家玻璃丝棉厂家万能胶厂家

1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定东方钢绞线一米多少公斤，并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方，并积极配合修改。
3.凡用户访问本网页，均表示默认详情页的描述，不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》，以此来变相勒索商家索要赔偿的违法恶意行为。