请选择 目标期刊

FCS | 文章精要:南京大学俞扬等——基于异质训练与通讯的开放真实世界人智协同


发布时间:2025-01-24

人智协同旨在训练和部署能够与人类队友有效协同的AI智能体。最近的研究表明,通过与未见的人类队友进行训练,能在开放世界环境下进行良好的人智协同。然而,这些方法通常假设一个过于理想的场景,即认为智能体和人类队友之间的是同质的,这与真实世界的场景不符。为了促进在开放和真实世界中人智协同的实际部署和应用,本文发表了最新研究成果。

技术步骤

该团队为开放和真实世界中人智协同(ORC)提出了第一个基准。该基准被称为 ORCBench,包含了近期工作中常用的流行环境。它不仅考虑了开放世界的挑战,即具有不同未知水平的不同未知人类队友,还考虑了真实世界挑战,即智能体和人类队友从观察到能力都是异质的。此外,他们还为 ORC 引入了一个名为带通信的异质训练框架HeteC。HeteC 以异质训练框架为基础,通过使用混合队友训练和冻结历史队友来增强队友群体的多样性。此外,HeteC 还集成了一个通信模块,使人类队友能够与人工智能代理进行通信,从而减轻部分可观测环境的不利影响。作者提出了一个基准ORCBench,其中包括广泛使用的人智协同的环境和算法。此外,针对 ORC问题,作者提出了一个带有通信的异质训练框架HeteC,该框架建立在异质训练框架之上,并包含一个通信模块,使人类队友能够与智能体进行通信,从而减轻部分可观察环境的不利影响。

实验结果

为了验证 HeteC 的有效性,他们在 ORCBench 上进行了实验,并将其与现有方法进行了比较。首先,他们证明了 ORC 环境对最先进的 HAC 方法提出了挑战。接下来,他们评估了所提方法在不同布局和各种遮罩(即不同的智能体观察空间限制)下的有效性,包括与真人参与者进行的实验。他们的贡献为解决 ORC 面临的挑战迈出了重要的一步。

期刊简介

Frontiers of Computer Science (FCS)是由教育部主管、高等教育出版社和北京航空航天大学共同主办,南京大学支持,SpringerNature 公司海外发行的英文学术期刊。本刊于 2007 年创刊,月刊,全球发行。主要刊登计算机科学领域具有创新性的综述论文、研究论文等。本刊主编为周志华教授,共同主编为熊璋教授。编委会及青年 AE 团队由国内外知名学者及优秀青年学者组成。本刊被 SCI、Ei、DBLP、INSPEC、SCOPUS 和中国科学引文数据库(CSCD)核心库等收录,为 CCF 推荐B类期刊;两次入选“中国科技期刊国际影响力提升计划”;入选“第4届中国国际化精品科技期刊”;两次入选“中国科技期刊卓越行动计划”(一期梯队、二期领军)。


特别声明:本文转载来源“科学网”,仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的来源,并自负版权等法律责任;作者如果不希望被转载等相关事宜,请与我们接洽。

在线客服::点击联系客服
联系电话::400-188-5008
客服邮箱::service@ccnpub.com
投诉举报::feedback@ccnpub.com
人工客服

工作时间(9:00-18:00)
官方公众号

科技成果·全球共享