blog

我们如何通过模仿自然来演变RoboCup比赛的制胜战略

“在足球界,对手队伍的存在让一切都变得复杂”法国哲学家让 - 保罗·萨特的这种观察被引用在多种语境中,从团队运动中的战术规划到微观经济学的博弈论模型,再到完整 - 所有这些研究中的共同点是冲突:对抗性交互带来的混乱可以破坏最准备的方案这种方式在许多领域中运作一旦设计 - 无论是战术计划还是工程蓝图 - 与某些人进行联系不可预见的情况 - 例如新的对手战略或自然灾害 - 然后很可能崩溃,无论准备工作多么详细和预先优化,复杂系统抵御突发压力的一种方法是利用其组成部分的自组织零件并适应不断变化的环境但这需要付出代价很难预测复杂系统是如何形成的如果你只能分别分析和分析每个部分的行为那么会表现出来那么有没有办法预测意外?这是“复杂系统”研究人员所面临的核心挑战,他们设计和构建具有内在稳健性和弹性的系统我们可以通过回归足球来展示这一挑战,特别是机器人足球RoboCup是世界杯机器人足球现在接近20周年最近的活动吸引了来自超过45个国家的40,000多名参观者和参与者。它也是人工智能(AI),机器人和多智能体复杂系统的领先基准。虽然物理机器人联盟往往引起最多的关注,但是也是一个模拟联盟,专注于推进虚拟AI在RoboCup 2D模拟联盟中,两个由11个完全自主软件程序组成的团队(称为“代理人”)在一个二维虚拟足球场中踢足球,没有遥控器整个RoboCup社区已经开发了20多年的开源模拟器和可视化软件它包含近百万行代码E. ach代理具有虚拟的视觉,声学和物理传感器来检测周围发生的事情。每个人都可以执行一些基本的动作,如跑步,转身和踢球。主要的挑战是在任何特定时间推导出最佳的动作。面对对立特工的意外和破坏性行为每个模拟步骤只需十分之一秒,在此期间整个感觉 - 运动周期发生在一个代理中这开始于它从模拟器接收新的感觉输入然后评估可能的选择 - 每个周期高达100,000个 - 并将所选行动发送回模拟器Gliders2016团队,该团队于今年7月赢得2016年模拟比赛,是悉尼大学(Mikhail Prokopenko教授,Victor Jauregui博士)和CSIRO的合作项目(Peter Wang,Oliver Obst博士)为了优化我们的团队,我们采用了一种基于人类的进化计算方式。这就是我们创新和测试的方式新的行为,提高从一个人工“代”到另一个人的性能我们使用几个超级计算机集群评估软件,每天执行数万次实验运行这些试验的数量接近1000万在测试期间,我们不只是看软件代理如何智能地单独执行或作为一个团队执行我们还考虑了更大的图景我们研究了对手团队行为的复杂性以及我们的软件是否易于适应,可扩展且对变化具有鲁棒性我们分析了我们的团队如何应对反对派可能会在下一场比赛中释放令人惊讶的新奇事物以及它是否可以在比赛期间突然受挫中恢复许多这些问题与复杂系统中遇到的一般性问题产生共鸣我们不得不考虑初始条件的微小变化 - 例如,提高通过的风险承受能力 - 可以影响总体结果另一个aspec是系统的动力学是否倾向于重复特定轨迹我们还研究了随机性在模拟中的作用以及如何对隐藏变量进行建模简而言之,我们探讨了复杂系统如何在2016年帮助开发RoboCup获胜团队 启发我们团队策略的一个见解是在鸟群和鱼群中观察到的模式这些是生物学中复杂性的经典案例为了应对捕食者,许多鱼类展示了复杂的空间聚集模式,因此小的干扰可以迅速级联整个团队,传递生存关键信息对于我们的RoboCup团队,类似的行为允许虚拟玩家实现高度连贯的移动性一方面,玩家不断提炼他们的位置以响应对手球员另一方面,重新定位不是不稳定的,球员以协调的方式运动球队的战术也已经发展到抵消不同类型的对手,创造了丰富多样的行为,增强了稳健性和弹性我们评估了这种方法使用信息理论,量化和预测系统内的“信息流”,而不是ju st“数据流”关键的区别在于信息提供了数据的上下文,信息流突出了最相关和最突出的动态RoboCup团队的复杂性可能只会随着时间的推移而增长,遇到新的挑战并解决新的问题,因为整体而言倡议和技术不断发展新一代的科学家和工程师将在2036年推动创新,当时RoboCup标志着它的另一个20年的旅程到那时,很可能复杂的系统,作为一个研究领域,将采取全球教育计划的中心舞台,整合信息技术,物理,生物和数学元素,培养工程,

查看所有