多主体的研究与应用是近年来备受关注的热点领域,多主体强化学习理论与方法、多主体协作策略的研究是该领域重要研究方向,其理论和应用价值极为广泛,备受广大从事计算机应用、人工智能、自动控制、以及经济管理等领域研究者的关注。本书清晰地介绍了多主体、强化学习及多主体协作等基本概念和基础内容,明确地阐述了有关多主体强化学习、协作策略研究的发展过程及*新动向,深入地探讨了多主体强化学习与协作策略的理论与方法,具体地分析了多主体强化学习与协作策略在相关研究领域的应用方法。全书系统脉络清晰、基本概念清楚、图表分析直观,注重内容的体系化和实用性。通过本书的阅读和学习,读者即可掌握多主体强化学习及协作策略的理论和方法,更可了解在实际工作中应用这些研究成果的手段。 本书可作为从事计算机应用、人工智能、自动控制、以及经济管理等领域研究者的学习和阅读参考,同时高等院校相关专业研究生以及人工智能爱好者也可从中获得借鉴。
多主体的研究与应用是近年来备受关注的热点领 域,多主体强化学习理论与方法、多主体协作策略的 研究是该领域重要研究方向,其理论和应用价值极为 广泛,备受广大从事计算机应用、人工智能、自动控 制、以及经济管理等领域研究者的关注。孙若莹、赵 刚所著的《多主体强化学习协作策略研究》清晰地介 绍了多主体、强化学习及多主体协作等基本概念和基 础内容,明确地阐述了有关多主体强化学习、协作策 略研究的发展过程及*新动向,深入地探讨了多主体 强化学习与协作策略的理论与方法,具体地分析了多 主体强化学习与协作策略在相关研究领域的应用方法 。 全书系统脉络清晰、基本概念清楚、图表分析直 观,注重内容的体系化和实用性。通过本书的阅读和 学习,读者即可掌握多主体强化学习及协作策略的理 论和方法,更可了解在实际工作中应用这些研究成果 的手段。本书可作为从事计算机应用、人工智能、自 动控制、以及经济管理等领域研究者的学习和阅读参 考,同时高等院校相关专业研究生以及人工智能爱好 者也可从中获得借鉴。
chapter 1introduction1.1reinforcement learning1.1.1generality of reinforcement learning1.1.2reinforcement learning on markov decision processes1.1.3integrating reinforcement learning into agent architecture1.2multiagent reinforcement learning1.2.1multiagent systems1.2.2reinforcement learning in multiagent systems1.2.3learning and coordination in multiagent systems1.3ant system for stochastic combinatorial optimization1.3.1ants forage behavior1.3.2ant colony optimization1.3.3max-min ant system1.4motivations and consequences1.5book summarybibliographychapter 2reinforcement learning and its combination with ant colony system2.1introduction2.2investigation into reinforcement learning and swarm intelligence2.2.1temporal differences learning method2.2.2active exploration and experience replay in reinforcement learning2.2.3ant colony system for traveling salesman problem2.3the q-acs multiagent learning method2.3.1the q-acs learning algorithm2.3.2some properties of the q-acs learning method2.3.3relation with ant-q learning method2.4simulations and results2.5conclusionsbibliographychapter 3multiagent learning methods based on indirect media information sharing3.1introduction3.2the multiagent learning method considering statistics features3.2.1accelerated k-certainty exploration3.2.2the t-acs learning algorithm3.3the heterogeneous agents learning3.3.1the d-acs learning algorithm3.3.2some discussions about the d-acs learning algorithm3.4comparisons with related state-of-the-arts3.5simulations and results3.5.1experimental results on hunter game3.5.2experimental results on traveling salesman problem3.6conclusionsbibliographychapter 4action conversion mechanism in multiagent reinforcement learning4.1introduction4.2model-based reinforcement learning4.2.1dyna-q architecture4.2.2prioritized sweeping method4.2.3minimax search and reinforcement learning4.2.4rtp-q learning4.3the q-ac multiagent reinforcement learning4.3.1task model4.3.2converting action4.3.3multiagent cooperation methods4.3.4q-value update4.3.5the q-ac learning algorithm4.3.6using adversarial action instead o{ ~ probability exploration4.4simulations and results4.5conclusionsbibliographychapter 5multiagent learning approaches applied to vehicle routing problems5.1introduction5.2related state-of-the-arts5.2.1some heuristic algorithms5.2.2the vehicle routing problem with time windows5.3the multiagent learning applied to cvrp and vrptw5.4simulations and results5.5conclusionsbibliographychapter 6multiagent learning methods applied to multicast routing problems6.1introduction6.2multiagent q-learning applied to the network routing6.2.1investigation into q-routing6.2.2antnet investigation6.3some multicast routing in mobile ad hoc networks6.4the multiagent q-learning in the q-map multicast routing method6.4.1overview of the q-map multicast routing6.4.2join query packet, join reply packet and membership maintenance6.4.3convergence proof of q-map method6.5simulations and results6.6conclusionsbibliographychapter 7multiagent reinforcement learning for supply chain management7.1introduction7.2related issues of supply chain management7.3scm network scheme with multiagent reinforcement learning7.3.1scm with multiagent7.3.2the rl agents in scm network7.4application of the q-acs method to scm7.4.1the application model in scm7.4.2the q-acs learning applied to the scm system7.5conclusionbibliographychapter 8multiagent learning applied in supply chain ordering management8.1introduction8.2supply chain management model8.3the multiagent learning model for sc ordering management8.4simulations and results8.5conclusionsbibliography
计算机应用基础(第四版) 内容简介 本书介绍了计算机的软件系统和硬件系统、组成结构、工作原理等基础知识以及相关的新型设备与先进技术,包括微机操作系统,常用操作知...
Scikit-Learn与TensorFlow机器学习实用指南 本书特色 TensorFlow是一个采用数据流图(data flow graphs),用于数值计...
《重复数据删除技术:面向大数据管理的缩减技术》内容简介:本书面向从事大数据存储系统设计及相关技术研究和开发工作的读者。既可
The Adobe lllustrator CS6 WOW!Book 本书特色 多年来,Sharon Stever和她的国际化WOW!团队一直致力于在全球范围内...
复杂互联系统与网络鲁棒性研究 本书特色 本书致力于介绍复杂互联系统与复杂网络鲁棒性研究的基础知识和研究进展。由于该领域相关研究内容繁多,因此本书主要介绍复杂网络...
《汉字就是这么来的·走进汉字世界》内容简介:朱永新、王宁、康震、周益民推荐给孩子的靠谱趣味汉字书,帮孩子轻松搞定大语文汉字
Sincetheturnofthetwentiethcentury,telecommunicationshasshiftedfromtraditionalvoi...
《深入理解OpenCV(原书第3版)》内容简介:本书(现在是第3版)是计算机视觉工程师使用OpenCV作为工具的系列丛书之一。本书保留了
《历史文化名城名镇名村系列:焦溪村》内容简介:焦溪古村位于常州市天宁区郑陆镇,地处常州、无锡、江阴三市交界处,完整地保留了
GetuptospeedontheprincipaltechnologiesintheJavaPlatform,EnterpriseEdition7,andle...
从0到1 HTML+CSS快速上手(微视频版) 本书特色 作者根据自己多年的网站开发及教学经验,站在零基础读者的角度,详细介绍了HTML和CSS的基础知识,以及...
多传感器图像融合技术及应用 本书特色 本书以图像融合技术的发展历程为主线,系统介绍了图像融合的基本概念、融合原理、融合方法、*新研究进展及应用实例。?全书共11...
全国计算机等级考试一级教程-计算机基础及WPS Office应用-(2018年版) 本书特色 本书是根据《全国计算机等级考试一级WPS Office考试大纲(2...
本书论述了信息检索的有关概念与基本知识,以及Internt重要的中外文搜索引擎与检索技巧,介绍了网上各类型电子信息和重要专题信息
《打开:周濂的100堂西方哲学课》内容简介:★100篇有趣、有料,不高冷、不轻佻的哲学普及文章;一部有营养、有态度,读得懂、读得
《商品美工实训》内容简介:《商品美工实训》是一本岗位项目实训教材,本书根据电子商务公司美工部门的岗位设置和技能要求整合课程
《向内求:认识自己的成长法则》内容简介:许多企业管理者、职业经理人在日常的管理工作中,除了要不断磨练自己的业务能力,还需要
数据结构-导教.导学.导考(C语言版)(第2版) 本书特色 本书是为配合严蔚敏、吴伟民编著的《数据结构》(C语言版)而编写的辅助教材。书中首先给出重点内容提要和...
中文版Word 2003图文排版专业技能培训教程-职场制胜 本书特色 本书是电脑专业技能培训教程系列之一,它集多位word图文设计专家的实践经验,总结出一条图文...
这是一本介绍软件管理的小品文集。全书分为45章,每章就是一个独立的专题或者知识点。本书内容十分丰富全面,小到项目负责人制订