多主体的研究与应用是近年来备受关注的热点领域,多主体强化学习理论与方法、多主体协作策略的研究是该领域重要研究方向,其理论和应用价值极为广泛,备受广大从事计算机应用、人工智能、自动控制、以及经济管理等领域研究者的关注。本书清晰地介绍了多主体、强化学习及多主体协作等基本概念和基础内容,明确地阐述了有关多主体强化学习、协作策略研究的发展过程及*新动向,深入地探讨了多主体强化学习与协作策略的理论与方法,具体地分析了多主体强化学习与协作策略在相关研究领域的应用方法。全书系统脉络清晰、基本概念清楚、图表分析直观,注重内容的体系化和实用性。通过本书的阅读和学习,读者即可掌握多主体强化学习及协作策略的理论和方法,更可了解在实际工作中应用这些研究成果的手段。 本书可作为从事计算机应用、人工智能、自动控制、以及经济管理等领域研究者的学习和阅读参考,同时高等院校相关专业研究生以及人工智能爱好者也可从中获得借鉴。
多主体的研究与应用是近年来备受关注的热点领 域,多主体强化学习理论与方法、多主体协作策略的 研究是该领域重要研究方向,其理论和应用价值极为 广泛,备受广大从事计算机应用、人工智能、自动控 制、以及经济管理等领域研究者的关注。孙若莹、赵 刚所著的《多主体强化学习协作策略研究》清晰地介 绍了多主体、强化学习及多主体协作等基本概念和基 础内容,明确地阐述了有关多主体强化学习、协作策 略研究的发展过程及*新动向,深入地探讨了多主体 强化学习与协作策略的理论与方法,具体地分析了多 主体强化学习与协作策略在相关研究领域的应用方法 。 全书系统脉络清晰、基本概念清楚、图表分析直 观,注重内容的体系化和实用性。通过本书的阅读和 学习,读者即可掌握多主体强化学习及协作策略的理 论和方法,更可了解在实际工作中应用这些研究成果 的手段。本书可作为从事计算机应用、人工智能、自 动控制、以及经济管理等领域研究者的学习和阅读参 考,同时高等院校相关专业研究生以及人工智能爱好 者也可从中获得借鉴。
chapter 1introduction1.1reinforcement learning1.1.1generality of reinforcement learning1.1.2reinforcement learning on markov decision processes1.1.3integrating reinforcement learning into agent architecture1.2multiagent reinforcement learning1.2.1multiagent systems1.2.2reinforcement learning in multiagent systems1.2.3learning and coordination in multiagent systems1.3ant system for stochastic combinatorial optimization1.3.1ants forage behavior1.3.2ant colony optimization1.3.3max-min ant system1.4motivations and consequences1.5book summarybibliographychapter 2reinforcement learning and its combination with ant colony system2.1introduction2.2investigation into reinforcement learning and swarm intelligence2.2.1temporal differences learning method2.2.2active exploration and experience replay in reinforcement learning2.2.3ant colony system for traveling salesman problem2.3the q-acs multiagent learning method2.3.1the q-acs learning algorithm2.3.2some properties of the q-acs learning method2.3.3relation with ant-q learning method2.4simulations and results2.5conclusionsbibliographychapter 3multiagent learning methods based on indirect media information sharing3.1introduction3.2the multiagent learning method considering statistics features3.2.1accelerated k-certainty exploration3.2.2the t-acs learning algorithm3.3the heterogeneous agents learning3.3.1the d-acs learning algorithm3.3.2some discussions about the d-acs learning algorithm3.4comparisons with related state-of-the-arts3.5simulations and results3.5.1experimental results on hunter game3.5.2experimental results on traveling salesman problem3.6conclusionsbibliographychapter 4action conversion mechanism in multiagent reinforcement learning4.1introduction4.2model-based reinforcement learning4.2.1dyna-q architecture4.2.2prioritized sweeping method4.2.3minimax search and reinforcement learning4.2.4rtp-q learning4.3the q-ac multiagent reinforcement learning4.3.1task model4.3.2converting action4.3.3multiagent cooperation methods4.3.4q-value update4.3.5the q-ac learning algorithm4.3.6using adversarial action instead o{ ~ probability exploration4.4simulations and results4.5conclusionsbibliographychapter 5multiagent learning approaches applied to vehicle routing problems5.1introduction5.2related state-of-the-arts5.2.1some heuristic algorithms5.2.2the vehicle routing problem with time windows5.3the multiagent learning applied to cvrp and vrptw5.4simulations and results5.5conclusionsbibliographychapter 6multiagent learning methods applied to multicast routing problems6.1introduction6.2multiagent q-learning applied to the network routing6.2.1investigation into q-routing6.2.2antnet investigation6.3some multicast routing in mobile ad hoc networks6.4the multiagent q-learning in the q-map multicast routing method6.4.1overview of the q-map multicast routing6.4.2join query packet, join reply packet and membership maintenance6.4.3convergence proof of q-map method6.5simulations and results6.6conclusionsbibliographychapter 7multiagent reinforcement learning for supply chain management7.1introduction7.2related issues of supply chain management7.3scm network scheme with multiagent reinforcement learning7.3.1scm with multiagent7.3.2the rl agents in scm network7.4application of the q-acs method to scm7.4.1the application model in scm7.4.2the q-acs learning applied to the scm system7.5conclusionbibliographychapter 8multiagent learning applied in supply chain ordering management8.1introduction8.2supply chain management model8.3the multiagent learning model for sc ordering management8.4simulations and results8.5conclusionsbibliography
《自然计算:DNA、量子比特和智能机器的未来》介绍了16位致力于解决计算领域前沿问题的科学家,他们分别在科学、工程金融等领域从
《下一代产品开发:如何提高研发生产率降低成本和缩短开发周期》作者MichaelE.McGrath是国际上产品战略和产品开发领域久负盛名的专
photoshop CS6从入门到精通(全彩版) 本书特色本书讲述了学习photoshop cs6所需的相关知识,主要包括认识photoshop cs6、使用p...
《哥德巴赫猜想》内容简介:本书收集了作者有代表性的纪实文学作品,所有篇章皆是具体人物的展现,所展现人物,皆为中国现当代时期
《20世纪物理学(第3卷)》内容简介:20世纪是物理学的世纪,物理学在20世纪取得了突破性的进展,改变了世界以及世界和人们对世界的
《PHP编程(第4版)》内容简介:PHP是一种被广泛使用的Web编程语言,它简单易用,而且与时俱进,不断进化,提升性能。本书基于PHP
RubyonRailsisthesuper-productivenewwaytodevelopfull-featuredwebapplications.With...
《jQuery 权威指南》内容简介:《jQuery权威指南》配套源代码下载:http://download.csdn.net/source/2960801 由国...
《当我遇见一个人》内容简介:任何事物,如果你觉得它美,那么它一定暗合了某种美的规律。家庭教育也一样,一个孩子从呱呱坠地到健
《C++GUIQt4编程》(第2版)详细讲述了用最新的Qt版本进行图形用户界面应用程序开发的各个方面。前5章主要涉及Qt基础知识,后两个部
《生了卵巢癌,怎么吃》内容简介:我们根据何裕民教授40余年看诊5万余癌症患者的饮食抗癌经验,结合自己20余年从事肿瘤与饮食营养研
《2020—2021年中国制造业创新中心建设蓝皮书(精装版)》内容简介:本书系统地介绍了我国制造业创新中心的建设背景、建设要求和17
《养肝就是养命》内容简介:肝脏是人体的“巨型化工厂”,对人体气血水的输送、机体的排毒有着十分重要的作用,因此肝脏病变容易累
《Grails权威指南》译自由Grails项目负责人GraemeKeithRocher编写的《TheDefinitiveGuidetoGrails》,着重介绍了...
《股市天经(之一):量柱擒涨停(全彩版第2版)》内容简介:本书是我国第一部系统论述股市“量柱”理论及实战技法的著述,也是第一
长谷川敦士博士是日本著名的信息架构学者,他结合多年实践经验,总结出100个网站架构的实用要点。本书旁征博引,图文并茂,结构清
《女性择偶倾向》内容简介:择偶作为一种复杂的社会、文化和心理现象,近年来已成为社会学与心理学炙手可热的研究课题。西方*早展开
《玩法变了:淘宝卖家运赢弱品牌时代》内容简介:目前网店的销售、运营、营销都碰到很多瓶颈,钱不再好赚,流量不再免费的情况下。
本书集Web2.0的发展及特点、Web2.0界面设计模式基本理论、实际模式实践及代码实现等诸多内容于一身,具有很强的实用性。这些内容
P2P借贷形式并非只是一种技术手段,而是理念与方式的革新,展现了金融脱媒和互联网的结合在个人端的巨大能量。在短短几年间,P2P