多主体的研究与应用是近年来备受关注的热点领域,多主体强化学习理论与方法、多主体协作策略的研究是该领域重要研究方向,其理论和应用价值极为广泛,备受广大从事计算机应用、人工智能、自动控制、以及经济管理等领域研究者的关注。本书清晰地介绍了多主体、强化学习及多主体协作等基本概念和基础内容,明确地阐述了有关多主体强化学习、协作策略研究的发展过程及*新动向,深入地探讨了多主体强化学习与协作策略的理论与方法,具体地分析了多主体强化学习与协作策略在相关研究领域的应用方法。全书系统脉络清晰、基本概念清楚、图表分析直观,注重内容的体系化和实用性。通过本书的阅读和学习,读者即可掌握多主体强化学习及协作策略的理论和方法,更可了解在实际工作中应用这些研究成果的手段。 本书可作为从事计算机应用、人工智能、自动控制、以及经济管理等领域研究者的学习和阅读参考,同时高等院校相关专业研究生以及人工智能爱好者也可从中获得借鉴。
多主体的研究与应用是近年来备受关注的热点领 域,多主体强化学习理论与方法、多主体协作策略的 研究是该领域重要研究方向,其理论和应用价值极为 广泛,备受广大从事计算机应用、人工智能、自动控 制、以及经济管理等领域研究者的关注。孙若莹、赵 刚所著的《多主体强化学习协作策略研究》清晰地介 绍了多主体、强化学习及多主体协作等基本概念和基 础内容,明确地阐述了有关多主体强化学习、协作策 略研究的发展过程及*新动向,深入地探讨了多主体 强化学习与协作策略的理论与方法,具体地分析了多 主体强化学习与协作策略在相关研究领域的应用方法 。 全书系统脉络清晰、基本概念清楚、图表分析直 观,注重内容的体系化和实用性。通过本书的阅读和 学习,读者即可掌握多主体强化学习及协作策略的理 论和方法,更可了解在实际工作中应用这些研究成果 的手段。本书可作为从事计算机应用、人工智能、自 动控制、以及经济管理等领域研究者的学习和阅读参 考,同时高等院校相关专业研究生以及人工智能爱好 者也可从中获得借鉴。
chapter 1introduction1.1reinforcement learning1.1.1generality of reinforcement learning1.1.2reinforcement learning on markov decision processes1.1.3integrating reinforcement learning into agent architecture1.2multiagent reinforcement learning1.2.1multiagent systems1.2.2reinforcement learning in multiagent systems1.2.3learning and coordination in multiagent systems1.3ant system for stochastic combinatorial optimization1.3.1ants forage behavior1.3.2ant colony optimization1.3.3max-min ant system1.4motivations and consequences1.5book summarybibliographychapter 2reinforcement learning and its combination with ant colony system2.1introduction2.2investigation into reinforcement learning and swarm intelligence2.2.1temporal differences learning method2.2.2active exploration and experience replay in reinforcement learning2.2.3ant colony system for traveling salesman problem2.3the q-acs multiagent learning method2.3.1the q-acs learning algorithm2.3.2some properties of the q-acs learning method2.3.3relation with ant-q learning method2.4simulations and results2.5conclusionsbibliographychapter 3multiagent learning methods based on indirect media information sharing3.1introduction3.2the multiagent learning method considering statistics features3.2.1accelerated k-certainty exploration3.2.2the t-acs learning algorithm3.3the heterogeneous agents learning3.3.1the d-acs learning algorithm3.3.2some discussions about the d-acs learning algorithm3.4comparisons with related state-of-the-arts3.5simulations and results3.5.1experimental results on hunter game3.5.2experimental results on traveling salesman problem3.6conclusionsbibliographychapter 4action conversion mechanism in multiagent reinforcement learning4.1introduction4.2model-based reinforcement learning4.2.1dyna-q architecture4.2.2prioritized sweeping method4.2.3minimax search and reinforcement learning4.2.4rtp-q learning4.3the q-ac multiagent reinforcement learning4.3.1task model4.3.2converting action4.3.3multiagent cooperation methods4.3.4q-value update4.3.5the q-ac learning algorithm4.3.6using adversarial action instead o{ ~ probability exploration4.4simulations and results4.5conclusionsbibliographychapter 5multiagent learning approaches applied to vehicle routing problems5.1introduction5.2related state-of-the-arts5.2.1some heuristic algorithms5.2.2the vehicle routing problem with time windows5.3the multiagent learning applied to cvrp and vrptw5.4simulations and results5.5conclusionsbibliographychapter 6multiagent learning methods applied to multicast routing problems6.1introduction6.2multiagent q-learning applied to the network routing6.2.1investigation into q-routing6.2.2antnet investigation6.3some multicast routing in mobile ad hoc networks6.4the multiagent q-learning in the q-map multicast routing method6.4.1overview of the q-map multicast routing6.4.2join query packet, join reply packet and membership maintenance6.4.3convergence proof of q-map method6.5simulations and results6.6conclusionsbibliographychapter 7multiagent reinforcement learning for supply chain management7.1introduction7.2related issues of supply chain management7.3scm network scheme with multiagent reinforcement learning7.3.1scm with multiagent7.3.2the rl agents in scm network7.4application of the q-acs method to scm7.4.1the application model in scm7.4.2the q-acs learning applied to the scm system7.5conclusionbibliographychapter 8multiagent learning applied in supply chain ordering management8.1introduction8.2supply chain management model8.3the multiagent learning model for sc ordering management8.4simulations and results8.5conclusionsbibliography
本书阐述了关系模型背后的根本原则,这些原则也是所有数据库(后备应用软件)的应用基础,因为这些原则,今天的计算机世界才得以
《有效制订年度经营计划》内容简介:这是一本实用的工具书,阐述了一个全面、系统的年度经营计划制订的过程,以及企业如何利用年
本书作者HarleyHahn从20世纪80年代开始,亲身体验了几平整个UDIX以及Linux操作系统的发展历史。他所著的Unix和Linux教程,秉承了
移动学习理论与实践 本书特色 《移动学习理论与实践》通过对移动学习的理论分析,探讨了与其紧密相关的技术问题及实现模式,并通过案例详细介绍了移动学习系统的构建过程...
《美国留学移民全攻略》内容简介:《海外留学指南系列:美国留学移民全攻略》的主要目标读者定位于留学方面,以国内接受过中等教育、
《写给系统管理员的Python脚本编程指南》内容简介:本书是一本介绍Python编程的进阶图书,包含了大量关于Python脚本设计的主题。本
《数据结构简明教程(第2版·微课版)》内容简介:本书内容包括概论、线性表、栈和队列、串、数组和稀疏矩阵、树和二叉树、图、查找
《浪花礼赞:汪氏现当代名人录》内容简介:本书主要辑录了现当代为国家建功立业而呕心沥血、殚精竭虑、鞠躬尽瘁、忠心耿耿、赤胆忠
《民法总则:具体与抽象》内容简介:既有民法总则本体的介绍和阐释,也有民法与宪法、商法、知识产权法、行政法、民事诉讼法之间关
《跨界战争——商业重组与社会巨变》内容简介:本书是一本适合于大众阅读的经济类科普读物。作者以朴素而敏锐的眼光观察问题,以简
《你离成功有多远》内容简介:十余年摸爬滚打的工作经历,从基层员工到公司副总经理的升迁轨迹,作者在其丰富的工作经历中,亲身经历和
《谈医说病》内容简介:渡边淳一以对谈方式,与日本医学专家探讨不孕症、腰膝痛、眼疾、流感、类风湿病、花粉症、糖尿病、特应性皮
P精斩极专业PPT精髓-附赠10GB 超豪华PPT资源包 本书特色 《p精斩极:专业ppt精髓》主要针对ppt 中的逻辑结构、版式制作、配色方案、图表设...
Visual Basic程序设计 本书特色 为了适应信息化时代的需求,各高校对大多数专业都开设了一定的计算机语言课程,有的讲授C或C++语言,有的讲授Visua...
计算机网络 内容简介 本书由浅入深地阐述了计算机网络技术的一些基本概念和基本原理,介绍了当前常用的先进的网络技术以及网络的实际应用,反映了计算机网络技术的一些*...
吴伟定,网名Windear,首届中文搜索引擎优化(SEO)大赛三等奖得主,擅长于品牌操作以及各种网络营销手段。现任中赫技术投资控股有
本书详细地讨论了如何编写健壮高效的代码以及模块设计技术。本书采用了自问自答的语言风格,它讨论了实际程序设计中普遍存在的,
《从公司到国家:美国制度困局的历史解释》内容简介:本书通过对美国制度的建立进行探源与复盘,提出了美国是“公司型国家”的观点
《林汉涛鸡血玉篆刻艺术》内容简介:本书收录了林汉涛2010—2015年间采用硬玉(绝大多数为鸡血玉)创作的篆刻作品六十余件,以及书
《人工神经网络理论.设计及应用》系统地论述了人工神经网络的主要理论和设计基础,给出了大量应用实例,旨在使读者了解神经网络的