多主体的研究与应用是近年来备受关注的热点领域,多主体强化学习理论与方法、多主体协作策略的研究是该领域重要研究方向,其理论和应用价值极为广泛,备受广大从事计算机应用、人工智能、自动控制、以及经济管理等领域研究者的关注。本书清晰地介绍了多主体、强化学习及多主体协作等基本概念和基础内容,明确地阐述了有关多主体强化学习、协作策略研究的发展过程及*新动向,深入地探讨了多主体强化学习与协作策略的理论与方法,具体地分析了多主体强化学习与协作策略在相关研究领域的应用方法。全书系统脉络清晰、基本概念清楚、图表分析直观,注重内容的体系化和实用性。通过本书的阅读和学习,读者即可掌握多主体强化学习及协作策略的理论和方法,更可了解在实际工作中应用这些研究成果的手段。 本书可作为从事计算机应用、人工智能、自动控制、以及经济管理等领域研究者的学习和阅读参考,同时高等院校相关专业研究生以及人工智能爱好者也可从中获得借鉴。
多主体的研究与应用是近年来备受关注的热点领 域,多主体强化学习理论与方法、多主体协作策略的 研究是该领域重要研究方向,其理论和应用价值极为 广泛,备受广大从事计算机应用、人工智能、自动控 制、以及经济管理等领域研究者的关注。孙若莹、赵 刚所著的《多主体强化学习协作策略研究》清晰地介 绍了多主体、强化学习及多主体协作等基本概念和基 础内容,明确地阐述了有关多主体强化学习、协作策 略研究的发展过程及*新动向,深入地探讨了多主体 强化学习与协作策略的理论与方法,具体地分析了多 主体强化学习与协作策略在相关研究领域的应用方法 。 全书系统脉络清晰、基本概念清楚、图表分析直 观,注重内容的体系化和实用性。通过本书的阅读和 学习,读者即可掌握多主体强化学习及协作策略的理 论和方法,更可了解在实际工作中应用这些研究成果 的手段。本书可作为从事计算机应用、人工智能、自 动控制、以及经济管理等领域研究者的学习和阅读参 考,同时高等院校相关专业研究生以及人工智能爱好 者也可从中获得借鉴。
chapter 1introduction1.1reinforcement learning1.1.1generality of reinforcement learning1.1.2reinforcement learning on markov decision processes1.1.3integrating reinforcement learning into agent architecture1.2multiagent reinforcement learning1.2.1multiagent systems1.2.2reinforcement learning in multiagent systems1.2.3learning and coordination in multiagent systems1.3ant system for stochastic combinatorial optimization1.3.1ants forage behavior1.3.2ant colony optimization1.3.3max-min ant system1.4motivations and consequences1.5book summarybibliographychapter 2reinforcement learning and its combination with ant colony system2.1introduction2.2investigation into reinforcement learning and swarm intelligence2.2.1temporal differences learning method2.2.2active exploration and experience replay in reinforcement learning2.2.3ant colony system for traveling salesman problem2.3the q-acs multiagent learning method2.3.1the q-acs learning algorithm2.3.2some properties of the q-acs learning method2.3.3relation with ant-q learning method2.4simulations and results2.5conclusionsbibliographychapter 3multiagent learning methods based on indirect media information sharing3.1introduction3.2the multiagent learning method considering statistics features3.2.1accelerated k-certainty exploration3.2.2the t-acs learning algorithm3.3the heterogeneous agents learning3.3.1the d-acs learning algorithm3.3.2some discussions about the d-acs learning algorithm3.4comparisons with related state-of-the-arts3.5simulations and results3.5.1experimental results on hunter game3.5.2experimental results on traveling salesman problem3.6conclusionsbibliographychapter 4action conversion mechanism in multiagent reinforcement learning4.1introduction4.2model-based reinforcement learning4.2.1dyna-q architecture4.2.2prioritized sweeping method4.2.3minimax search and reinforcement learning4.2.4rtp-q learning4.3the q-ac multiagent reinforcement learning4.3.1task model4.3.2converting action4.3.3multiagent cooperation methods4.3.4q-value update4.3.5the q-ac learning algorithm4.3.6using adversarial action instead o{ ~ probability exploration4.4simulations and results4.5conclusionsbibliographychapter 5multiagent learning approaches applied to vehicle routing problems5.1introduction5.2related state-of-the-arts5.2.1some heuristic algorithms5.2.2the vehicle routing problem with time windows5.3the multiagent learning applied to cvrp and vrptw5.4simulations and results5.5conclusionsbibliographychapter 6multiagent learning methods applied to multicast routing problems6.1introduction6.2multiagent q-learning applied to the network routing6.2.1investigation into q-routing6.2.2antnet investigation6.3some multicast routing in mobile ad hoc networks6.4the multiagent q-learning in the q-map multicast routing method6.4.1overview of the q-map multicast routing6.4.2join query packet, join reply packet and membership maintenance6.4.3convergence proof of q-map method6.5simulations and results6.6conclusionsbibliographychapter 7multiagent reinforcement learning for supply chain management7.1introduction7.2related issues of supply chain management7.3scm network scheme with multiagent reinforcement learning7.3.1scm with multiagent7.3.2the rl agents in scm network7.4application of the q-acs method to scm7.4.1the application model in scm7.4.2the q-acs learning applied to the scm system7.5conclusionbibliographychapter 8multiagent learning applied in supply chain ordering management8.1introduction8.2supply chain management model8.3the multiagent learning model for sc ordering management8.4simulations and results8.5conclusionsbibliography
媒体推荐“EverybusinessleaderIknowworriesaboutthesamething:Arewemovingfastenough?Theg...
《基于4G系统的移动服务技术》介绍了构建一种前所未有的新的业务提供的方法学、解决方案以及富有前景的深入视角。通过对未来网络
交互设计无处不在!屏幕就在我们身边——电视、电话、电子牌、电子阅读器及电脑。屏幕出现在我们的汽车仪表盘、飞机座椅背面、at
《神探夏洛克·1》内容简介:《神探夏洛克》是近年上映的英剧逸品,主演“卷福”(本尼迪克特康伯巴奇)“花生”(马丁弗瑞曼)凭借
在這個魔法實驗室裡,研究人員像是魔法師般創造驚奇:讓斷腿的人可以跑步登山;讓自閉症患者能夠解讀他人臉部表情;讓汽車在城市
《转型破局:中国十大行业数字化转型践行录》内容简介:在数字化转型过程中遇到的更大的困难则是来自缺乏对数字化转型的深刻理解,
《世界新锐设计师:安特卫普的秘密:当代比利时前卫时装》由江苏美术出版社出版发行,展现了比利时时装崛起的过程,和所不为人知的
Excel 2007公式.函数与图表宝典-(含光盘一张) 内容简介 Excel2007是微软推出的*新电子表格处理软件,界面有了很大变化,在实用性方面有了很大提...
《一分钟管理:影响管理者一生的管理法则(图文版)》内容简介:本书内容涵盖了战略、企业文化、团队建设、用人方法、绩效考核、管
《傅雷家书新编》内容简介:67年前,一位父亲因思念他远隔重洋的孩子写了上百封家书。字字真情,却又害怕孩子觉得厌烦,字里行间带
本书站在一线设计师的视角,完整地展示了新媒体下的UI设计流程和细节技巧。通过主动沟通,素材的设计,草图的绘制,网页端、常用
《Photoshop CS5实战从入门到精通(超值版)》内容简介:《Photoshop CS5实战从入门到精通(超值版)》通过精选案例引导读者深入学
《清华新闻传播学前沿讲座录(2021)》内容简介:“新闻与传播前沿讲座”是清华大学新闻与传播学院面向研究生开设的一门专业课程,
《学设计,非去不可》收录了王千睿、胡佑宗、周育如、施令红、甘泰来、高弘树、赖雨农、黄怡儒、林国基、林怡芬、史明辉、庞铫13位
《神经网络结构优化方法及应用》从RBF网络训练算法、结构分解、结构优化、样本选取等几方面人手,分析了提高神经网络泛化能力和收
UI设计入门一本就够 本书特色 本书紧扣用户界面设计趋势,主要讲解了什么是UI设计,UI设计的原则与理念,UI的文字、图片和图标设计,网页UI设计,移动端UI设...
《PPT炼成记》一书主要讲解的内容包括:了解真正的PPT是怎样的,懂得PPT的基本理念和操作规则,文字设计和编排,如何利用图片来突
《Java虚拟机精讲》内容简介:HotSpot VM是目前市面上高性能JVM的代表作之一,它采用解释器+JIT编译器的混合执行引擎,使得Java程序
《人气女王的沟通智慧》内容简介:有些女人,不开口的时候堪称美女,可是一旦说话却会让人对其印象大打折扣。而另一些女人,她们看
2001年6月,日本国际交流基金会北京事务所和朱锷设计事务所共同策划了一次海报展览会。这部海报作品集中刊登的142幅海报作品是为