多主体的研究与应用是近年来备受关注的热点领域,多主体强化学习理论与方法、多主体协作策略的研究是该领域重要研究方向,其理论和应用价值极为广泛,备受广大从事计算机应用、人工智能、自动控制、以及经济管理等领域研究者的关注。本书清晰地介绍了多主体、强化学习及多主体协作等基本概念和基础内容,明确地阐述了有关多主体强化学习、协作策略研究的发展过程及*新动向,深入地探讨了多主体强化学习与协作策略的理论与方法,具体地分析了多主体强化学习与协作策略在相关研究领域的应用方法。全书系统脉络清晰、基本概念清楚、图表分析直观,注重内容的体系化和实用性。通过本书的阅读和学习,读者即可掌握多主体强化学习及协作策略的理论和方法,更可了解在实际工作中应用这些研究成果的手段。 本书可作为从事计算机应用、人工智能、自动控制、以及经济管理等领域研究者的学习和阅读参考,同时高等院校相关专业研究生以及人工智能爱好者也可从中获得借鉴。
多主体的研究与应用是近年来备受关注的热点领 域,多主体强化学习理论与方法、多主体协作策略的 研究是该领域重要研究方向,其理论和应用价值极为 广泛,备受广大从事计算机应用、人工智能、自动控 制、以及经济管理等领域研究者的关注。孙若莹、赵 刚所著的《多主体强化学习协作策略研究》清晰地介 绍了多主体、强化学习及多主体协作等基本概念和基 础内容,明确地阐述了有关多主体强化学习、协作策 略研究的发展过程及*新动向,深入地探讨了多主体 强化学习与协作策略的理论与方法,具体地分析了多 主体强化学习与协作策略在相关研究领域的应用方法 。 全书系统脉络清晰、基本概念清楚、图表分析直 观,注重内容的体系化和实用性。通过本书的阅读和 学习,读者即可掌握多主体强化学习及协作策略的理 论和方法,更可了解在实际工作中应用这些研究成果 的手段。本书可作为从事计算机应用、人工智能、自 动控制、以及经济管理等领域研究者的学习和阅读参 考,同时高等院校相关专业研究生以及人工智能爱好 者也可从中获得借鉴。
chapter 1introduction1.1reinforcement learning1.1.1generality of reinforcement learning1.1.2reinforcement learning on markov decision processes1.1.3integrating reinforcement learning into agent architecture1.2multiagent reinforcement learning1.2.1multiagent systems1.2.2reinforcement learning in multiagent systems1.2.3learning and coordination in multiagent systems1.3ant system for stochastic combinatorial optimization1.3.1ants forage behavior1.3.2ant colony optimization1.3.3max-min ant system1.4motivations and consequences1.5book summarybibliographychapter 2reinforcement learning and its combination with ant colony system2.1introduction2.2investigation into reinforcement learning and swarm intelligence2.2.1temporal differences learning method2.2.2active exploration and experience replay in reinforcement learning2.2.3ant colony system for traveling salesman problem2.3the q-acs multiagent learning method2.3.1the q-acs learning algorithm2.3.2some properties of the q-acs learning method2.3.3relation with ant-q learning method2.4simulations and results2.5conclusionsbibliographychapter 3multiagent learning methods based on indirect media information sharing3.1introduction3.2the multiagent learning method considering statistics features3.2.1accelerated k-certainty exploration3.2.2the t-acs learning algorithm3.3the heterogeneous agents learning3.3.1the d-acs learning algorithm3.3.2some discussions about the d-acs learning algorithm3.4comparisons with related state-of-the-arts3.5simulations and results3.5.1experimental results on hunter game3.5.2experimental results on traveling salesman problem3.6conclusionsbibliographychapter 4action conversion mechanism in multiagent reinforcement learning4.1introduction4.2model-based reinforcement learning4.2.1dyna-q architecture4.2.2prioritized sweeping method4.2.3minimax search and reinforcement learning4.2.4rtp-q learning4.3the q-ac multiagent reinforcement learning4.3.1task model4.3.2converting action4.3.3multiagent cooperation methods4.3.4q-value update4.3.5the q-ac learning algorithm4.3.6using adversarial action instead o{ ~ probability exploration4.4simulations and results4.5conclusionsbibliographychapter 5multiagent learning approaches applied to vehicle routing problems5.1introduction5.2related state-of-the-arts5.2.1some heuristic algorithms5.2.2the vehicle routing problem with time windows5.3the multiagent learning applied to cvrp and vrptw5.4simulations and results5.5conclusionsbibliographychapter 6multiagent learning methods applied to multicast routing problems6.1introduction6.2multiagent q-learning applied to the network routing6.2.1investigation into q-routing6.2.2antnet investigation6.3some multicast routing in mobile ad hoc networks6.4the multiagent q-learning in the q-map multicast routing method6.4.1overview of the q-map multicast routing6.4.2join query packet, join reply packet and membership maintenance6.4.3convergence proof of q-map method6.5simulations and results6.6conclusionsbibliographychapter 7multiagent reinforcement learning for supply chain management7.1introduction7.2related issues of supply chain management7.3scm network scheme with multiagent reinforcement learning7.3.1scm with multiagent7.3.2the rl agents in scm network7.4application of the q-acs method to scm7.4.1the application model in scm7.4.2the q-acs learning applied to the scm system7.5conclusionbibliographychapter 8multiagent learning applied in supply chain ordering management8.1introduction8.2supply chain management model8.3the multiagent learning model for sc ordering management8.4simulations and results8.5conclusionsbibliography
Functionalprogramming(FP)isaprogrammingstyleemphasizingfunctionsthatreturnconsis...
《幸福的重建:回归疗法入门(第2版)》内容简介:人人都试图追寻幸福,却往往被各种烦恼所羁绊,在人生中迷失方向,忘记初心。著名
《生活体验研究》旨在介绍如何从事现象学实践和写作。马克斯·范梅南在书中推出了在教育学和与人相关的诸如心理咨询、护理、卫生
《如何专业做采购》内容简介:作为专业采购必须有能力回答4大核心问题: 为什么选择这家供应商? 为什么是这个价格? 如何通过合同
芬兰是全世界创意经济的先进国家,其极简的设计早已闻名全球,而且,在芬兰,设计不只是艺术家的事,全民都具有设计意识。这本书
TherevisedqualitymanagementsystemsISO9001:2000wasputinplaceinDecember2000.Therei...
《你不知道的JavaScript(中卷)》内容简介:JavaScript这门语言简单易用,很容易上手,但其语言机制复杂微妙,即使是经验丰富的Ja
Themostcomprehensiveguideavailableontherapidly-expandingfieldofHCI,thisbookillus...
《觅我游踪:汪曾祺记游》内容简介:本书精选作者多地的行旅、记游散文四十余篇,并配以汪曾祺亲绘插图十余幅,以记游为线索,立体
《十力语要初续》内容简介:本书乃《十力语要》的续编,仍沿用《十力语要》旧例,辑录书札、论文、杂文等总计四十二篇,是了解熊十
機器人端咖啡,電腦當醫生,數據分析愈來愈便利精準,我們以為科技將創造新一波繁榮,卻低估了它推動世界變遷的速度!機器開始全
本书介绍各种交换技术的基本概念和工作原理。全书共分12章,内容涵盖目前通信网中应用到的各类交换系统。主要内容包括:交换的基
《与渴望联结(全7册)》内容简介:正如身体的健康需要物质营养,孩子心灵的成长与心理力量的强大必须获取足够的心理营养。在成长的
《AI的25种可能》内容简介:世界上最聪明的网站Edge,每年一次,让100位全球最伟大的头脑坐在同一张桌子旁,共同解答关乎人类命运的
《新技术 新业态:进化中的监管科技及其应用》内容简介:本书介绍了监管科技的起源和技术框架,对国外金融发达经济体监管科技的发展
Progressiveenhancementisanapproachtowebdevelopmentthataimstodeliverthebestpossib...
《数据结构简明教程(第2版·微课版)》内容简介:本书内容包括概论、线性表、栈和队列、串、数组和稀疏矩阵、树和二叉树、图、查找
自從數位科技介入當代藝術,一連串最啟人疑竇的問題諸如:怎樣的作品可以被稱為(當代)藝術?挪用與剽竊之間的區別為何?藝術的
《纸上喂马,心上喂鹿》内容简介:西藏神秘行吟诗人十年一剑之作!一本散发着文字高烧的时光情书。西藏的神秘“行吟诗人”李初初,
《Java EE核心框架实战》内容简介:本书旨在提高读者的学习效率,增强其项目实战能力。为此,本书摒弃了软件公司中不常用或不实用的