Reinforcement learning, one of the most active research areas in artificial intelligence, is a computational approach to learning whereby an agent tries to maximize the total amount of reward it receives when interacting with a complex, uncertain environment. In Reinforcement Learning, Richard Sutton and Andrew Barto provide a clear and simple account of the key ideas and algorithms of reinforcement learning. Their discussion ranges from the history of the field's intellectual foundations to the most recent developments and applications. The only necessary mathematical background is familiarity with elementary concepts of probability.The book is divided into three parts. Part I defines the reinforcement learning problem in terms of Markov decision processes. Part II provides basic solution methods: dynamic programming, Monte Carlo methods, and temporal-difference learning. Part III presents a unified view of the solution methods and incorporates artificial neural networks, eligibility traces, and planning; the two final chapters present case studies and consider the future of reinforcement learning.
Buildingonthesuccessofitsstorefrontandfulfillmentservices,Amazonnowallowsbusines...
《高情商沟通力》内容简介:人是感性的动物,只会偶尔的理性,人与人沟通不是为了找一个答案,而是想要多一份理解和认同。本书的独
《移动通信频谱技术与5G频率部署》内容简介:无线电频谱是所有无线电业务的稀缺、关键资源。对移动运营商而言,频谱资源是网络建设
FromtheStoriesofFaithandFameseries-storiesofmenandwomenwhowentallovertheworldwit...
ErnestW.Adams是一名美国游戏设计顾问,现定居于英国。除顾问工作外,他还开办游戏设计研讨班,并在各种会议和大学中发表演讲,广
《文化模式批判》内容简介:本书中,文化被逻辑地推导为连接主体和客体的创造存在的实践活动中介,是一种使得实践便利化和高效化的
《FlashActionScript3.0动画高级教程》是介绍Flash10ActionScript动画高级技术的经典之作,是作者在这一领域中多年实践经验的结晶
《Android群英传》对具有一定Android开发基础的读者,以通俗易懂的语言介绍了Android开发的进阶技巧。《Android群英传》共分为13
《大规模数据分析和建模:基于Spark与R》内容简介:这本书的目的是帮助所有人通过R使用Apache Spark。第1章~第5章,简单地介绍了如
《全国计算机等级考试教程:二级MS Office高级应用》内容简介:本书依据教育部考试中心最新发布的《全国计算机等级考试大纲》以及作
《我家走出四博士》内容简介:本书是一部包括教育智慧、教育艺术的家庭教育指导书。本书作者李振霞在养育四个孩子的漫长过程中不断
批处理在提高WINDOWS管理效率中的神奇应用 本书特色 本书作者结合多年的理论与实践知识,针对于系统管理员和网络管理员精心策划了这本书。本书将dos命令与批处...
你的人生,只是缺乏設計!每一個生活上的煩惱,都有一種設計上的方法可以解決。讓設計回到日常生活,讓設計幫你製造幸福!設計的
《OPNETModeler与网络仿真》旨在帮助读者在阅读软件帮助文件时,更方便快捷地使用OPNETModeler(下文将其简称为OPNET)。全书共分为
《在苍茫中点灯(珍藏版)》内容简介:继《掬水月在手》之后,《在苍茫中点灯》是陈春花老师的第二本散文集。散文中穿插着各种管理
李蕙蓁│研究所專研生態與觀光遊憩,喜愛藝術、設計、攝影,曾在望安與海龜結下不解之緣,擁有豐富的「龜」收藏。曾任報紙、雜誌
《服务市场营销(第二版)》内容简介:《服务市场营销(第2版)》以市场营销的基本原理为指导 ,以服务领域为研究重点,深入浅出地
最权威的Python教程,由Python作者GuidovanRossum主笔,有少许学院味道。中文电子版由刘鑫、李梦夷翻译。英文原稿网址:http://d
《不懂财报就当不好经理》内容简介:随着市场经济的快速发展,无论是企业经营者还是普通职员,读懂财务报表都是一件非常有必要的事
《人间草木:汪曾祺写北京》内容简介:本书主要收录了作者在北京时创作的作品。他墨写出了草木山川、花鸟虫鱼的人味,写出了乡情民