Reinforcement learning, one of the most active research areas in artificial intelligence, is a computational approach to learning whereby an agent tries to maximize the total amount of reward it receives when interacting with a complex, uncertain environment. In Reinforcement Learning, Richard Sutton and Andrew Barto provide a clear and simple account of the key ideas and algorithms of reinforcement learning. Their discussion ranges from the history of the field's intellectual foundations to the most recent developments and applications. The only necessary mathematical background is familiarity with elementary concepts of probability.The book is divided into three parts. Part I defines the reinforcement learning problem in terms of Markov decision processes. Part II provides basic solution methods: dynamic programming, Monte Carlo methods, and temporal-difference learning. Part III presents a unified view of the solution methods and incorporates artificial neural networks, eligibility traces, and planning; the two final chapters present case studies and consider the future of reinforcement learning.
Java Web从入门到精通(配光盘)(软件开发视频大讲堂) 本书特色 “软件开发视频大讲堂”丛书系清华社“视频大讲堂”重点大系之一。该大系包括多个子系列,每个...
《解密性传播疾病》内容简介:本书作者从临床工作数十年的经验中收集了50个问题,涉及性病的预防、传播、发现、治疗及生活细节等方
《Ajax高级程序设计(第2版)》是Ajax领域的名著,详细讲解了帧、JavaScript、cookie、XML和XHR如何与Ajax相关,以及具体的Ajax技...
AutoCAD2006实用教程 内容简介 本书详细讲述了AutoCAD2006的常用功能。全书共16章,内容包括AutoCAD2006概述、操作基础、绘图命令、...
《你听懂了没有》内容简介:“妙境只在自己意念的一转换间,人生的陷阱转眼就成为人生的福地。”——戴建业 这本随笔集精选戴教授的
Ajaxhasrevolutionizedthewayusersinteractwithwebpagestoday.Gonearefrustratingpage...
《茶之书:识茶·懂茶·品茶》内容简介:本书以知识性随笔的方式,在介绍最具代表性的各类名茶的同时,加入了足够的关于茶道、茶文
CascadingStyleSheetsenableyoutorapidlycreatewebdesignsthatcanbesharedbyhundredso...
《零基础学单片机C语言程序设计》内容简介:《零基础学单片机C语言程序设计》由浅入深,循序渐进地讲解了C51语言的方方面面。奉书知
Anyonewhoreadsisboundtowonder,atleastoccasionally,abouthowthosefunnysquigglesona...
《外国设计艺术经典论著选读(上下)》主要精选有代表性的外国设计艺术的经典论著,尤以当代的著述为主,每篇均附有作者介绍和导读
《儿童歌曲器乐演奏启蒙——架子鼓》内容简介:《儿童歌曲器乐演奏启蒙》是一套适于乐器初学者使用的简易曲集,包含二胡、古筝、琵
可用性设计是Web设计中最重要也是最困难的一项任务。《点石成金》的作者根据自己多年从业的经验,剖析用户的心理,在用户使用的模
《UML2面向对象分析与设计(第2版)》内容简介:分析和设计是软件开发中至关重要的一环,面向对象的方法是主流的软件开发方法,UML
《计算机科学概论(Python版)》内容简介:本书是美国哈维玛德学院“计算机科学通识”课程的配套教材,用独特的方法介绍计算机科学
SQL Server 从入门到精通(配光盘)(软件开发视频大讲堂) 本书特色 明日科技编著的《SQL Server从入门到精通(附光盘SQL Server200...
《从文字到影像》内容简介:本书在梳理洛特曼艺术符号学基本理论和阐释洛特曼艺术模式化思想的基础上,对艺术文本的意义与符号结构
《经济法》内容简介:本书旨在帮助广大读者进行2015年会计专业技术资格考试的复习备考,其主要功能在于帮助读者准确把握考试重点,
《从西湖到瓦尔登湖》内容简介:课堂与世界何以融汇贯通,答案或在“越读”之中:越,翻越也,亦翻阅也;读,岂独诵书也哉,焉能不
本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信