机器学习与预测分析正在改变企业和其他组织的运作方式,本书将带领读者进入预测分析的世界。全书共13章,除了简要介绍机器学习及Python在机器学习中的应用,还系统讲述了数据分类、数据预处理、模型优化、集成学习、回归、聚类、神经网络、深度学习等内容。本书将机器学习背后的基本理论与应用实践联系起来,通过这种方式让读者聚焦于如何正确地提出问题、解决问题。本书讲解了如何使用Python的核心元素以及强大的机器学习库,同时还展示了如何正确使用一系列统计模型。本书可作为学习数据科学的初学者及想进一步拓展数据科学领域认识的读者的参考书。同样,本书也适合计算机等相关专业的本科生、研究生阅读。
机器学习与预测分析正在改变企业和其他组织的运作方式,本书将带领读者进入预测分析的世界。全书共13章,除了简要介绍机器学习及Python在机器学习中的应用,还系统讲述了数据分类、数据预处理、模型优化、集成学习、回归、聚类、神经网络、深度学习等内容。本书将机器学习背后的基本理论与应用实践联系起来,通过这种方式让读者聚焦于如何正确地提出问题、解决问题。本书讲解了如何使用Python的核心元素以及强大的机器学习库,同时还展示了如何正确使用一系列统计模型。本书可作为学习数据科学的初学者及想进一步拓展数据科学领域认识的读者的参考书。同样,本书也适合计算机等相关专业的本科生、研究生阅读。
作 者 简 介Sebastian Raschka是密歇根州立大学的博士生,他在计算生物学领域提出了几种新的计算方法,还被科技博客Analytics Vidhya评为GitHub上具影响力的数据科学家。他有一整年都使用Python进行编程的经验,同时还多次参加数据科学应用与机器学习领域的研讨会。正是因为Sebastian 在数据科学、机器学习以及Python等领域拥有丰富的演讲和写作经验,他才有动力完成此书的撰写,目的是帮助那些不具备机器学习背景的人设计出由数据驱动的解决方案。
他还积极参与到开源项目中,由他开发完成的计算方法已经被成功应用到了机器学习竞赛(如Kaggle等)中。在业余时间,他沉醉于构建体育运动的预测模型,要么待在电脑前,要么在运动。
首先,我要感谢Arun Ross和Pang-Ning Tan教授,以及那些曾经启发我并激起我在模式分类、机器学习、数据挖掘领域兴趣的人。
我还想借此机会对Python社区和开源包的开发者表示感谢,他们帮助我创建了一个用于科学研究和数据科学的完美开发环境。
在此,还要特别感谢scikit-learn的核心开发人员。作为此项目的一个参与者,我有幸与这些极客合作,他们不仅对机器学习有着深入的了解,同时还都是非常出色的程序员。作 者 简 介Sebastian Raschka是密歇根州立大学的博士生,他在计算生物学领域提出了几种新的计算方法,还被科技博客Analytics Vidhya评为GitHub上具影响力的数据科学家。他有一整年都使用Python进行编程的经验,同时还多次参加数据科学应用与机器学习领域的研讨会。正是因为Sebastian 在数据科学、机器学习以及Python等领域拥有丰富的演讲和写作经验,他才有动力完成此书的撰写,目的是帮助那些不具备机器学习背景的人设计出由数据驱动的解决方案。
他还积极参与到开源项目中,由他开发完成的计算方法已经被成功应用到了机器学习竞赛(如Kaggle等)中。在业余时间,他沉醉于构建体育运动的预测模型,要么待在电脑前,要么在运动。
首先,我要感谢Arun Ross和Pang-Ning Tan教授,以及那些曾经启发我并激起我在模式分类、机器学习、数据挖掘领域兴趣的人。
我还想借此机会对Python社区和开源包的开发者表示感谢,他们帮助我创建了一个用于科学研究和数据科学的完美开发环境。
在此,还要特别感谢scikit-learn的核心开发人员。作为此项目的一个参与者,我有幸与这些极客合作,他们不仅对机器学习有着深入的了解,同时还都是非常出色的程序员。
后,我还要感谢所有对本书感兴趣的读者,也真心希望我的热情能够感染大家一起加入到Python与机器学习社区中来。
《看图学八卦掌(视频学习版)》内容简介:本书首先对八卦掌的由来、特点、练习要点和动作进行了介绍,接着对包括掌法、步法、桩功
《SQL权威指南(第4版)》为SQL名著中文版,兼顾技术与实践,全面细致介绍高级技术,致力于打造SQL编程专家。《SQL权威指南(第4版)
《一本书看透价值投资》内容简介:在本书中,两位作者根据自身近20余的价值投资实战经验,分享如何去判断一家企业的价值,如何挖掘
《数据挖掘(第2版)》较全面系统地介绍了数据挖掘中常用和常见的数据挖掘方法,以及文本与视频数据挖掘方法。《数据挖掘(第2版)》
《ES6标准入门(第2版)》内容简介:ES6(又名ES2105)是JavaScript语言的新标准,2015年6月正式发布后,得到了迅速推广,是目前业
《终身写作》内容简介:本书系统阐述了有关写作的理念、思维和方法论,内容包括写作认知、观点打磨、框架思维、内容填充、故事能力
《中国外资银行百年史(1845-1949)》内容简介:近代中国的外资银行是指以完全或部分外国资本在中国境内经营银行业务的金融机构,包
《日本在近代中国的投资》内容简介:日本对华侵略触及两国关系的各个领域,经济侵略与掠夺是不可忽视的方面。本书挖掘了大量档案文
《数据中台:赋能企业实时经营与商业创新》内容简介:随着数字化的浪潮席卷而来,无论是个人还是企业,相信都已经真切地感受到了数
自從數位科技介入當代藝術,一連串最啟人疑竇的問題諸如:怎樣的作品可以被稱為(當代)藝術?挪用與剽竊之間的區別為何?藝術的
《高等学校教材•通信电子电路》主要讨论用于各种无线电技术设备和系统中的通信电子电路,包括噪声与干扰、高频放大电路、正弦波振
Y染色体由于其单倍体特性和群体特异性分布,成为分子人类学研究最有力的工具。利用Y染色体可以很好地解析种族的起源、民族的分化
《河北上市公司财务发展报告(2016)》内容简介:本书以河北上市公司作为具体研究对象,从公司筹资、投资、资金运营、业绩及履行社
《数据资产论》内容简介:数据创造价值的过程,就是数据资源资产化的伟大历程! 本书试图回答以下问题:数据如何产生价值?纯粹而孤
《追风骑兵》内容简介:1942年,日军集结五万大军,重重包围了八路军太行山根据地。日军特战部队伪装成八路军新六旅,兵分两路,一
CLR via C#-(第4版) 本书特色 李希特编著的《clr via c#(第4版)》针对 clr和.net framework 4.5进行深入、全面的探讨...
JenniferCampbell是多伦多大学计算机科学系高级讲师,本书所基于的课程就是由她创建的。PaulGries是多伦多大学计算机科学系高级讲
《Office 2013办公应用从入门到精通》内容简介:本书是指导初学者学习Office 2013的入门书籍。书中详细地介绍了初学者学习Office20
《中医的常识》内容简介:★学习中医的收获:在目前的生活状态下做贵人 ★普通人如何学习中医——有自知之明、自觉之感,方有慧心之
《Matlab R2016a从入门到精通》内容简介:本书讲述的内容是使用MATLAB进行科学研究、系统仿真、数据分析与处理的必备知识。通过全面