本书主要框架是基于跨行业数据挖掘标准流程 (CRISP-DM) 这一知识发现 (KDD) 过程模型展开, 其内容主要包括互联网数据 (来自新浪微博、Facebook和Twitter) 的收集、准备、建模、评估和实施, 并利用R软件和Microsoft SQL Server软件在实务案例中进行文本挖掘。
《文本挖掘技术及其应用》包括四个部分。**部分包括两章,介绍常用文本挖掘技术,总结基本流程。第二部分共五章,在r软件上详细介绍了文本挖掘,包括r 软件的简介与安装,文本挖掘所需的基本r包,facebook、微博、twitter、网页等爬虫技术、数据预处理如断词、字词处理、语料库建立等,资料 分析如关联分析、集群分析、主成份分析和聚类分析。第三部分共两章,在ms sql sever上介绍如何实现文本挖掘,**章是数据预处理技术,包括怎么导入文本数据、建立字词与词向量、建立训练集和测试集,第二章在ms sql sever上实现常用的文本数据挖掘方法,并进行图表分析。第四部分为顾问公司和新闻网合作的案例。
《HTML5游戏开发实战》是一本经典的HTML5游戏开发教程,它清晰而全面地展示了如何使用最新的HTML5和CSS3标准来构建各种常见类型的
《智慧工厂技术与应用》内容简介:智慧工厂是现代工厂信息化发展的新阶段,是在数字化工厂的基础上,利用物联网技术和设备监控技术
本书详细地介绍使用TurboGears的丰富特殊性来实现更加快速的Web应用程序开发。主要内容包括TurboGears基础知识、SQLObject与Turb
消费者主权的崛起推动了一场巨大的零售革命,这就是第三次零售革命。它将引领人类的新商业文明和全球经济增长的模式,不管是传统
《奠基:苏联援华156项工程始末》内容简介:1953-1957年,新中国实施了第一个五年计划。以这一时期为主,苏联帮助中国建设了156项工
《往往醉后见天真:回忆傅抱石》内容简介:傅抱石(1904—1905)是我国现代著名国画家、美术史研究和绘画理论家,其艺术成就在中国
《空间信息网络传输协议》内容简介:本书系统、全面地介绍了空间信息网络的特点及其对传输协议造成的影响;重点介绍和讨论了空间信
《一分钟对视,读懂孩子的心》内容简介:本书通过一分钟面对面识人的原创技术和亲子对视的实际咨询案例,帮助3到10岁孩子的父母们提
《软件安全开发指南》内容简介:本书系统性地介绍了OWASP安全组织研究总结的应用安全验证标准,为软件开发过程中的安全控制措施开发
作者简介:中嶋谦互从小学开始学习游戏编程,进入大学后正式参与游戏开发。1996年开发了世界上第一款使用JavaApplet的MMORPG,19
《中国智慧互联投资发展报告(2017)》内容简介:本书围绕智慧互联产业的内涵、体系、政策、技术以及投资发展进行了全方位的分析研
GNUEmacsisthemostpopularandwidespreadoftheEmacsfamilyofeditors.Itisalsothemostpo...
书中以4个面向来表现C++的本质:procedural(程序性的)、generic(泛型的)、object-based(个别对象的)、object-orient...
《MATLAB计算机视觉实战》内容简介:本书以MATLAB8.X汉化版为工具,深入浅出地介绍了基于计算机视觉系统工具箱(ComputerVisionSys
本书取材于各大IT公司历年面试真题(包括笔试题、口试题、电话面试、英语面试,以及逻辑测试和智商测试)。通过精确详细的分类,
《当代设计研究理念》主要内容:设计理念和方法是当今使用者体验研究(UserExperience:Research,中文也译作“用户体验研究”)
《乡土中国》内容简介:该书是费孝通先生的社会学名著,根据其1940年代后期在西南联大和云南大学所讲“乡村社会学”一课的讲义整理
《我有所念人,隔在远远乡》内容简介:在古代,有许许多多让人赞佩的女子,她们聪慧卓绝、精神独立;她们的人生经历让今人津津乐道
《移动Web手册(双色)》主要讲解了移动Web开发和传统PC网站开发的不同之处。作者首先对移动互联网相关的运营商、设备、操作系统
CG进阶-SAI+Photoshop男性动漫角色绘制技法-全彩印刷-含DVD 本书特色 吴博编著的《CG进阶(SAI+Photoshop男性动漫角色绘制技法)》...