本书主要框架是基于跨行业数据挖掘标准流程 (CRISP-DM) 这一知识发现 (KDD) 过程模型展开, 其内容主要包括互联网数据 (来自新浪微博、Facebook和Twitter) 的收集、准备、建模、评估和实施, 并利用R软件和Microsoft SQL Server软件在实务案例中进行文本挖掘。
《文本挖掘技术及其应用》包括四个部分。**部分包括两章,介绍常用文本挖掘技术,总结基本流程。第二部分共五章,在r软件上详细介绍了文本挖掘,包括r 软件的简介与安装,文本挖掘所需的基本r包,facebook、微博、twitter、网页等爬虫技术、数据预处理如断词、字词处理、语料库建立等,资料 分析如关联分析、集群分析、主成份分析和聚类分析。第三部分共两章,在ms sql sever上介绍如何实现文本挖掘,**章是数据预处理技术,包括怎么导入文本数据、建立字词与词向量、建立训练集和测试集,第二章在ms sql sever上实现常用的文本数据挖掘方法,并进行图表分析。第四部分为顾问公司和新闻网合作的案例。
《金砖国家金融合作研究》内容简介:进入21世纪,西方国家经济发展持续疲弱,金砖国家逆势而起。金砖国家不仅是五个具有多样性和互
本书涵盖了现代微处理器编译器的设计和实现方面的所有高级主题。本书首先介绍编译器的结构、符号表管理、中间代码结构、运行时支
用户界面设计:有效的人机交互策略(第五版),ISBN:9787121128929,作者:(美)施耐德曼,(美)普莱萨特著,张国印等译目录
《完美主义扼杀效率》内容简介:工作的目标是成果,而不是完美! 33个完美主义思维误区! 日本上班族人手一本!做出成果只需抓住20
TheWebisincreasinglyhappeninginrealtime.WithsitessuchasFacebookandFriendFeedlead...
《图灵的大教堂》内容简介:1936年,时年24岁的图灵宣称:“发明一台可用于计算任意可计算序列的单一机器是有可能的。”在《图灵的
《汽车构造原理快速入门30天(彩色图解版)》内容简介:《汽车构造原理快速入门30天》是汽车基础知识和汽车新技术的普及读物,以“
ImportantnewinsightsintohowvariouscomponentsandsystemsevolvedPremisedontheideath...
《编排设计》由余青青编著。编排设计是现代艺术设计的重要组成部分,也是视觉传达的重要手段。它既是一门具有相对独立性的艺术,
本书系“世纪人文系列丛书”之“袖珍经典”中的一种。所谓分类,是指人们把事物,事件以及有关世界的事实划分成类和种,使之各有
《活出精彩》内容简介:在职场中打拼的你,如果意外怀孕,会怎么选择? 是生娃还是升职?还是两个都想要? 越来越多的现代女性在努
《锋利的SQL》内容简介:本书从基础、开发、性能调整和实战4方面介绍了SQL技术及其应用,包括数据库与架构、表管理、索引管理、基本
《成交:如何高效转化潜在客户》内容简介:在一个竞争日趋白热化的商业世界里,胜利女神的天平将倾向于那些善于投资人际关系、能够
高分辨率遥感影像变化检测 本书特色 这是国内以高分辨遥感影像变化检测为核心,系统阐述相关关键技术的书籍。书中在深入阐述变化检测及相关技术的各种理论的同时,将对*...
《叶秀山全集·第八卷》内容简介:本选题分类结集叶秀山先生全部已经出版的专著,在学术期刊上发表的所有论文,以及部分笔记、札记
FromthecoauthorsoftheNewYorkTimesbestsellerAbundancecomestheirmuchanticipatedfol...
谁是极客?谁在改写人类的运程?100年以前,可能是科学怪人弗兰肯斯坦;20年以前,是微软的比尔•盖茨和苹果的斯蒂夫•乔布斯;今天
嵌入式与实时系统开发:使用UML、对象技术、框架与模式 本书特色 本书无疑是这一领域中创作的著作……每个人都可以把它作为教材和参考书。本书深入浅出地介绍实时系统...
ItsOurResearchprovidesastrategicframeworkforpeoplewhopracticeUXresearchwhowishto...
本书介绍了正交频分复用(OFOM)技术的原理及其在无线通信领域内的应用。全书共分10章。第1章简要介绍了移动通信的发展现状、无线