本书主要框架是基于跨行业数据挖掘标准流程 (CRISP-DM) 这一知识发现 (KDD) 过程模型展开, 其内容主要包括互联网数据 (来自新浪微博、Facebook和Twitter) 的收集、准备、建模、评估和实施, 并利用R软件和Microsoft SQL Server软件在实务案例中进行文本挖掘。
《文本挖掘技术及其应用》包括四个部分。**部分包括两章,介绍常用文本挖掘技术,总结基本流程。第二部分共五章,在r软件上详细介绍了文本挖掘,包括r 软件的简介与安装,文本挖掘所需的基本r包,facebook、微博、twitter、网页等爬虫技术、数据预处理如断词、字词处理、语料库建立等,资料 分析如关联分析、集群分析、主成份分析和聚类分析。第三部分共两章,在ms sql sever上介绍如何实现文本挖掘,**章是数据预处理技术,包括怎么导入文本数据、建立字词与词向量、建立训练集和测试集,第二章在ms sql sever上实现常用的文本数据挖掘方法,并进行图表分析。第四部分为顾问公司和新闻网合作的案例。
随着Ajax的兴起,JavaScript迅速地从改进网站的配角晋升为开发专业级高质量应用的主角,成为了Web开发中不可缺少的一员。本书主要
PHP开发手册-含DVD光盘一张 内容简介 本书全面、系统地介绍了php实战开发方方面面的技术。内容由浅入深,从易到难,实例丰富,从php的基本知识到高级技术与...
《唐诗三百首》内容简介:本书是清代蘅塘退士编选的唐诗普及读物。自乾隆二十八年问世以来,“风行海内,几至家置一编”,时至今日
《叶秀山全集·第九卷》内容简介:本选题分类结集叶秀山先生全部已经出版的专著,在学术期刊上发表的所有论文,以及部分笔记、札记
《Unity 5.X 3D游戏开发技术详解与典型案例》内容简介:本书对Unity3D集成开发环境界面、脚本的编写和众多高级特效的实现进行了详细
《习惯养成有方法》内容简介:《习惯养成有方法》是“孙云晓教育研究前沿书系”的其中一本,是当代中国具有影响力的教育专家孙云晓
《呼吸:音乐就在我们的身体里》内容简介:音乐就在呼吸里,就在身体里,就在人生里,就在历史里。古典音乐从来不会拒人于门外。再
C#数据库系统开发完全手册-数据库管理系统开发从技术到实践(附光盘) 本书特色 本书全面、系统地介绍了使用C#进行数据库应用程序开发必须掌握的技术、方法和过程。...
MATLAB金融算法分析实战-基于机器学习的股票量化分析 本书特色 本书全面系统地讲解了MATLAB金融算法设计应用,以及金融数据挖掘中趋向和发展趋势指标,并结...
《Android应用测试与调试实战》内容简介:本书是Android应用测试与调试领域最为系统、深入且极具实践指导意义的著作,由拥有近10年
Visual Basic程序设计 本书特色 为了适应信息化时代的需求,各高校对大多数专业都开设了一定的计算机语言课程,有的讲授C或C++语言,有的讲授Visua...
《细菌为什么看不见》内容简介:细菌是地球上最古老的生物,是大自然物质循环的主要参与者。它们无法用肉眼观察到,却无时无刻不在
《JavaScript学习指南(第2版)》系统地介绍了JavaScript的基本语法、基本对象、调试工具与排错技术、事件处理机制、浏览器对象模型
Inthisbook,notedwebdeveloperandlongtimeWaSPmemberJohnAllsopteachesallyouneedtokn...
《实现正义的选择与规范》内容简介:实现正义在于民事诉讼制度的不断规范。证据是法庭认定事实的依据,民事诉讼中的证据制度是关于
《论语新解》内容简介:《论语》为儒家经典著作,自西汉以来,为中国识字人一部人人必读之书。历代对《论语》解读注释之书,浩如烟
《百年新路》内容简介:近年来,世界经济持续不景气,反全球化、民粹主义势力抬头,现有的国际政治经济秩序已难以为继,美国等西方
C#PrimerPlusisatutorialbasedintroductiontotheC#languageandimportantpartsofthe.Ne...
《穿透式学习》内容简介:在数字时代,随着知识更迭速度的加快,学习变成了每一个职场人士必须终身面对的首要事情。高效工作的前提
本书共分10章,除了第1章的通信系统概论之外,余下的章节主要介绍通信的信息理论和传输理论,内容包括:通信的信息理论基础、通信