本书主要框架是基于跨行业数据挖掘标准流程 (CRISP-DM) 这一知识发现 (KDD) 过程模型展开, 其内容主要包括互联网数据 (来自新浪微博、Facebook和Twitter) 的收集、准备、建模、评估和实施, 并利用R软件和Microsoft SQL Server软件在实务案例中进行文本挖掘。
《文本挖掘技术及其应用》包括四个部分。**部分包括两章,介绍常用文本挖掘技术,总结基本流程。第二部分共五章,在r软件上详细介绍了文本挖掘,包括r 软件的简介与安装,文本挖掘所需的基本r包,facebook、微博、twitter、网页等爬虫技术、数据预处理如断词、字词处理、语料库建立等,资料 分析如关联分析、集群分析、主成份分析和聚类分析。第三部分共两章,在ms sql sever上介绍如何实现文本挖掘,**章是数据预处理技术,包括怎么导入文本数据、建立字词与词向量、建立训练集和测试集,第二章在ms sql sever上实现常用的文本数据挖掘方法,并进行图表分析。第四部分为顾问公司和新闻网合作的案例。
DiveintogamedevelopmentandcreategreatmultiplayeronlinegameswithProAndroidWebGame...
本书是继《设计中的设计|全本》之后,广西师范大学出版社推出的全新的原研哉著作。SENSEWARE是原研哉同TOKYOFIBER合作的一个延续
《兄弟在清华和北航的日子(第三辑)》内容简介:每一代成功人士都有自己的故事。该书记录的是20世纪80年代,一对亲兄弟求学奋斗的
《Qtfor Python PySide6GUI界面开发详解与实例》内容简介:本书详细介绍了PySide6提供的各种可视化类进行可视化界面编程。本书对各
《江苏书法史》内容简介:江苏人文源远流长,彪炳中国书法史、艺术史乃至文化史的杰出书家、书法理论家,包括江苏籍人士与流寓江苏
《文化何以自信》内容简介:该书阐释和说明了在当今世界不同思想文化相互激荡、文化软实力竞争日趋激烈的背景下,增进文化自信已成
《Python数据整理》内容简介:本书从Python最基础的知识开始,主要聚焦于数据结构,接着快速转至数据整理的基本工具NumPy和pandas库
全国计算机等级考试二级教程.C语言程序设计:2010年版 内容简介 本书根据教育部考试中心制定的《全国计算机等级考试二级c语言程序设计考试大纲(2007年版)》...
《谈医说病》内容简介:渡边淳一以对谈方式,与日本医学专家探讨不孕症、腰膝痛、眼疾、流感、类风湿病、花粉症、糖尿病、特应性皮
《领导要干好3件事》内容简介:领导者想要把工作做得卓有成效,需要做好三件事:抓要害、办实事、管住人。在组织中,领导者只要在这
TheInsidersBest-PracticeGuidetoRapidPyQt4GUIDevelopmentWhetheryourebuildingGUIpr...
《全球价值链、中国经济增长与碳排放》内容简介:本书将全球价值链研究的前沿成果与环境经济学、国际贸易理论的学术洞见整合在一起
《当用户体验设计遇上敏捷》分为三个部分:第一部分介绍了什么是敏捷。即使读者对敏捷完全了解,仍旧值得读一读这部分内容;第二
《大写的历史:被遗忘的历史事件》内容简介:《左传》既然是战国初期才正式成书,而赵氏宗族又是晋国政治权力博弈中的最后胜利者,
《中国基督教史纲》内容简介:《中国基督教史纲》是我国学者所撰的部也是影响优选的中国基督教通史或全史著作。《中国基督教史纲》
《创新思维与方法》内容简介:本书共12章,包括创新的基础知识、创新驱动发展、互联网+行动计划、大数据时代的思维变革、发明问题传
《Java面向对象编程》内容由浅入深,紧密结合实际,利用大量典型实例,详细讲解Java面向对象的编程思想、编程语法和设计模式,介
《阿里巴巴基本动作:管理者必须修炼的24个基本动作》内容简介:收齐日报很难,收到合格的日报更难,用日报管好团队难上加难?招不
《唐诗三百首译注》内容简介:《唐诗三百首》为流传最广、影响深远的唐诗选本。此版每首诗均由题解、原诗、题解、注释、译文五部分
《王羲之传本墨迹》内容简介:书圣王羲之的真迹已然不存。在传世的钩摹本、临写本中,尺牍作品占绝大部分。通过这些传本墨迹,学书