本书主要框架是基于跨行业数据挖掘标准流程 (CRISP-DM) 这一知识发现 (KDD) 过程模型展开, 其内容主要包括互联网数据 (来自新浪微博、Facebook和Twitter) 的收集、准备、建模、评估和实施, 并利用R软件和Microsoft SQL Server软件在实务案例中进行文本挖掘。
《文本挖掘技术及其应用》包括四个部分。**部分包括两章,介绍常用文本挖掘技术,总结基本流程。第二部分共五章,在r软件上详细介绍了文本挖掘,包括r 软件的简介与安装,文本挖掘所需的基本r包,facebook、微博、twitter、网页等爬虫技术、数据预处理如断词、字词处理、语料库建立等,资料 分析如关联分析、集群分析、主成份分析和聚类分析。第三部分共两章,在ms sql sever上介绍如何实现文本挖掘,**章是数据预处理技术,包括怎么导入文本数据、建立字词与词向量、建立训练集和测试集,第二章在ms sql sever上实现常用的文本数据挖掘方法,并进行图表分析。第四部分为顾问公司和新闻网合作的案例。
赵涏元chogar@naver.com目前在KB投资证券公司负责安全工作,管理安全防范项目(www.boanproject.com)。在A3security公司...
此刻呈现在你面前的是这样一本书:它专为非设计专业的你准备,无需任何设计基础即可阅读;它既能让你的PPT倍儿有面子,又能为你的
常用算法程序集-(C++语言描述)-(第四版) 作者简介 p>作者简介 徐±良,清华大学电子工程系教授。毕业于清华大学计算数学专业.留校任教...
《人人都该懂的科学简史》内容简介:什么是科学与科学家?科学的未来将去往何方? 科学革命如何从无到有?为什么说蒸汽机是工业革命
《基于用户体验的交互式信息服务》针对信息管理和服务中的“交互“问题,在国内外现有研究的基础上,从用户需求出发,围绕交互式
在内容上,《Android系统源代码情景分析(修订版)(含CD光盘1张)》结合使用情景,全面、深入、细致地分析了Android系统的源代码
《每一种优秀,都有一段静默时光》内容简介:“生活需要仪式感”系列畅销百万后,李思圆2020全新作品! 每一个优秀的人,都需要挺过
《成器之道:史前至宋的陶瓷造型艺术》内容简介:本书从艺术史的角度对史前至秦汉、隋唐、两宋这几个时期中国陶瓷的器形和艺术风格
《醉鲨》内容简介:★“荣获挪威最重要的文学奖——伯瑞格文学奖 (The Brage Prize),至今在挪威畅销不衰。★一部精彩绝伦的北欧探
《造型原本》是作者中央美术学院教授吕胜中以广受学生欢迎的“造型原本”课的讲稿为基础,结合大量作品实例,带读者发现各种风格
Python是一种解释型、面向对象、动态数据类型的高级程序设计语言,自20世纪90年代初诞生至今,逐渐被广泛应用于处理系统管理任务
《这就是财务管理:世界500强CFO的独家分享》内容简介:本书财务工作涉及企业运营的方方面面,长期以来,无论是财务工作者还是企业
《CSS入门经典(第2版)》主要内容:CSSLevel1、2、2.1和3规范的相关知识、操纵文本和选择字体效果的方式、IE6和IE7的Bug及解决方案
本书是一本介绍Windows系统上的用户态程序排错方法和技巧的书。本书分为4个章节,先介绍最重要的、通用的思考方法,以便制定排错
W.RicharqdStevens,国际知名的LINIX和网络专家,备受赞誉的技术作家。他1951年2月5日出生于赞比亚,后随父母回到美国。中学时就
NowavailablefromAbrams,thispopularbookoffersarare,close-uplookattheexquisite,lab...
《中国大运河百问》内容简介:姜师立著的本书是大运河申遗成功后首部全面系统介绍以大运河为核心的历史文化资源的书籍,对运河沿线
《Web3.0与SemanticWeb编程》内容简介:语义Web的问世使网站开发领域变得焕然一新。您可以借助语义Web的强大功能,来构建可以运用
《浙东唐诗之路学术文化编年史》内容简介:浙东,自晋代起渐成为人文荟萃之地,源远流长的山水诗在此滋生,与之有连带关系的书法、
作者简介:井上诚一郎曾在美国参与过LotusNotes的开发,后在日本创立了ArielNetwork股份公司,任CTO。目前从事面向企业的PSP软件