"Mining the Web: Discovering Knowledge from Hypertext Data" is the first book devoted entirely to techniques for producing knowledge from the vast body of unstructured Web data. Building on an initial survey of infrastructural issues - including Web crawling and indexing - Chakrabarti examines low-level machine learning techniques as they relate specifically to the challenges of Web mining. He then devotes the final part of the book to applications that unite infrastructure and analysis to bring machine learning to bear on systematically acquired and stored data. Here the focus is on results: the strengths and weaknesses of these applications, along with their potential as foundations for further progress. From Chakrabarti's work-painstaking, critical, and forward-looking-readers will gain the theoretical and practical understanding they need to contribute to the Web mining effort. Features include: a comprehensive, critical exploration of statistics-based attempts to make sense of Web Mining; details the special challenges associated with analyzing unstructured and semi-structured data; looks at how classical Information Retrieval techniques have been modified for use with Web data; focuses on today's dominant learning methods: clustering and classification, hyperlink analysis, and supervised and semi-supervised learning; analyzes current applications for resource discovery and social network analysis; and, an excellent way to introduce students to especially vital applications of data mining and machine learning technology.
《榨书:主动成长的高回报读书法》内容简介:本书首先深入浅出地介绍了作者独创的“榨书”阅读法,提倡最大化地榨取书的价值,通过
《中国经济的未来:热点、难点和增长点》内容简介:《中国经济的未来:热点、难点、增长点》是中国知名经济学家魏杰对中国经济热点
本教材以力学理论和控制理论的全面讲述为特色。教材的重点在于用严谨而系统的方式介绍机器人动力学与控制的基本概念和主要结果。
《华杉讲透《论语》:修订版(全2册)》内容简介:华杉先生精研《论语》30多年,综合了朱熹、王阳明、张居正等先贤的经典阐释,用4
《心若莲花处处开》内容简介:南怀瑾精研儒、释、道,将中国文化各种思想融会贯通,可谓一代宗师。在他眼里,儒、道、佛的经典学问
《天人合一》内容简介:“天人合一”由宋代著名思想张载明确提出,是中国传统思想中经久不衰的思想话题,集中体现了人与自然和谐相
《纳税会计与纳税申报实训操作(第三版)》内容简介:本书以国家最新税收法规和会计准则为依据,介绍了增值税、消费税、城镇土地使
《海量运维、运营规划之道》作者具有腾讯、百度等中国一线互联网公司多年从业经历,书中依托工作实践,以互联网海量产品质量、效
《DSP原理及其C编程开发技术》可作为电子、通信、自动化及计算机工程专业高年级本科生或研究生学习DSP的教材,也可作为专业工程技
《中华史纲》内容简介:本书是人民出版社陆续出版的12册本《中国通史》的简本,作者为中国社会科学院荣誉学部委员、近代史所研究员
《世界经典步枪TOP10》内容简介:步枪是世界上产量最高、应用最广泛的单兵轻武器。本书以轻武器发展的重要节点划分历史时期,纵向回
《Julia设计模式》内容简介:设计模式是开发可重用和可维护代码的基本技术。它提供了一套经过验证的解决方案,使开发人员可以快速解
自Django创建以来,各种各样的开源社区已经构建了很多Web框架,比如JavaScript社区创建的Angular.js、Ember.js和Backbone....
《绘画高手这样画·素描静物》内容简介:书中分为3个部分,第1章节为基础知识章节;第二章节为物体质感的绘制章节;第三章节绘画高
《数字化转型百问(第一辑)》内容简介:1.内容概要及特色:《数字化转型百问》(辑)从什么是数字化转型、为什么数字化转型、数字
本书介绍了如何从设计到部署完整地创建一个交互式Web试点。书中提供的Web站点编程问题的解决方案可以让读者快速、容易地创建出设
《能源互联网发展研究》内容简介:本书全面介绍了国内能源互联网的发展现状及进展,共分四篇,第1篇为战略篇,第2篇为技术篇,第3篇
《Arduino项目案例:游戏开发》内容简介:本书系统论述了Arduino开源硬件的架构、原理、开发方法及11个完整的项目设计案例。全书共
《明代文学思想史(全二册)》内容简介:《明代文学思想史》是对整个明代的文学思想进行系统阐述的专著。明代是一个文学思想相当活
《赛雷三分钟漫画三国演义4》内容简介:1000万人都在看的“超萌赛雷”,前后创作三年,精心绘制全彩漫画三国演义! 电影式全场景,