"Mining the Web: Discovering Knowledge from Hypertext Data" is the first book devoted entirely to techniques for producing knowledge from the vast body of unstructured Web data. Building on an initial survey of infrastructural issues - including Web crawling and indexing - Chakrabarti examines low-level machine learning techniques as they relate specifically to the challenges of Web mining. He then devotes the final part of the book to applications that unite infrastructure and analysis to bring machine learning to bear on systematically acquired and stored data. Here the focus is on results: the strengths and weaknesses of these applications, along with their potential as foundations for further progress. From Chakrabarti's work-painstaking, critical, and forward-looking-readers will gain the theoretical and practical understanding they need to contribute to the Web mining effort. Features include: a comprehensive, critical exploration of statistics-based attempts to make sense of Web Mining; details the special challenges associated with analyzing unstructured and semi-structured data; looks at how classical Information Retrieval techniques have been modified for use with Web data; focuses on today's dominant learning methods: clustering and classification, hyperlink analysis, and supervised and semi-supervised learning; analyzes current applications for resource discovery and social network analysis; and, an excellent way to introduce students to especially vital applications of data mining and machine learning technology.
CascadingStyleSheetsenableyoutorapidlycreatewebdesignsthatcanbesharedbyhundredso...
本书系统地阐述了人因工程学的基础理论、设计方法及应用分析。全书共12章,第1章为人因工程学总论,第2章至第5章为人的形态、生理
《数字营销:6堂课教你玩转新媒体营销》内容简介:全书在参考大量国内外文献的基础上,从理论与案例两个层面系统全面地介绍了社会化
本项目是首部对人类深空探测活动进行系统、完整、科学的描述与分析的著作,融研究性、资料性、工具性于一体,对航天科技工作者有
《我在精神病院抗抑郁》内容简介:这本书是重度抑郁症患者左灯对自己经历过的抗抑郁过程的全程直播。2017年9月下旬,由于某些原因的
本书全面阐述了模式识别的基础理论、最新方法以及各种应用。模式识别是信息科学和人工智能的重要组成部分,主要应用领域有图像分
Thenationalbestsellerbythe"ultimatethinkingmachine"(Forbes)whosepredictionsforth...
《CSS精粹(第2版)》采用问答的形式,为CSS使用过程中一些有价值的经典问题提供了精彩的实践解决方案。《CSS精粹(第2版)》内容包括
《大戴礼记译注》内容简介:《大戴礼记》为礼学文献汇编,由西汉人戴德辑传。《大戴礼记》原有八十五篇。今传本阙缺若干篇,余三十
《专业嵌入式软件开发:全面走向高质高效编程》分为6篇。硬件篇就嵌入式软件开发所需掌握的处理器概念进行了介绍。工具篇对make、
forewordbyRichardSaulWurmanInformationdesignisthenewestofthedesigndisciplines.As...
《潮剧史话》内容简介:潮剧是以潮州方言演唱的地方戏曲剧种,属于宋元南戏的一支,诞生于古潮州,曾有潮泉调、潮腔、潮调、潮音戏
《算法精粹》内容简介:本书是一本面向中高级程序员的算法教程,借助Python语言,用经典的算法、编码技术和原理来求解计算机科学的
《啊哈C!思考快你一步》内容简介:这是一本非常有趣的编程启蒙书,全书从中小学生的角度来讲述,没有生涩的内容,取而代之的是生动
当今学术界对线上交流、用户创建内容以及共享媒体等内容依然采取忽视的态度,甚至禁止在媒体以及学校中传播和教授,但数字文化的
本书整合了自1999年《Java虚拟机规范(第2版)》发布以来Java世界所出现的技术变化。另外,还修正了第2版中的许多错误,以及对目
Theauthorintroduceselectricalprinciplesandtechnologythroughexamplesratherthanthe...
《ASP.NETAJAX程序设计》(第1卷)系统介绍ASP.NETAjax程序设计知识,共3卷。本卷从最易于理解和使用的那部分入手,介绍ASP.NETAJA
《木心上海往事》内容简介:木心之所以是木心,离不开上海。木心一生中有两大主要时期,一是上海时期,木心从故乡乌镇走出,来到上
《立斜阳集》内容简介:庄子根据他皈依自然的哲学思想,希望人们“相忘于江湖”。冯至却认为:江湖越大,越是不能相忘。《立斜阳集