"Mining the Web: Discovering Knowledge from Hypertext Data" is the first book devoted entirely to techniques for producing knowledge from the vast body of unstructured Web data. Building on an initial survey of infrastructural issues - including Web crawling and indexing - Chakrabarti examines low-level machine learning techniques as they relate specifically to the challenges of Web mining. He then devotes the final part of the book to applications that unite infrastructure and analysis to bring machine learning to bear on systematically acquired and stored data. Here the focus is on results: the strengths and weaknesses of these applications, along with their potential as foundations for further progress. From Chakrabarti's work-painstaking, critical, and forward-looking-readers will gain the theoretical and practical understanding they need to contribute to the Web mining effort. Features include: a comprehensive, critical exploration of statistics-based attempts to make sense of Web Mining; details the special challenges associated with analyzing unstructured and semi-structured data; looks at how classical Information Retrieval techniques have been modified for use with Web data; focuses on today's dominant learning methods: clustering and classification, hyperlink analysis, and supervised and semi-supervised learning; analyzes current applications for resource discovery and social network analysis; and, an excellent way to introduce students to especially vital applications of data mining and machine learning technology.
《博悟空间》内容简介:中国博物馆事业蓬勃发展,目前注册有5000多座博物馆,每年举办展览将近3万个。如何将更好品质、更好体验的展
《特种作战装备》内容简介:本书主要介绍各国特种作战单位使用的各式装备,包括主战武器、自卫武器、特种作战车辆、特种作战飞机、
《眼见为实》一书使用符号学和心理分析方面的概念帮助读者理解了我们在视觉现象中发现意义的方式和大脑处理影像的方法。作者以通
《Web数据挖掘》旨在讲述这些任务以及它们的核心挖掘算法;尽可能涵盖每个话题的广泛内容,给出足够多的细节,以便读者无须借助额
结构动力分析的MATLAB实现 本书特色 本书系统介绍了各类结构动力问题进行分析求解,如:线性结构的动力分析,非线性结构的动力分析,频域内结构动力分析,simu...
《让移动设计更简单:Sketch3操作指南与实战详解》以Sketch的基本操作为基础,用一系列生动可行的教学案例,让初学者可以快速掌握
靳埭强1942年生于广东番禺,1957年定居香港,1964年开始研习艺术与设计,1967年开始设计工作,获奖无数。靳氏于1969年开始水墨创
《VC++深入详解》主要从程序内部运行的机制和MFC程序的组织脉络入手,使读者在学习VC++编程知识时,既能够知其然,又能知其所以然
《汽车发动机试验学教程》是对现代汽车发动机试验进行全面系统论述的专业教科书。书中首先论述了进行汽车发动机试验必备的试验台
《伤寒论》内容简介:东汉张仲景的《伤寒论》是现存早的中医临床经典著作,它所确立的六经辨证论治体系,开拓了中医临证医学的新纪
本书讲述了一个来自圣迭戈的小公司如何翻新了无线通信业并带给市场一种全新的体验。这不是一本技术指南,而是一部传奇。读过它,
《从0到1:数据分析师养成宝典》内容简介:随着互联网技术的普及,数据产生的速度加快,数据规模越来越庞大,企业对数据分析师的需
《译前译后》内容简介:《译前译后》主要涉及到笔者多年来翻译并出版过的作品。译前,系译者对原著的认识。译后,这里包括译著的成
《摄影构图零基础入门教程》内容简介:构图是决定摄影作品成败的关键因素之一。本书对基本的构图常识、黄金构图的概念及实战应用、
本书讲解了Linux操作系统的工作机制以及运行Linux系统所需的常用工具和命令。根据系统启动的大体顺序,本书更深入地介绍从设备管
Thistextbookoffersadeepunderstandingoftheessentialconceptsofprogramminglanguages...
安藤忠雄的都市彷徨一书,主要汇集1965年至1992年於世界游历中思考的轨迹与心路历程的反省,藉由旅游,造就了建筑师的深度与成长
神经元(神经细胞)是构成神经系统的基石,对神经元各个方面的深入、彻底的理解对于我们从各个层次对神经系统进行分析都是十分必
《成长比成功更重要(增订本)》内容简介:微软亚洲研究院聚集着计算机领域许多世界一流的科学家,他们每一个人都被称为天才,但是
《从平面到立体:设计师必备的折叠技巧》在把诸如织物、纸板、塑料、金属等二维片材制作成三维形态时,许多设计师都会采用折叠这一