"Mining the Web: Discovering Knowledge from Hypertext Data" is the first book devoted entirely to techniques for producing knowledge from the vast body of unstructured Web data. Building on an initial survey of infrastructural issues - including Web crawling and indexing - Chakrabarti examines low-level machine learning techniques as they relate specifically to the challenges of Web mining. He then devotes the final part of the book to applications that unite infrastructure and analysis to bring machine learning to bear on systematically acquired and stored data. Here the focus is on results: the strengths and weaknesses of these applications, along with their potential as foundations for further progress. From Chakrabarti's work-painstaking, critical, and forward-looking-readers will gain the theoretical and practical understanding they need to contribute to the Web mining effort. Features include: a comprehensive, critical exploration of statistics-based attempts to make sense of Web Mining; details the special challenges associated with analyzing unstructured and semi-structured data; looks at how classical Information Retrieval techniques have been modified for use with Web data; focuses on today's dominant learning methods: clustering and classification, hyperlink analysis, and supervised and semi-supervised learning; analyzes current applications for resource discovery and social network analysis; and, an excellent way to introduce students to especially vital applications of data mining and machine learning technology.
《ADOBE AFTER EFFECTS CC标准培训教材》内容简介:为了让读者系统、快速地掌握Adobe After Effects CC 软件,本书内容编排...
CLR via C#-(第4版) 本书特色 李希特编著的《clr via c#(第4版)》针对 clr和.net framework 4.5进行深入、全面的探讨...
《股权一本通》内容简介:合理的股权设计和股权分配能够成为公司发展的源动力,能够有效解决人的问题、钱的问题、资源的问题、融资
这场始于政府工作报告,由互联网和传统行业跨界融合形成的巨大浪潮,正在以中国经济转型为新驱动力的角色,席卷生机勃勃的整个国
網路可以說是自電腦發明後,最重要的發明了。網路不僅形成了一種新的通路與媒體,網路更與我們的日常生活息息相關。因此一個網站
“泛娱乐战略”是指打造“围绕明星IP、开发多种文化创意产品体验”的创新业态。“泛娱乐战略”最早被腾讯公司确定为公司级战略。
《人口老龄化背景下城乡居民基本医疗保险财务可持续性研究》内容简介:本书是国家社会科学基金后期资助项目(18FGL008)系列研究成
《在人间》内容简介:1906年,高尔基对一位知名出版人说:“我有许多写作计划,而且正在考虑写自传。”此后,他多次表示想写自传。
The3GIPMultimediaSubsystem(IMS):MergingtheInternetandtheCellularWorlds,SecondEdi...
《你早该这样玩小米手机》内容简介:《你早该这样玩小米手机》教您如何迅速成为小米手机高手。全书对小米手机好玩好用的部分进行精
本书以webservices技术原理为主线,详细解释、分析包括XML、XMLSchema、SOAP、WSDL、UDDI等在内在的webServices核心技术。...
《破绽:风口上的独角兽》内容简介:互联网时代是一个英雄不问出处的草莽时代。这个时代造就了一大批独角兽公司和新兴业态,它们出
属性拓扑理论及其应用 本书特色 本书以属性拓扑理论及其应用为主线,系统地介绍了属性拓扑基本理论及其应用的*研究成果. 全书分为基础知识、概念计算、关联分析、记忆...
本书主要介绍了基于CPLD/FPGA的数字通信系统的设计原理与建模方法。从通信系统的组成、EDA概述及建模的概念开始(第1~2章),围
《机器学习技术及应用》内容简介:机器学习是人工智能的一个方向。它是一门多领域交叉学科,涉及概率论、统计学、矩阵论、神经网络
《诗词中国(第九期)》内容简介:《诗词中国》由中华书局、中华诗词研究院共同主办,面向全社会公开出版发行。旨在“搜集当代最动
《对称与不对称》深入浅出地说明了对称与不对称不仅在物理学中,也在艺术、文学、逻辑、数学、自然和日常生活等方面中有精彩的表
本书是一线程序员的经验荟萃,他们根据各自在软件工程各环节里的实践经历,现身说法,提出了自己的真知灼见,这些经验涵盖了用户
《零基础学C语言(第3版)》内容简介:单片机C51语言是目前最流行的单片机程序设计语言。本书由浅入深,循序渐进地讲解了C51语言的
Finally,wearelearningthatsimplicityequalssanity.Wererebellingagainsttechnologyth...