"Mining the Web: Discovering Knowledge from Hypertext Data" is the first book devoted entirely to techniques for producing knowledge from the vast body of unstructured Web data. Building on an initial survey of infrastructural issues - including Web crawling and indexing - Chakrabarti examines low-level machine learning techniques as they relate specifically to the challenges of Web mining. He then devotes the final part of the book to applications that unite infrastructure and analysis to bring machine learning to bear on systematically acquired and stored data. Here the focus is on results: the strengths and weaknesses of these applications, along with their potential as foundations for further progress. From Chakrabarti's work-painstaking, critical, and forward-looking-readers will gain the theoretical and practical understanding they need to contribute to the Web mining effort. Features include: a comprehensive, critical exploration of statistics-based attempts to make sense of Web Mining; details the special challenges associated with analyzing unstructured and semi-structured data; looks at how classical Information Retrieval techniques have been modified for use with Web data; focuses on today's dominant learning methods: clustering and classification, hyperlink analysis, and supervised and semi-supervised learning; analyzes current applications for resource discovery and social network analysis; and, an excellent way to introduce students to especially vital applications of data mining and machine learning technology.
面对堆积如山的原稿,你如何才能在设计中达到一种视觉美感呢?本书以专业人员直视深沉设计要义的睿智眼光和简洁有力的述评,解决
JosefAlbers’sInteractionofColorisamasterworkintwentieth-centuryarteducation.Conc...
《与50位网站主编面对面》内容简介:《与50位网站主编面对面》的内容来自于国内第一网络编辑社区Bianews的“网编训练营”公益培训项
EXCEL应用大全 本书特色 《Excel应用大全》一书适合各个层次的Excel用户,即可作为初学者的入门指南,又可作为中、高级用户的参考手册。书中大量的实例还...
赵鑫磊阿里巴巴集团资深Linux系统专家。自1998年开始使用Linux,曾参与国内著名的Linux社区发行版MagicLinux的开发工作,是一个土
《高新科技知多少》内容简介:本书由重庆市科学技术协会、重庆市科学技术局和重庆市全民科学素质纲要实施工作办公室主编,是一本面
韩国的网页设计风格在世界上的影响越来越大,也被越来越多的人所喜爱和接受。其优秀的设计风格能让人看后有耳目一新的视觉感受。
《中国历代传统纹样》全篇从史前时期到明清时期共分八章,侧重点放在中国历代的纹样描述上。我国的传统纹样源远流长,从原始图腾
当今学术界对线上交流、用户创建内容以及共享媒体等内容依然采取忽视的态度,甚至禁止在媒体以及学校中传播和教授,但数字文化的
《TensorFlow机器学习实战指南(原书第2版)》内容简介:本书由资深数据科学家撰写,从实战角度系统讲解TensorFlow基本概念及各种应
《基督教史》内容简介:本书是一部基督教世界通史,以时间为经,以地区和国别为纬,全面系统地介绍了基督教产生、发展和流传的历史
本书是根据国家教育委员会1995年颁布的高等工业学校《信号与系统课程教学基本要求》,在《信号与线性系统分析》(1986年高教版)一
《2014年度全国会计专业技术资格考试真题详解及押题密卷:初级会计实务》内容简介:《2014年度全国会计专业技术资格考试真题详解及
《方向感》内容简介:本书分为六大篇:确立产业边界的三大原则、确立商业形态的三大维度、确立竞争地位的三大要点、理论指导实践的
《互联网法律实务指南》内容简介:本书是由浙江省律师协会组织全省互联网专业律师编写的实用型书籍,内容涉及互联网准入和运营、电
《赤子:余光中散文》内容简介:收录当代散文大师余光中的散文代表作,横跨诗歌、散文、评论、翻译四维写作空间,尽显一代文豪刚柔
《紫图经典文库:三岛由纪夫·晓寺》内容简介:在《丰饶之海》四部曲中,《晓寺》是一部并不像小说的小说。它以轮回转世的观察者本
Contourlet变换 内容简介 本书以Contourlet变化在图像处理中的应用为研究对象,介绍了Contourlet变换在影像压缩、超分辨率重建、影像融合...
《交往与空间》这本书着重从人及其活动对物质环境的要求这一角度来研究和评价城市和居住区中公共空间的质量,在从住宅到城市的所
《设计方法学》是一部讲授创新思维与设计方法的书籍,分上、下两篇。上篇是“思维篇”,通过对思维、心理、视觉等方面的大量研究