"Mining the Web: Discovering Knowledge from Hypertext Data" is the first book devoted entirely to techniques for producing knowledge from the vast body of unstructured Web data. Building on an initial survey of infrastructural issues - including Web crawling and indexing - Chakrabarti examines low-level machine learning techniques as they relate specifically to the challenges of Web mining. He then devotes the final part of the book to applications that unite infrastructure and analysis to bring machine learning to bear on systematically acquired and stored data. Here the focus is on results: the strengths and weaknesses of these applications, along with their potential as foundations for further progress. From Chakrabarti's work-painstaking, critical, and forward-looking-readers will gain the theoretical and practical understanding they need to contribute to the Web mining effort. Features include: a comprehensive, critical exploration of statistics-based attempts to make sense of Web Mining; details the special challenges associated with analyzing unstructured and semi-structured data; looks at how classical Information Retrieval techniques have been modified for use with Web data; focuses on today's dominant learning methods: clustering and classification, hyperlink analysis, and supervised and semi-supervised learning; analyzes current applications for resource discovery and social network analysis; and, an excellent way to introduce students to especially vital applications of data mining and machine learning technology.
本书讲述了一个来自圣迭戈的小公司如何翻新了无线通信业并带给市场一种全新的体验。这不是一本技术指南,而是一部传奇。读过它,
由塞贝尔编著的《实用CommonLisp编程》是一本不同寻常的CommonLisp入门书。《实用CommonLisp编程》首先从作者的学习经过及语言历
《绽放:第二十一届新概念作文获奖者作品精选. A卷》内容简介:本书精选2019年第21届全国新概念作文大赛一、二等奖获奖者的作品,结
《金湖大合唱钢琴伴奏合唱谱》内容简介:这部交响音诗是作者在深入大、小兴安岭和长白山地区采风获得灵感所作,作者根据自己的选材
《马云商道真经》内容简介:《马云商道真经》从马云对人生的认识、以及他超出常人的"狂妄",创业精神、团队合作、经营理念、企业管
《Scratch真好玩:教小孩学编程》内容简介:本书以一个猫猫侠角色引入,将读者设定为编程世界的一位勇士,跟随猫猫侠一起学习Scrat
◎聯合推薦實踐大學設計學院院長/安郁茜政治大學科技管理研究所教授/李仁芳奧美廣告執行創意總監/胡湘雲設計,打造感動人心的
《发明改变生活》内容简介:在璀璨的人类文明中,各式各样的发明层出不穷,为我们的生活带来了日新月异的变化。那发明是如何改变生
《分科的学史与历史》内容简介:今天以前的一切都是历史,因而历史本不分科,况且中国治学讲究贯通,素来不重分科。可是今日的史学
MATLAB 2018从入门到精通-中文版-实战案例版 本书特色 1.402集视频讲解。为方便读者学习,本书对书中实例录制了视频,并生成二维码,可以手机扫码看视...
《古笺风雅:水龙吟》内容简介:笺纸多用于古代书信,是文人雅士通信的信纸。随着雕版印刷技术的提高,笺纸上描绘的山水、花鸟、奇
《引爆品牌卖点》内容简介:新产品上市能否寻找到恰当的卖点,是能否使产品畅销,能否建立品牌的重要因素。所谓卖点无非是指商品具
《当代中国农村》内容简介:全面展示中国农村发展成就中国农业现代化建设;创新农业经营体制,转变农业发展方式农业供给侧结构性改
ASP Web开发教程 内容简介 本书是专为落实教育部和信息产业部《关于在职业院校开展计算机应用与软件技术专业领域技能型紧缺人才培养培训工作的通知》和《职业院校...
大約有90%的產品開發案是失敗的,其中30%並沒有開發出任何產品,其他的雖然有產品問世,但人們不喜歡,或從來不使用;即便使用了
Thisbookisapracticalguidefilledwithreal-worldexamplesthatwillhelpyoudiscovertheb...
《美国时装画技法》在编排时,实例练习均安排在双页上,以便学习者在使用时能完整地观察到全部绘画过程。为了省时省力,重点均放
《乾隆:政治、爱情与性格》内容简介:中国历史最复杂的皇帝的政治、后宫与人生。读懂了这个人,你就读懂了中国历史,读懂了中国政
《超实用的CSS代码段》精选400余段CSS代码,覆盖网页上所有的设计元素,堪称史上最有用的CSS书籍,是网站建设和网页设计人员不可
《资本主义民主的批判与反思》内容简介:本书集中收入了国外马克思主义者对民主问题的研究动态,并进行了理论上的探讨和分析。关于