内容简介:
随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载(information overload)的时代 。在这个时代,无论是信息消费者还是信息生产者都遇到了很大的挑战:对于信息消费者,从大量信息中找到自己感兴趣的信息是一件非常困难的事情;对于信息生产者,让自己生产的信息脱颖而出,受到广大用户的关注,也是一件非常困难的事情。推荐系统就是解决这一矛盾的重要工具。推荐系统的任务就是联系用户和信息,一方面帮助用户发现对自己有价值的信息,另一方面让信息能够展现在对它感兴趣的用户面前,从而实现信息消费者和信息生产者的双赢。
目 录
第1章 好的推荐系统 1
1.1 什么是推荐系统 1
1.2 个性化推荐系统的应用 4
1.2.1 电子商务 4
1.2.2 电影和视频网站 8
1.2.3 个性化音乐网络电台 10
1.2.4 社交网络 12
1.2.5 个性化阅读 15
1.2.6 基于位置的服务 16
1.2.7 个性化邮件 17
1.2.8 个性化广告 18
1.3 推荐系统评测 19
1.3.1 推荐系统实验方法 20
1.3.2 评测指标 23
1.3.3 评测维度 34
第2章 利用用户行为数据 35
2.1 用户行为数据简介 36
2.2 用户行为分析 39
2.2.1 用户活跃度和物品流行度的分布 39
2.2.2 用户活跃度和物品流行度的关系 41
2.3 实验设计和算法评测 41
2.3.1 数据集 42
2.3.2 实验设计 42
2.3.3 评测指标 42
2.4 基于邻域的算法 44
2.4.1 基于用户的协同过滤算法 44
2.4.2 基于物品的协同过滤算法 51
2.4.3 UserCF和ItemCF的综合比较 59
2.5 隐语义模型 64
2.5.1 基础算法 64
2.5.2 基于LFM的实际系统的例子 70
2.5.3 LFM和基于邻域的方法的比较 72
2.6 基于图的模型 73
2.6.1 用户行为数据的二分图表示 73
2.6.2 基于图的推荐算法 73
第3章 推荐系统冷启动问题 78
3.1 冷启动问题简介 78
3.2 利用用户注册信息 79
3.3 选择合适的物品启动用户的兴趣 85
3.4 利用物品的内容信息 89
3.5 发挥专家的作用 94
第4章 利用用户标签数据 96
4.1 UGC标签系统的代表应用 97
4.1.1 Delicious 97
4.1.2 CiteULike 98
4.1.3 Last.fm 98
4.1.4 豆瓣 99
4.1.5 Hulu 99
4.2 标签系统中的推荐问题 100
4.2.1 用户为什么进行标注 100
4.2.2 用户如何打标签 101
4.2.3 用户打什么样的标签 102
4.3 基于标签的推荐系统 103
4.3.1 实验设置 104
4.3.2 一个最简单的算法 105
4.3.3 算法的改进 107
4.3.4 基于图的推荐算法 110
4.3.5 基于标签的推荐解释 112
4.4 给用户推荐标签 115
4.4.1 为什么要给用户推荐标签 115
4.4.2 如何给用户推荐标签 115
4.4.3 实验设置 116
4.4.4 基于图的标签推荐算法 119
4.5 扩展阅读 119
第5章 利用上下文信息 121
5.1 时间上下文信息 122
5.1.1 时间效应简介 122
5.1.2 时间效应举例 123
5.1.3 系统时间特性的分析 125
5.1.4 推荐系统的实时性 127
5.1.5 推荐算法的时间多样性 128
5.1.6 时间上下文推荐算法 130
5.1.7 时间段图模型 134
5.1.8 离线实验 136
5.2 地点上下文信息 139
5.3 扩展阅读 143
第6章 利用社交网络数据 144
6.1 获取社交网络数据的途径 144
6.1.1 电子邮件 145
6.1.2 用户注册信息 146
6.1.3 用户的位置数据 146
6.1.4 论坛和讨论组 146
6.1.5 即时聊天工具 147
6.1.6 社交网站 147
6.2 社交网络数据简介 148社交网络数据中的长尾分布 149
6.3 基于社交网络的推荐 150
6.3.1 基于邻域的社会化推荐算法 151
6.3.2 基于图的社会化推荐算法 152
6.3.3 实际系统中的社会化推荐算法 153
6.3.4 社会化推荐系统和协同过滤推荐系统 155
6.3.5 信息流推荐 156
6.4 给用户推荐好友 159
6.4.1 基于内容的匹配 161
6.4.2 基于共同兴趣的好友推荐 161
6.4.3 基于社交网络图的好友推荐 161
6.4.4 基于用户调查的好友推荐算法对比 164
6.5 扩展阅读 165
第7章 推荐系统实例 166
7.1 外围架构 166
7.2 推荐系统架构 167
7.3 推荐引擎的架构 171
7.3.1 生成用户特征向量 172
7.3.2 特征?物品相关推荐 173
7.3.3 过滤模块 174
7.3.4 排名模块 174
7.4 扩展阅读 178
第8章 评分预测问题 179
8.1 离线实验方法 180
8.2 评分预测算法 180
8.2.1 平均值 180
8.2.2 基于邻域的方法 184
8.2.3 隐语义模型与矩阵分解模型 186
8.2.4 加入时间信息 192
8.2.5 模型融合 193
8.2.6 Netflix Prize的相关实验结果 195
后记 196
《滇金丝猴生活史》内容简介:《滇金丝猴生活史》记述了中科院灵长类生态学研究组长达14年的研究经历,向公众展现滇金丝猴的神秘世
《英国陶艺设计基础教程》是一本陶艺设计的完全指导手册,融合了理论、实践、技术三方面的重点,你可以通过《英国陶艺设计基础教
本书主要讲述采用现代C++在x86-64Linux上编写多线程TCP网络服务程序的主流常规技术,重点讲解一种适应性较强的多线程服务器的编程
《儿童发育迟缓居家康复指导》内容简介:本书从什么是发育迟缓、怎么知道得了发育迟缓、发育迟缓有哪些表现和危害、如何进行居家康
《茶之书:识茶·懂茶·品茶》内容简介:本书以知识性随笔的方式,在介绍最具代表性的各类名茶的同时,加入了足够的关于茶道、茶文
《亲历与思考:记录中国资本市场30年》内容简介:本书以第一手资料出发,记录了A股市场30年跌宕起伏的历史发展过程,比较客观地回顾
《智慧党建》内容简介:本书首先阐述了党委信息化,指出领导干部要强化信息化思维、提高数字领导力,分析了数字党建的内涵、意义和
《让我去那花花世界》内容简介:本书收录了苗炜多年来的旅行随笔,他探访名城,在耶路撒冷、巴黎、东京、伦敦、莫斯科寻找历史和文
本书是经典著作《Linux设备驱动程序》的第三版。如果您希望在Linux操作系统上支持计算机外部设备,或者在Linux上运行新的硬件,或
《世界大学生程序设计竞赛(ACM/ICPC)高级教程(第1册):程序设计中常用的计算思维方式》主要介绍了大赛程序设计中的常用思维方式,
《Python自然语言处理(影印版)》提供了非常易学的自然语言处理入门介绍,该领域涵盖从文本和电子邮件预测过滤,到自动总结和翻译
《5G时代边缘计算:LF Edge生态与EdgeGallery技术详解》内容简介:这是一本指导个人或企业针对微信视频号进行内容制作、全方位运营
人机交互技术:原理与应用,ISBN:9787302093442,作者:孟祥旭,李学庆编著目录 第1章绪论第2章认知心理学与人机工程学第3章交
《我在精神病院抗抑郁》内容简介:这本书是重度抑郁症患者左灯对自己经历过的抗抑郁过程的全程直播。2017年9月下旬,由于某些原因的
The Adobe lllustrator CS6 WOW!Book 本书特色 多年来,Sharon Stever和她的国际化WOW!团队一直致力于在全球范围内...
《仰顾山房文稿》内容简介:本书是凤凰枝文丛之一种,作者俞国林是中华书局编辑,先后策划《顾颉刚全集》等具有影响力的图书多种,
《Python 3反爬虫原理与绕过实战》内容简介:本书首先介绍了开发环境的配置,接着讨论了Web网站的构成和页面渲染、动态网页和静态网
《庆春》内容简介:老舍是我国现代杰出的文学家和语言大师。本书精选了老舍先生的经典作品,包括短篇小说和散文。其中有幽默诙谐的
Thankstoglobalizationanddigitalizationmoreandmoreaspectsofourbusinesslivesandlei...
該年鑒屬日本字體設計協會(JapanTypograhyAssociation)官方出版物,本期版式及裝幀由南部俊安(ToshiyasuNanbu)設計,Grap...