内容简介:
随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载(information overload)的时代 。在这个时代,无论是信息消费者还是信息生产者都遇到了很大的挑战:对于信息消费者,从大量信息中找到自己感兴趣的信息是一件非常困难的事情;对于信息生产者,让自己生产的信息脱颖而出,受到广大用户的关注,也是一件非常困难的事情。推荐系统就是解决这一矛盾的重要工具。推荐系统的任务就是联系用户和信息,一方面帮助用户发现对自己有价值的信息,另一方面让信息能够展现在对它感兴趣的用户面前,从而实现信息消费者和信息生产者的双赢。
目 录
第1章 好的推荐系统 1
1.1 什么是推荐系统 1
1.2 个性化推荐系统的应用 4
1.2.1 电子商务 4
1.2.2 电影和视频网站 8
1.2.3 个性化音乐网络电台 10
1.2.4 社交网络 12
1.2.5 个性化阅读 15
1.2.6 基于位置的服务 16
1.2.7 个性化邮件 17
1.2.8 个性化广告 18
1.3 推荐系统评测 19
1.3.1 推荐系统实验方法 20
1.3.2 评测指标 23
1.3.3 评测维度 34
第2章 利用用户行为数据 35
2.1 用户行为数据简介 36
2.2 用户行为分析 39
2.2.1 用户活跃度和物品流行度的分布 39
2.2.2 用户活跃度和物品流行度的关系 41
2.3 实验设计和算法评测 41
2.3.1 数据集 42
2.3.2 实验设计 42
2.3.3 评测指标 42
2.4 基于邻域的算法 44
2.4.1 基于用户的协同过滤算法 44
2.4.2 基于物品的协同过滤算法 51
2.4.3 UserCF和ItemCF的综合比较 59
2.5 隐语义模型 64
2.5.1 基础算法 64
2.5.2 基于LFM的实际系统的例子 70
2.5.3 LFM和基于邻域的方法的比较 72
2.6 基于图的模型 73
2.6.1 用户行为数据的二分图表示 73
2.6.2 基于图的推荐算法 73
第3章 推荐系统冷启动问题 78
3.1 冷启动问题简介 78
3.2 利用用户注册信息 79
3.3 选择合适的物品启动用户的兴趣 85
3.4 利用物品的内容信息 89
3.5 发挥专家的作用 94
第4章 利用用户标签数据 96
4.1 UGC标签系统的代表应用 97
4.1.1 Delicious 97
4.1.2 CiteULike 98
4.1.3 Last.fm 98
4.1.4 豆瓣 99
4.1.5 Hulu 99
4.2 标签系统中的推荐问题 100
4.2.1 用户为什么进行标注 100
4.2.2 用户如何打标签 101
4.2.3 用户打什么样的标签 102
4.3 基于标签的推荐系统 103
4.3.1 实验设置 104
4.3.2 一个最简单的算法 105
4.3.3 算法的改进 107
4.3.4 基于图的推荐算法 110
4.3.5 基于标签的推荐解释 112
4.4 给用户推荐标签 115
4.4.1 为什么要给用户推荐标签 115
4.4.2 如何给用户推荐标签 115
4.4.3 实验设置 116
4.4.4 基于图的标签推荐算法 119
4.5 扩展阅读 119
第5章 利用上下文信息 121
5.1 时间上下文信息 122
5.1.1 时间效应简介 122
5.1.2 时间效应举例 123
5.1.3 系统时间特性的分析 125
5.1.4 推荐系统的实时性 127
5.1.5 推荐算法的时间多样性 128
5.1.6 时间上下文推荐算法 130
5.1.7 时间段图模型 134
5.1.8 离线实验 136
5.2 地点上下文信息 139
5.3 扩展阅读 143
第6章 利用社交网络数据 144
6.1 获取社交网络数据的途径 144
6.1.1 电子邮件 145
6.1.2 用户注册信息 146
6.1.3 用户的位置数据 146
6.1.4 论坛和讨论组 146
6.1.5 即时聊天工具 147
6.1.6 社交网站 147
6.2 社交网络数据简介 148社交网络数据中的长尾分布 149
6.3 基于社交网络的推荐 150
6.3.1 基于邻域的社会化推荐算法 151
6.3.2 基于图的社会化推荐算法 152
6.3.3 实际系统中的社会化推荐算法 153
6.3.4 社会化推荐系统和协同过滤推荐系统 155
6.3.5 信息流推荐 156
6.4 给用户推荐好友 159
6.4.1 基于内容的匹配 161
6.4.2 基于共同兴趣的好友推荐 161
6.4.3 基于社交网络图的好友推荐 161
6.4.4 基于用户调查的好友推荐算法对比 164
6.5 扩展阅读 165
第7章 推荐系统实例 166
7.1 外围架构 166
7.2 推荐系统架构 167
7.3 推荐引擎的架构 171
7.3.1 生成用户特征向量 172
7.3.2 特征?物品相关推荐 173
7.3.3 过滤模块 174
7.3.4 排名模块 174
7.4 扩展阅读 178
第8章 评分预测问题 179
8.1 离线实验方法 180
8.2 评分预测算法 180
8.2.1 平均值 180
8.2.2 基于邻域的方法 184
8.2.3 隐语义模型与矩阵分解模型 186
8.2.4 加入时间信息 192
8.2.5 模型融合 193
8.2.6 Netflix Prize的相关实验结果 195
后记 196
《表演与偷窥》内容简介:本书是小白最新结集的随笔集,延续作者上一本畅销随笔集《好色的哈姆莱特》的特点——“以男女之事的瓶子
《思想政治理论金榜书》内容简介:本书是一本由双一流大学对口专业教授、学者合作编写的考研政治辅导教材,并严格依据教育部所颁布
《二手房装修改造常犯的110个错误》内容简介:每个做过二手房装修改造的人都有这样的经历,完成装修后,发现由于当初不了解关于装修
字体对于很多刚开始接触学习的人来说,是一条很难跨越的鸿沟,虽然国内外也有相关方面的书籍(以国外作品为主),但终究还是不适
《西南联大国学课》内容简介:西南联大的通识教育深刻地影响了中国的一代学者,为他们所创造的成就奠定了深厚的基础。本套图书力图
《把你的草稿钉在墙上》是在美国华盛顿大学视觉传达专业学习的中国学生刘兰兰,对于其专业学习的笔记、总结和感受,深入记录了她
《美国陆军图鉴(下册)》内容简介:美国陆军是一支具备全球部署及作战能力的地面军事力量。本书以彩图图解的方式,系统介绍了美国
客觀的結構式臨床測驗(ObjectiveStructuredClinicalExamination,OSCE)是評估臨床能力的方式,藉由模擬臨床情境配合臨床檢驗...
《独坐》内容简介:阅读的过程,从一开始的“围坐”渐渐变成“独坐”的时候,你也许已经能够在那书本知识的五彩斑斓里遨游了,或许
5天通过职称计算机考试PHOTOSHOPCS5 图像处理 本书特色 紧扣*新大纲:*新的精编试题,完全覆盖大纲要求的9大知识模块考点视频串讲:详细讲解每个考点的...
动画艺术辞典 内容简介 动画是一种高浓缩的介质,把许许多多有趣的、美好的、实在的或是虚幻的事物包含在了一个紧凑的时间和空间里。可以说目前没有任何一种视觉艺术能够...
《有一种旋律叫梁祝》内容简介:本书以《梁祝的继承者们》完整剧本为主体,该剧是“生活三部曲”的第一部,即“艺术家”,也是非常
《Excel数据分析与可视化》内容简介:本书以项目为导向,由浅入深地介绍Excel在数据分析与可视化方面的应用。全书以“自动售货机”
《千姿百态看德国·教育篇(汉德对照)》内容简介:这套《千姿百态看德国》丛书为了满足我国广大德语学习者学好德语和了解德国,进
《汽车标识符号全知道》内容简介:《汽车标识符号全知道》按品牌标识、车身上标识、驾驶操作标识的顺序,以图解的方式对汽车上常见
21天学通C语言(第6版)(附光盘) 内容简介 本书译自《Teach Yourself C in 21 Days》第6版,该书的前五版都登上了畅销书排行榜,是初...
《CSS艺匠之门》从标题、图片、背景、导航、表单、表格和圆角效果等几方面,介绍CSS设计的神奇作用。《CSS艺匠之门》将CSS和Java
《闲言碎语》内容简介:本书是知名设计师历经7年沉淀的设计思路与方法论集合,其中既保留了个人的情绪与判断,也时常回想笔者多年来
《庄子讲义(精)》内容简介:陈引驰教授是《庄子》乃至道教佛教文学领域首屈一指的学者,他在复旦大学开设的“《庄子》精读”课历
《财神的名单》内容简介:跟你讲的是18个商业大人物成功背后的故事。阅读着他们的精彩,既丰富了谈资,也可以思考一下自己的人生。