内容简介:
随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载(information overload)的时代 。在这个时代,无论是信息消费者还是信息生产者都遇到了很大的挑战:对于信息消费者,从大量信息中找到自己感兴趣的信息是一件非常困难的事情;对于信息生产者,让自己生产的信息脱颖而出,受到广大用户的关注,也是一件非常困难的事情。推荐系统就是解决这一矛盾的重要工具。推荐系统的任务就是联系用户和信息,一方面帮助用户发现对自己有价值的信息,另一方面让信息能够展现在对它感兴趣的用户面前,从而实现信息消费者和信息生产者的双赢。
目 录
第1章 好的推荐系统 1
1.1 什么是推荐系统 1
1.2 个性化推荐系统的应用 4
1.2.1 电子商务 4
1.2.2 电影和视频网站 8
1.2.3 个性化音乐网络电台 10
1.2.4 社交网络 12
1.2.5 个性化阅读 15
1.2.6 基于位置的服务 16
1.2.7 个性化邮件 17
1.2.8 个性化广告 18
1.3 推荐系统评测 19
1.3.1 推荐系统实验方法 20
1.3.2 评测指标 23
1.3.3 评测维度 34
第2章 利用用户行为数据 35
2.1 用户行为数据简介 36
2.2 用户行为分析 39
2.2.1 用户活跃度和物品流行度的分布 39
2.2.2 用户活跃度和物品流行度的关系 41
2.3 实验设计和算法评测 41
2.3.1 数据集 42
2.3.2 实验设计 42
2.3.3 评测指标 42
2.4 基于邻域的算法 44
2.4.1 基于用户的协同过滤算法 44
2.4.2 基于物品的协同过滤算法 51
2.4.3 UserCF和ItemCF的综合比较 59
2.5 隐语义模型 64
2.5.1 基础算法 64
2.5.2 基于LFM的实际系统的例子 70
2.5.3 LFM和基于邻域的方法的比较 72
2.6 基于图的模型 73
2.6.1 用户行为数据的二分图表示 73
2.6.2 基于图的推荐算法 73
第3章 推荐系统冷启动问题 78
3.1 冷启动问题简介 78
3.2 利用用户注册信息 79
3.3 选择合适的物品启动用户的兴趣 85
3.4 利用物品的内容信息 89
3.5 发挥专家的作用 94
第4章 利用用户标签数据 96
4.1 UGC标签系统的代表应用 97
4.1.1 Delicious 97
4.1.2 CiteULike 98
4.1.3 Last.fm 98
4.1.4 豆瓣 99
4.1.5 Hulu 99
4.2 标签系统中的推荐问题 100
4.2.1 用户为什么进行标注 100
4.2.2 用户如何打标签 101
4.2.3 用户打什么样的标签 102
4.3 基于标签的推荐系统 103
4.3.1 实验设置 104
4.3.2 一个最简单的算法 105
4.3.3 算法的改进 107
4.3.4 基于图的推荐算法 110
4.3.5 基于标签的推荐解释 112
4.4 给用户推荐标签 115
4.4.1 为什么要给用户推荐标签 115
4.4.2 如何给用户推荐标签 115
4.4.3 实验设置 116
4.4.4 基于图的标签推荐算法 119
4.5 扩展阅读 119
第5章 利用上下文信息 121
5.1 时间上下文信息 122
5.1.1 时间效应简介 122
5.1.2 时间效应举例 123
5.1.3 系统时间特性的分析 125
5.1.4 推荐系统的实时性 127
5.1.5 推荐算法的时间多样性 128
5.1.6 时间上下文推荐算法 130
5.1.7 时间段图模型 134
5.1.8 离线实验 136
5.2 地点上下文信息 139
5.3 扩展阅读 143
第6章 利用社交网络数据 144
6.1 获取社交网络数据的途径 144
6.1.1 电子邮件 145
6.1.2 用户注册信息 146
6.1.3 用户的位置数据 146
6.1.4 论坛和讨论组 146
6.1.5 即时聊天工具 147
6.1.6 社交网站 147
6.2 社交网络数据简介 148社交网络数据中的长尾分布 149
6.3 基于社交网络的推荐 150
6.3.1 基于邻域的社会化推荐算法 151
6.3.2 基于图的社会化推荐算法 152
6.3.3 实际系统中的社会化推荐算法 153
6.3.4 社会化推荐系统和协同过滤推荐系统 155
6.3.5 信息流推荐 156
6.4 给用户推荐好友 159
6.4.1 基于内容的匹配 161
6.4.2 基于共同兴趣的好友推荐 161
6.4.3 基于社交网络图的好友推荐 161
6.4.4 基于用户调查的好友推荐算法对比 164
6.5 扩展阅读 165
第7章 推荐系统实例 166
7.1 外围架构 166
7.2 推荐系统架构 167
7.3 推荐引擎的架构 171
7.3.1 生成用户特征向量 172
7.3.2 特征?物品相关推荐 173
7.3.3 过滤模块 174
7.3.4 排名模块 174
7.4 扩展阅读 178
第8章 评分预测问题 179
8.1 离线实验方法 180
8.2 评分预测算法 180
8.2.1 平均值 180
8.2.2 基于邻域的方法 184
8.2.3 隐语义模型与矩阵分解模型 186
8.2.4 加入时间信息 192
8.2.5 模型融合 193
8.2.6 Netflix Prize的相关实验结果 195
后记 196
NationalBestseller“Nootherbookofferssuchanaccessibleandbalancedtourofthemanybene...
《黄帝内经·望诊奇术》内容简介:★来自《黄帝内经》中数十种望诊智慧,不仅知面,更能知身体五脏六腑的盛衰 人的命、运,往往会反
《“互联网+”语境下中国电视剧产业融合创新研究》内容简介:本书主要研究在“互联网+语境,中国电视剧产业是怎样通过供给侧改革进
Python绝技-运用Python成为顶级黑客 本书特色 python是一门常用的编程语言,它不仅上手容易,而且还拥有丰富的支持库。对经常需要针对自己所处的特定...
《有一种境界叫苏东坡·3》内容简介:《有一种境界叫苏东坡·3》主要讲述了中、老年时期的苏东坡在政治、文学上的成就及其情感生活
《Python 3反爬虫原理与绕过实战》内容简介:本书首先介绍了开发环境的配置,接着讨论了Web网站的构成和页面渲染、动态网页和静态网
《元宇宙:数字化生存新机遇》内容简介:社会生活和经济活动将向元宇宙大迁徙。我们将生活在一个真实与虚拟共生的新世界。在这种新
《转型:工业4.0时代的按需印刷》内容简介:当前,全球制造业正加速进入数字化、智能化时代,在这样波澜壮阔的大背景下,积极转型,
《工笔画技法从入门到精通》内容简介:本书是一本工笔画绘制基础教程,从工笔画工具的选用讲起,介绍了工笔画的基础知识和基础技法
周鸿祎作序推荐!全球科技圈产品经理争相学习的产品管理秘笈!以用户思维管理产品,管理团队,管理自我,学会比其他人更聪明、更
《MBA、MPA、MPAcc、MEM管理类联考综合能力逻辑最后冲刺18套卷(含快速提分技法)》内容简介:主要内容是作者收集的除了历年真题以
在本书中,Lakos介绍了将大型系统分解成较小且较好管理的组件层次结构(不是继承)的过程。这种具有非循环物理依赖的系统的维护、
Dashboardshavebecomepopularinrecentyearsasuniquelypowerfultoolsforcommunicatingi...
《现代化的政治》内容简介:该书对发展中国家的政治现代化道路进行了深入的分析,特别是在实现政治现代化的过程中影响政治变革的一
《陈慕泽2020年管理类联考(MBA/MPA/MPAcc等)综合能力逻辑精选450题》内容简介:本书主要内容为管理类联考逻辑应试辅导用书,涉及
《空间信息网络传输协议》内容简介:本书系统、全面地介绍了空间信息网络的特点及其对传输协议造成的影响;重点介绍和讨论了空间信
《从维熙自选集》内容简介:从维熙的作品,无论小说还是散文,都演绎着中国历史以及作者个人的深切感悟。本书精选了他优秀且极具代
本书根据最新的2.6.24内核为基础。在讲述方式上,本书注重实例分析,尽量在讨论“如何做”的基础上,深入讨论为什么要这么做,从
《轻松看懂体检报告(第二版)》内容简介:本书分为三篇,首篇向广大读者介绍健康体检的常规和基础知识。第二篇针对成人体检,按照
再生利用|藝術修復|自然材料|生態住家中古公寓、透天、獨棟、古厝、三合院的綠色變身改造!採光、通風、有機的家--綠色版〔