内容简介:
随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载(information overload)的时代 。在这个时代,无论是信息消费者还是信息生产者都遇到了很大的挑战:对于信息消费者,从大量信息中找到自己感兴趣的信息是一件非常困难的事情;对于信息生产者,让自己生产的信息脱颖而出,受到广大用户的关注,也是一件非常困难的事情。推荐系统就是解决这一矛盾的重要工具。推荐系统的任务就是联系用户和信息,一方面帮助用户发现对自己有价值的信息,另一方面让信息能够展现在对它感兴趣的用户面前,从而实现信息消费者和信息生产者的双赢。
目 录
第1章 好的推荐系统 1
1.1 什么是推荐系统 1
1.2 个性化推荐系统的应用 4
1.2.1 电子商务 4
1.2.2 电影和视频网站 8
1.2.3 个性化音乐网络电台 10
1.2.4 社交网络 12
1.2.5 个性化阅读 15
1.2.6 基于位置的服务 16
1.2.7 个性化邮件 17
1.2.8 个性化广告 18
1.3 推荐系统评测 19
1.3.1 推荐系统实验方法 20
1.3.2 评测指标 23
1.3.3 评测维度 34
第2章 利用用户行为数据 35
2.1 用户行为数据简介 36
2.2 用户行为分析 39
2.2.1 用户活跃度和物品流行度的分布 39
2.2.2 用户活跃度和物品流行度的关系 41
2.3 实验设计和算法评测 41
2.3.1 数据集 42
2.3.2 实验设计 42
2.3.3 评测指标 42
2.4 基于邻域的算法 44
2.4.1 基于用户的协同过滤算法 44
2.4.2 基于物品的协同过滤算法 51
2.4.3 UserCF和ItemCF的综合比较 59
2.5 隐语义模型 64
2.5.1 基础算法 64
2.5.2 基于LFM的实际系统的例子 70
2.5.3 LFM和基于邻域的方法的比较 72
2.6 基于图的模型 73
2.6.1 用户行为数据的二分图表示 73
2.6.2 基于图的推荐算法 73
第3章 推荐系统冷启动问题 78
3.1 冷启动问题简介 78
3.2 利用用户注册信息 79
3.3 选择合适的物品启动用户的兴趣 85
3.4 利用物品的内容信息 89
3.5 发挥专家的作用 94
第4章 利用用户标签数据 96
4.1 UGC标签系统的代表应用 97
4.1.1 Delicious 97
4.1.2 CiteULike 98
4.1.3 Last.fm 98
4.1.4 豆瓣 99
4.1.5 Hulu 99
4.2 标签系统中的推荐问题 100
4.2.1 用户为什么进行标注 100
4.2.2 用户如何打标签 101
4.2.3 用户打什么样的标签 102
4.3 基于标签的推荐系统 103
4.3.1 实验设置 104
4.3.2 一个最简单的算法 105
4.3.3 算法的改进 107
4.3.4 基于图的推荐算法 110
4.3.5 基于标签的推荐解释 112
4.4 给用户推荐标签 115
4.4.1 为什么要给用户推荐标签 115
4.4.2 如何给用户推荐标签 115
4.4.3 实验设置 116
4.4.4 基于图的标签推荐算法 119
4.5 扩展阅读 119
第5章 利用上下文信息 121
5.1 时间上下文信息 122
5.1.1 时间效应简介 122
5.1.2 时间效应举例 123
5.1.3 系统时间特性的分析 125
5.1.4 推荐系统的实时性 127
5.1.5 推荐算法的时间多样性 128
5.1.6 时间上下文推荐算法 130
5.1.7 时间段图模型 134
5.1.8 离线实验 136
5.2 地点上下文信息 139
5.3 扩展阅读 143
第6章 利用社交网络数据 144
6.1 获取社交网络数据的途径 144
6.1.1 电子邮件 145
6.1.2 用户注册信息 146
6.1.3 用户的位置数据 146
6.1.4 论坛和讨论组 146
6.1.5 即时聊天工具 147
6.1.6 社交网站 147
6.2 社交网络数据简介 148社交网络数据中的长尾分布 149
6.3 基于社交网络的推荐 150
6.3.1 基于邻域的社会化推荐算法 151
6.3.2 基于图的社会化推荐算法 152
6.3.3 实际系统中的社会化推荐算法 153
6.3.4 社会化推荐系统和协同过滤推荐系统 155
6.3.5 信息流推荐 156
6.4 给用户推荐好友 159
6.4.1 基于内容的匹配 161
6.4.2 基于共同兴趣的好友推荐 161
6.4.3 基于社交网络图的好友推荐 161
6.4.4 基于用户调查的好友推荐算法对比 164
6.5 扩展阅读 165
第7章 推荐系统实例 166
7.1 外围架构 166
7.2 推荐系统架构 167
7.3 推荐引擎的架构 171
7.3.1 生成用户特征向量 172
7.3.2 特征?物品相关推荐 173
7.3.3 过滤模块 174
7.3.4 排名模块 174
7.4 扩展阅读 178
第8章 评分预测问题 179
8.1 离线实验方法 180
8.2 评分预测算法 180
8.2.1 平均值 180
8.2.2 基于邻域的方法 184
8.2.3 隐语义模型与矩阵分解模型 186
8.2.4 加入时间信息 192
8.2.5 模型融合 193
8.2.6 Netflix Prize的相关实验结果 195
后记 196
SolidWorks 2016机械设计从入门到精通-中文版-(附光盘) 本书特色 solidworks是世界上首套专门基于windows系统开发的三维cad软件...
《高达模型制作技巧指南》内容简介:本书主要介绍制作高达模型用到的工具、油漆种类、涂装技巧、特殊效果涂装等知识。为了不让大家
《新型冠状病毒肺炎防护手册》内容简介:编者基于当前对新型冠状病毒肺炎的认识和防控策略,对疫情防控相关政策、法律法规、信息和
本书从实践者的角度,在讲解Docker高级实践技巧的同时,深入到源代码层次,为读者梳理出Docker容器技术和基于Docker的容器云技术
飞行研究是飞机设计过程中一个不可缺少和不可分割的部分,人们研制了许多种型号的飞机来试验各种新的设计,演示一些特别的新技术
Photoshop CS4平面广告设计经典108例-含2DVD 内容简介 本书是一本Photoshop CS4的平面设计案例教程,也是一本Photoshop商业...
《戚继光(中华先贤人物故事汇)》内容简介:戚继光,明朝抗倭名将,杰出的军事家、书法家、诗人、民族英雄。戚继光在东南沿海抗击
Designingabrochureorwebsitewithoutanartbackground?Stepawayfromthecomputerandread...
《炉边诗话》内容简介:本作品是作者写于上世纪80年代的一部解读古诗的集子,写在冬天,室内有一只取暖的炉子,故为此名。颇有于炉
快学快用电脑上网技巧1088招附光盘 内容简介 本书全面介绍了电脑上网的操作技能和应用技巧,帮助读者全面、快速地掌握电脑上网的方法,提高工作效率,成为网上冲浪高...
《AndroidUI基础教程》介绍了Android编程专家JasonOstrander将展示如何为Android应用程序创建用户界面。《AndroidUI基础教...
Namedoneofthegreatestmindsofthe20thcenturybyTime,TimBerners-Leeisresponsibleforo...
《刘彦斌的理财之道》内容简介:每个人的生活都离不开金钱。所谓管钱,就是理财。理财是一种生活技能,掌握好理财的技能,对于提高
《idea+提升创意力的设计诀窍书》内容简介:没有设计素材怎么办?如何在经费捉襟见肘的情况下做出好设计?怎样运用不同的设计软件
第1部分网页设计第1章网页设计的原则1.1了解分析客户需求1.2网站的项目规划第2章网页设计的框架2.1网页的框架结构第3章网页设
多位巴黎手作创意人专为这本书提供了原创手工作品的制作方法及步骤,将私房小店与读者亲密分享。这本书里的创意人,多有颇具规模
Afascinatingexplorationofhowinsightsfromcomputeralgorithmscanbeappliedtoourevery...
《GIS在城市管理中的应用》主要介绍GIS基本功能在城市管理中的具体使用与实现途径。分别针对城市综合应用、城市规划、城市土地管
《无线数据通信技术揭密》介绍了高速无线数据网络和移动因特网技术。重点是指导有经验的移动因特网专业技术人员快速安装无线数据
本书是权威的Python语言参考指南,内容涉及核心Python语言和Python库的最重要部分。本书内容简洁扼要、可读性强,书中还包括了一