内容简介:
随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载(information overload)的时代 。在这个时代,无论是信息消费者还是信息生产者都遇到了很大的挑战:对于信息消费者,从大量信息中找到自己感兴趣的信息是一件非常困难的事情;对于信息生产者,让自己生产的信息脱颖而出,受到广大用户的关注,也是一件非常困难的事情。推荐系统就是解决这一矛盾的重要工具。推荐系统的任务就是联系用户和信息,一方面帮助用户发现对自己有价值的信息,另一方面让信息能够展现在对它感兴趣的用户面前,从而实现信息消费者和信息生产者的双赢。
目 录
第1章 好的推荐系统 1
1.1 什么是推荐系统 1
1.2 个性化推荐系统的应用 4
1.2.1 电子商务 4
1.2.2 电影和视频网站 8
1.2.3 个性化音乐网络电台 10
1.2.4 社交网络 12
1.2.5 个性化阅读 15
1.2.6 基于位置的服务 16
1.2.7 个性化邮件 17
1.2.8 个性化广告 18
1.3 推荐系统评测 19
1.3.1 推荐系统实验方法 20
1.3.2 评测指标 23
1.3.3 评测维度 34
第2章 利用用户行为数据 35
2.1 用户行为数据简介 36
2.2 用户行为分析 39
2.2.1 用户活跃度和物品流行度的分布 39
2.2.2 用户活跃度和物品流行度的关系 41
2.3 实验设计和算法评测 41
2.3.1 数据集 42
2.3.2 实验设计 42
2.3.3 评测指标 42
2.4 基于邻域的算法 44
2.4.1 基于用户的协同过滤算法 44
2.4.2 基于物品的协同过滤算法 51
2.4.3 UserCF和ItemCF的综合比较 59
2.5 隐语义模型 64
2.5.1 基础算法 64
2.5.2 基于LFM的实际系统的例子 70
2.5.3 LFM和基于邻域的方法的比较 72
2.6 基于图的模型 73
2.6.1 用户行为数据的二分图表示 73
2.6.2 基于图的推荐算法 73
第3章 推荐系统冷启动问题 78
3.1 冷启动问题简介 78
3.2 利用用户注册信息 79
3.3 选择合适的物品启动用户的兴趣 85
3.4 利用物品的内容信息 89
3.5 发挥专家的作用 94
第4章 利用用户标签数据 96
4.1 UGC标签系统的代表应用 97
4.1.1 Delicious 97
4.1.2 CiteULike 98
4.1.3 Last.fm 98
4.1.4 豆瓣 99
4.1.5 Hulu 99
4.2 标签系统中的推荐问题 100
4.2.1 用户为什么进行标注 100
4.2.2 用户如何打标签 101
4.2.3 用户打什么样的标签 102
4.3 基于标签的推荐系统 103
4.3.1 实验设置 104
4.3.2 一个最简单的算法 105
4.3.3 算法的改进 107
4.3.4 基于图的推荐算法 110
4.3.5 基于标签的推荐解释 112
4.4 给用户推荐标签 115
4.4.1 为什么要给用户推荐标签 115
4.4.2 如何给用户推荐标签 115
4.4.3 实验设置 116
4.4.4 基于图的标签推荐算法 119
4.5 扩展阅读 119
第5章 利用上下文信息 121
5.1 时间上下文信息 122
5.1.1 时间效应简介 122
5.1.2 时间效应举例 123
5.1.3 系统时间特性的分析 125
5.1.4 推荐系统的实时性 127
5.1.5 推荐算法的时间多样性 128
5.1.6 时间上下文推荐算法 130
5.1.7 时间段图模型 134
5.1.8 离线实验 136
5.2 地点上下文信息 139
5.3 扩展阅读 143
第6章 利用社交网络数据 144
6.1 获取社交网络数据的途径 144
6.1.1 电子邮件 145
6.1.2 用户注册信息 146
6.1.3 用户的位置数据 146
6.1.4 论坛和讨论组 146
6.1.5 即时聊天工具 147
6.1.6 社交网站 147
6.2 社交网络数据简介 148社交网络数据中的长尾分布 149
6.3 基于社交网络的推荐 150
6.3.1 基于邻域的社会化推荐算法 151
6.3.2 基于图的社会化推荐算法 152
6.3.3 实际系统中的社会化推荐算法 153
6.3.4 社会化推荐系统和协同过滤推荐系统 155
6.3.5 信息流推荐 156
6.4 给用户推荐好友 159
6.4.1 基于内容的匹配 161
6.4.2 基于共同兴趣的好友推荐 161
6.4.3 基于社交网络图的好友推荐 161
6.4.4 基于用户调查的好友推荐算法对比 164
6.5 扩展阅读 165
第7章 推荐系统实例 166
7.1 外围架构 166
7.2 推荐系统架构 167
7.3 推荐引擎的架构 171
7.3.1 生成用户特征向量 172
7.3.2 特征?物品相关推荐 173
7.3.3 过滤模块 174
7.3.4 排名模块 174
7.4 扩展阅读 178
第8章 评分预测问题 179
8.1 离线实验方法 180
8.2 评分预测算法 180
8.2.1 平均值 180
8.2.2 基于邻域的方法 184
8.2.3 隐语义模型与矩阵分解模型 186
8.2.4 加入时间信息 192
8.2.5 模型融合 193
8.2.6 Netflix Prize的相关实验结果 195
后记 196
“法国文化电台”记者R·舍普就目前法国社会较为关心的,关于科技对社会的影响的问题,采访了法国学界的一些人士。采访笔录形成了
“即便我已经使用Erlang多年,在编程的时候仍然需要参考《Erlang编程指南》。不同层次的Erlang程序员都会发现本书是有价值的学习
《唐宋小古人:趣味游戏书》内容简介:响应国家“让文物活起来”的号召,同时让4-10岁的小观众在家长的陪同下也能参与展览,热爱中
《思想的传承与决裂:以 “犹太人问题”为中心的考察》内容简介:在马克思早期思想演变中,青年黑格尔派是一个非常重要的思想背景和
《生活英语口语100主题》内容简介:互联网+时代,你最需要的英语学习书!新东方、英孚等资深外教诚恳推荐,生活英语完全收录,让你
实用灰色预测建模方法及其MATLAB程序实现 本书特色 随着灰色理论研究的不断深入及研究成果的大量涌现,灰色预测模型理论体系日趋完善,同时也出现了数以百计结构各...
本书是一本全面介绍3G系统特别是通用移动通信系统(UMTS)网络的专著。本书的一大特色是详细介绍了WCDMA标准所采用的UMTS网络,包
亨利·施莱辛格所著的《电池的秘史——引发技术革命的便携式电源》为了叙述清楚,将那些互不相干或互不搭界的内容联系在了一起。
《网旋风:Animate动画广告创意直播》内容简介:随着互联网时代的发展,互联网上的广告也逐渐发展起来,网络广告课程随之成为各大高
《玩转微商》内容简介:自2014年开始,微商成为一个十分热门的关键词,随着就业难的问题,微商由于较低的准入门槛,受到了很多大学
AppropriateforcoursestitledComputerNetworkingorIntroductiontoNetworkingatboththe...
《GPU精粹:实时图形编程的技术技巧和技艺》汇集了当今国际上前沿开发者们经多年研究和实践得出的实用的实时图形技术成果。《GPU精
《情绪聚焦疗法的刻意练习》内容简介:近年来,心理治疗的刻意练习得到广泛的关注,其对心理治疗效果的预测得到了相当程度的验证,
《ANSYS 18.0有限元分析从入门到精通(升级版)》内容简介:本书采用GUI界面操作与APDL命令相互对照的方式,从基础知识、专题技术两
《心智模型的阐释:结构、过程与影响》主要内容:共享心智模型和目前企业流行的理念——学习型组织有着密切的关系。作为创建学习型
《中国生态文明新时代》内容简介:随着中国特色社会主义进入新时代,生态文明建设也进入了新时代。在新中国生态文明建设成就和经验
《多人在线游戏架构实战:基于C++的分布式游戏编程》内容简介:本书主要讲述大型多人在线游戏开发的框架与编程实践,以实际例子来介
Thisauthoritativetreatmentofthefundamentalsofmobilecommunicationsstressesthe"fun...
Asoneofthemostcomprehensivemachinelearningtextsaround,thisbookdoesjusticetothefi...
中文版Word 2003图文排版专业技能培训教程-职场制胜 本书特色 本书是电脑专业技能培训教程系列之一,它集多位word图文设计专家的实践经验,总结出一条图文...