如何能牢牢地黏住老用户、吸引新用户、读懂用户的偏好兴趣和喜怒哀乐,这都是对企业发展至关重要甚至关乎生死存亡的问题,解决这个问题的方法就是推荐系统。本书分为上中下三篇,共13章,上篇为用户画像知识工程基础,包括表征建模、画像计算、存储及各种更新维护等管理操作;中篇为推荐系统与用户画像,包括传统协同过滤等经典推荐算法的介绍,以及涉及用户画像的推荐方法;下篇为应用案例分析,包括Netflix、阿里等数据竞赛的经典数据案例,以及在具体工程开发过程的具体案例,分别从系统需求、总体结构、算法设计、运行流程及测试结果等五个方面提供详细案例指导。
上 篇
第1章 用户画像概述 3
1.1 用户画像数据来源 3
1.1.1 用户属性 5
1.1.2 用户观影行为 5
1.2 用户画像特性 5
1.2.1 动态性 5
1.2.2 时空局部性 6
1.3 用户画像应用领域 6
1.3.1 搜索引擎 6
1.3.2 推荐系统 7
1.3.3 其他业务定制与优化 7
1.4 大数据给用户画像带来的机遇与挑战 8
第2章 用户画像建模 9
2.1 用户定量画像 9
2.2 用户定性画像 10
2.2.1 标签与用户定性画像 10
2.2.2 基于知识的用户定性画像分析 12
2.2.3 用户定性画像的构建 16
2.2.4 定性画像知识的存储 22
2.2.5 定性画像知识的推理 26
2.3 本章参考文献 29
第3章 群体用户画像分析 31
3.1 用户画像相似度 32
3.1.1 定量相似度计算 32
3.1.2 定性相似度计算 34
3.1.3 综合相似度计算 35
3.2 用户画像聚类 36
第4章 用户画像管理 41
4.1 存储机制 41
4.1.1 关系型数据库 42
4.1.2 NoSQL数据库 43
4.1.3 数据仓库 45
4.2 查询机制 46
4.3 定时更新机制 47
4.3.1 获取实时用户信息 47
4.3.2 更新触发条件 48
4.3.3 更新机制 49
中 篇
第5章 视频推荐概述 55
5.1 主流推荐方法的分类 56
5.1.1 协同过滤的推荐方法 56
5.1.2 基于内容的推荐方法 57
5.1.3 基于知识的推荐方法 59
5.1.4 混合推荐方法 60
5.2 推荐系统的评测方法 61
5.3 视频推荐与用户画像的逻辑关系 61
第6章 协同过滤推荐方法 65
6.1 概述 65
6.2 关系矩阵及矩阵计算 67
6.2.1 U-U矩阵 67
6.2.2 V-V矩阵 70
6.2.3 U-V矩阵 72
6.3 基于记忆的协同过滤算法 74
6.3.1 基于用户的协同过滤算法 75
6.3.2 基于物品的协同过滤算法 78
6.4 基于模型的协同过滤算法 81
6.4.1 基于隐因子模型的推荐算法 82
6.4.2 基于朴素贝叶斯分类的推荐算法 85
6.5 小结 88
6.6 本章参考文献 88
第7章 基于内容的推荐方法 91
7.1 概述 91
7.2 CB推荐中的特征向量 94
7.2.1 视频推荐中的物品画像 94
7.2.2 视频推荐中的用户画像 96
7.3 基础CB推荐算法 97
7.4 基于TF-IDF的CB推荐算法 99
7.5 基于KNN的CB推荐算法 102
7.6 基于Rocchio的CB推荐算法 104
7.7 基于决策树的CB推荐算法 106
7.8 基于线性分类的CB推荐算法 107
7.9 基于朴素贝叶斯的CB推荐算法 109
7.10 小结 111
7.11 本章参考文献 111
第8章 基于知识的推荐方法 113
8.1 概述 113
8.2 约束知识与约束推荐算法 114
8.2.1 约束知识示例 114
8.2.2 约束满足问题 115
8.2.3 约束推荐算法流程 117
8.3 关联知识与关联推荐算法 118
8.3.1 关联规则描述 118
8.3.2 关联规则挖掘 121
8.3.3 关联推荐算法流程 123
8.4 小结 124
8.5 本章参考文献 124
第9章 混合推荐方法 125
9.1 概述 125
9.2 算法设计层面的混合方法 126
9.2.1 并行式混合 126
9.2.2 整体式混合 129
9.2.3 流水线式混合 131
9.2.4 典型混合应用系统 133
9.3 混合式视频推荐实例 136
9.3.1 MoRe系统概览 136
9.3.2 MoRe算法介绍 137
9.3.3 MoRe算法混合 139
9.3.4 MoRe实验分析 140
9.4 小结 142
9.5 本章参考文献 142
第10章 视频推荐评测 145
10.1 概述 145
10.2 视频推荐试验方法 146
10.2.1 在线评测 147
10.2.2 离线评测 149
10.2.3 用户调查 150
10.3 视频离线推荐评测指标 151
10.3.1 准确度指标 151
10.3.2 多样性指标 159
10.4 小结 161
10.5 本章参考文献 162
下 篇
第11章 系统层面的快速推荐构建 165
11.1 概述 165
11.2 本章主要内容 166
11.3 系统部署 166
11.3.1 Hadoop2.2.0系统部署 166
11.3.2 Hadoop运行时环境设置 169
11.3.3 Spark与Mahout部署 175
11.4 Mahout推荐引擎介绍 181
11.4.1 Item-based算法 181
11.4.2 矩阵分解 185
11.4.3 ALS算法 187
11.4.4 Mahout的Spark实现 190
11.5 快速实战 193
11.5.1 概述 193
11.5.2 日志数据 194
11.5.3 运行环境 196
11.5.4 基于Mahout Item-based算法实践 201
11.5.5 基于Mahout ALS算法实践 205
11.6 小结 208
11.7 本章参考文献 208
第12章 数据层面的分析与推荐案例 211
12.1 概述 211
12.2 本章主要内容 212
12.3 竞赛内容和意义 212
12.3.1 竞赛简介 212
12.3.2 竞赛任务和意义 213
12.4 客户-商户数据 215
12.4.1 数据描述 215
12.4.2 数据理解与分析 217
12.5 算法流程设计 219
12.5.1 特征提取 219
12.5.2 分类器设计 220
12.5.3 算法流程总结 222
12.6 小结 222
12.7 本章参考文献 223
《江河之上:三江源的历史与地理》内容简介:本书从历史、地理、人文的角度,进行钩沉梳理、深入探寻。作者对三江源牧区、河流、自
《元代辽阳行省女真人研究》内容简介:本书对元代辽阳行省女真人进行全景式系列研究。书中将元代辽阳行省女真人分成北部、东部、南
《Three.js开发指南(原书第3版)》内容简介:本书将介绍如何直接在浏览器中创建漂亮的3D场景和动画,并且充分发挥WebGL和现代浏览
《普通高等教育十一五国家级规划教材•模拟电子电路及技术基础》分两篇,共11章。第一篇(一~三章)以系统应用为出发点,介绍放大器
PHP+MySQL网站开发入门与提高-(附DVD1张) 本书特色 本书从初学者的角度出发,由浅入深、循序渐进地介绍了php应用与开发的相关知识,并提供了大量的p...
两难境地的明智抉择 内容简介 首先要说的是我深刻感到了中国软件行业的问题严重性,也特别同情中国共享软件作者的境遇。也学很多人会认为做软件的尤其是知名软件的厂商或...
微信公众平台应用开发方法.技巧与案例 本书特色 本书是目前微信公众平台应用开发领域内容*全面、系统和深入的一本书,也是技术版本*新的。由著名的资深微信公众平台应...
《朱爱朝二十四节气自然笔记》内容简介:在带领孩子做自然观察和自然笔记的长期课程实践基础上,朱爱朝老师以二十四节气为序,结合
《管理故事与哲理》内容简介:这是一本用故事+剖析的形式来传授管理哲学的大众经管图书。将管理的原理、策略、方法、技巧融入短小精
在这个信息技术无所不在的时代,编程能力正在变得越来越重要。C++以高性能、易移植而著称,而且同时支持过程式、面向对象和泛型编
SEO实战密码-60天网站流量提高20倍-第3版 本书特色 本书是畅销书升级版,详细和系统地介绍了正规、有效的seo实战技术,包括为什么要做seo、搜索引擎工作...
《Z世代营销》内容简介:《Z世代营销》是Z世代之母和Z世代研究专家的扛鼎之作。通过很多采访和案例,让大家了解生于1990-2010年之间
Acommitmenttousabilityinuserinterfacedesignanddevelopmentoffersenormousbenefits,...
《数据科学之编程技术》内容简介:本书围绕使用R进行数据科学编程所需的实际步骤展开。全书着眼于该主题,介绍了有关该主题的工具和
嵌入式系统原理及接口技术高职 内容简介 近年来,国内教学科研单位使用的教学实验开发平台,基于s3c2410a微处理器的较为广泛,在产品开发中也较为常用。本书系统...
《网络空间测绘技术与实践:让互联网情报服务于网络安全》内容简介:这是一本对网络空间测绘技术原理、工具使用、最佳实践进行全面
《数字化改革:场景应用与综合解决方案》内容简介:伴随着新一代信息技术的纵深发展,以大数据、人工智能、区块链、云计算等新兴技
《对不起,我操控了你的大脑》内容简介:2018年3月,脸书(Facebook)被曝出泄露数据丑闻,一家在2016年帮助特朗普赢得美国总统大选
《大学物理教程》是教育部“高等教育面向21世纪教学内容和课程体系改革计划”的研究成果,是“面向21世纪课程教材”、高等教育“
智能摘要与深度学习 本书特色 本书从背景、需求入手,以*直接有效的方法切入,讲解如何搭建摘要系统。对摘要领域的算法做深入剖析,并对未来研究趋势做规划和预测。智能...