如何能牢牢地黏住老用户、吸引新用户、读懂用户的偏好兴趣和喜怒哀乐,这都是对企业发展至关重要甚至关乎生死存亡的问题,解决这个问题的方法就是推荐系统。本书分为上中下三篇,共13章,上篇为用户画像知识工程基础,包括表征建模、画像计算、存储及各种更新维护等管理操作;中篇为推荐系统与用户画像,包括传统协同过滤等经典推荐算法的介绍,以及涉及用户画像的推荐方法;下篇为应用案例分析,包括Netflix、阿里等数据竞赛的经典数据案例,以及在具体工程开发过程的具体案例,分别从系统需求、总体结构、算法设计、运行流程及测试结果等五个方面提供详细案例指导。
上 篇
第1章 用户画像概述 3
1.1 用户画像数据来源 3
1.1.1 用户属性 5
1.1.2 用户观影行为 5
1.2 用户画像特性 5
1.2.1 动态性 5
1.2.2 时空局部性 6
1.3 用户画像应用领域 6
1.3.1 搜索引擎 6
1.3.2 推荐系统 7
1.3.3 其他业务定制与优化 7
1.4 大数据给用户画像带来的机遇与挑战 8
第2章 用户画像建模 9
2.1 用户定量画像 9
2.2 用户定性画像 10
2.2.1 标签与用户定性画像 10
2.2.2 基于知识的用户定性画像分析 12
2.2.3 用户定性画像的构建 16
2.2.4 定性画像知识的存储 22
2.2.5 定性画像知识的推理 26
2.3 本章参考文献 29
第3章 群体用户画像分析 31
3.1 用户画像相似度 32
3.1.1 定量相似度计算 32
3.1.2 定性相似度计算 34
3.1.3 综合相似度计算 35
3.2 用户画像聚类 36
第4章 用户画像管理 41
4.1 存储机制 41
4.1.1 关系型数据库 42
4.1.2 NoSQL数据库 43
4.1.3 数据仓库 45
4.2 查询机制 46
4.3 定时更新机制 47
4.3.1 获取实时用户信息 47
4.3.2 更新触发条件 48
4.3.3 更新机制 49
中 篇
第5章 视频推荐概述 55
5.1 主流推荐方法的分类 56
5.1.1 协同过滤的推荐方法 56
5.1.2 基于内容的推荐方法 57
5.1.3 基于知识的推荐方法 59
5.1.4 混合推荐方法 60
5.2 推荐系统的评测方法 61
5.3 视频推荐与用户画像的逻辑关系 61
第6章 协同过滤推荐方法 65
6.1 概述 65
6.2 关系矩阵及矩阵计算 67
6.2.1 U-U矩阵 67
6.2.2 V-V矩阵 70
6.2.3 U-V矩阵 72
6.3 基于记忆的协同过滤算法 74
6.3.1 基于用户的协同过滤算法 75
6.3.2 基于物品的协同过滤算法 78
6.4 基于模型的协同过滤算法 81
6.4.1 基于隐因子模型的推荐算法 82
6.4.2 基于朴素贝叶斯分类的推荐算法 85
6.5 小结 88
6.6 本章参考文献 88
第7章 基于内容的推荐方法 91
7.1 概述 91
7.2 CB推荐中的特征向量 94
7.2.1 视频推荐中的物品画像 94
7.2.2 视频推荐中的用户画像 96
7.3 基础CB推荐算法 97
7.4 基于TF-IDF的CB推荐算法 99
7.5 基于KNN的CB推荐算法 102
7.6 基于Rocchio的CB推荐算法 104
7.7 基于决策树的CB推荐算法 106
7.8 基于线性分类的CB推荐算法 107
7.9 基于朴素贝叶斯的CB推荐算法 109
7.10 小结 111
7.11 本章参考文献 111
第8章 基于知识的推荐方法 113
8.1 概述 113
8.2 约束知识与约束推荐算法 114
8.2.1 约束知识示例 114
8.2.2 约束满足问题 115
8.2.3 约束推荐算法流程 117
8.3 关联知识与关联推荐算法 118
8.3.1 关联规则描述 118
8.3.2 关联规则挖掘 121
8.3.3 关联推荐算法流程 123
8.4 小结 124
8.5 本章参考文献 124
第9章 混合推荐方法 125
9.1 概述 125
9.2 算法设计层面的混合方法 126
9.2.1 并行式混合 126
9.2.2 整体式混合 129
9.2.3 流水线式混合 131
9.2.4 典型混合应用系统 133
9.3 混合式视频推荐实例 136
9.3.1 MoRe系统概览 136
9.3.2 MoRe算法介绍 137
9.3.3 MoRe算法混合 139
9.3.4 MoRe实验分析 140
9.4 小结 142
9.5 本章参考文献 142
第10章 视频推荐评测 145
10.1 概述 145
10.2 视频推荐试验方法 146
10.2.1 在线评测 147
10.2.2 离线评测 149
10.2.3 用户调查 150
10.3 视频离线推荐评测指标 151
10.3.1 准确度指标 151
10.3.2 多样性指标 159
10.4 小结 161
10.5 本章参考文献 162
下 篇
第11章 系统层面的快速推荐构建 165
11.1 概述 165
11.2 本章主要内容 166
11.3 系统部署 166
11.3.1 Hadoop2.2.0系统部署 166
11.3.2 Hadoop运行时环境设置 169
11.3.3 Spark与Mahout部署 175
11.4 Mahout推荐引擎介绍 181
11.4.1 Item-based算法 181
11.4.2 矩阵分解 185
11.4.3 ALS算法 187
11.4.4 Mahout的Spark实现 190
11.5 快速实战 193
11.5.1 概述 193
11.5.2 日志数据 194
11.5.3 运行环境 196
11.5.4 基于Mahout Item-based算法实践 201
11.5.5 基于Mahout ALS算法实践 205
11.6 小结 208
11.7 本章参考文献 208
第12章 数据层面的分析与推荐案例 211
12.1 概述 211
12.2 本章主要内容 212
12.3 竞赛内容和意义 212
12.3.1 竞赛简介 212
12.3.2 竞赛任务和意义 213
12.4 客户-商户数据 215
12.4.1 数据描述 215
12.4.2 数据理解与分析 217
12.5 算法流程设计 219
12.5.1 特征提取 219
12.5.2 分类器设计 220
12.5.3 算法流程总结 222
12.6 小结 222
12.7 本章参考文献 223
《文化何以自信》内容简介:该书阐释和说明了在当今世界不同思想文化相互激荡、文化软实力竞争日趋激烈的背景下,增进文化自信已成
《徐兆玮杂著七种》内容简介:徐兆玮(1867—1940),民国学者、藏书家。字少逵,号倚虹,又号虹隐,别署剑心,江苏常熟人。《徐兆
本书系统地阐述了人因工程学的基础理论、设计方法及应用分析。全书共12章,第1章为人因工程学总论,第2章至第5章为人的形态、生理
《Oracle性能诊断艺术》以优化Oracle应用程序为目的,先介绍Oracle性能优化的基本原理、关键概念,从业务角度和系统角度分析性能
《他们这样旅行》内容简介:两大家族,三代人,横跨70年,11场纵横交错的人生旅行。深夜的大马士革路上,年轻女人和未婚夫的车被两
《CSS网页布局创意课》的第1部分,收录了若干网页设计权威专家所著的特写文章,其中涵盖了新的CSS3属性及针对各种屏幕大小进行设
《2014年会计从业资格考试专用标准化辅导教材系列:会计基础》内容简介:《2014年会计从业资格考试专用标准化辅导教材系列:会计基
《珠宝首饰设计手册》内容简介:这是一本全面介绍珠宝首饰设计的图书,特点是知识易懂、案例趣味、动手实践、发散思维。本书从学习
《精彩江苏·画派系列:常州画派》内容简介:常州画派由一批生活在江南文化古城常州的画家群体组成,恽寿平是常州画派开山鼻祖,以
随着通信技术和Internet的快速发展,PSTN、移动网、Internet之间的融合已经成为大势所趋,人们对网络业务需求也逐步呈现多样化、
《改革开放口述史》内容简介:纪念改革开放四十周年万里、曾培炎、陈锦华等改革开放重大决策亲历者真情讲述。本书精选我国改革开放
ANSYS结构有限元高级分析方法与范例应用 内容简介 本书将结构有限元分析的基本力学概念与ANSYS实践紧密结合,通过大量生动的原创性分析实例,向读者系统全面地...
《任弼时风采》内容简介:任弼时(1904—1950),伟大的马克思主义者,无产阶级革命家、政治家、组织家,党的第一代领导集体的重要
《不可不知的人性》内容简介:我们常说:一个人越炫耀什么,就说明他内心越缺少什么。一个人越在意什么,那就是让他倍感自卑的地方
《近代法律人的世界》内容简介:本书为中国社会科学院近代史研究所法律史研究群、华中科技大学近代法研究所、华东政法大学法律文明
《官渡杀人事件》内容简介:作品改编自马伯庸短篇小说集《三国配角演义》中的《官渡杀人事件》。建安六年,“官渡之战”主公曹操大
计算机组成原理(第2版) 本书特色 本书系统地介绍了计算机的组成及其工作原理。全书共分7章,第1章概要介绍计算机的硬件结构、工作过程及性能指标;第2章介绍数据的...
本书由浅入深、循序渐进地介绍了MVC的体系结构和如何构建一个基于MVC的Web框架,目的是帮助软件开发人员快速掌握MVC的设计思想,
《激进意志的样式(2018年版)》内容简介:本书为“苏珊•桑塔格全集”一种,是桑塔格一本重要的文论集,是对于《反对阐释》所研究的
《人生答案之书》内容简介:周国平与读者的日常问答集。读者所问涉及人生的各个方面,可归纳为八问,即情感之问、道路之问、身心之