如何能牢牢地黏住老用户、吸引新用户、读懂用户的偏好兴趣和喜怒哀乐,这都是对企业发展至关重要甚至关乎生死存亡的问题,解决这个问题的方法就是推荐系统。本书分为上中下三篇,共13章,上篇为用户画像知识工程基础,包括表征建模、画像计算、存储及各种更新维护等管理操作;中篇为推荐系统与用户画像,包括传统协同过滤等经典推荐算法的介绍,以及涉及用户画像的推荐方法;下篇为应用案例分析,包括Netflix、阿里等数据竞赛的经典数据案例,以及在具体工程开发过程的具体案例,分别从系统需求、总体结构、算法设计、运行流程及测试结果等五个方面提供详细案例指导。
上 篇
第1章 用户画像概述 3
1.1 用户画像数据来源 3
1.1.1 用户属性 5
1.1.2 用户观影行为 5
1.2 用户画像特性 5
1.2.1 动态性 5
1.2.2 时空局部性 6
1.3 用户画像应用领域 6
1.3.1 搜索引擎 6
1.3.2 推荐系统 7
1.3.3 其他业务定制与优化 7
1.4 大数据给用户画像带来的机遇与挑战 8
第2章 用户画像建模 9
2.1 用户定量画像 9
2.2 用户定性画像 10
2.2.1 标签与用户定性画像 10
2.2.2 基于知识的用户定性画像分析 12
2.2.3 用户定性画像的构建 16
2.2.4 定性画像知识的存储 22
2.2.5 定性画像知识的推理 26
2.3 本章参考文献 29
第3章 群体用户画像分析 31
3.1 用户画像相似度 32
3.1.1 定量相似度计算 32
3.1.2 定性相似度计算 34
3.1.3 综合相似度计算 35
3.2 用户画像聚类 36
第4章 用户画像管理 41
4.1 存储机制 41
4.1.1 关系型数据库 42
4.1.2 NoSQL数据库 43
4.1.3 数据仓库 45
4.2 查询机制 46
4.3 定时更新机制 47
4.3.1 获取实时用户信息 47
4.3.2 更新触发条件 48
4.3.3 更新机制 49
中 篇
第5章 视频推荐概述 55
5.1 主流推荐方法的分类 56
5.1.1 协同过滤的推荐方法 56
5.1.2 基于内容的推荐方法 57
5.1.3 基于知识的推荐方法 59
5.1.4 混合推荐方法 60
5.2 推荐系统的评测方法 61
5.3 视频推荐与用户画像的逻辑关系 61
第6章 协同过滤推荐方法 65
6.1 概述 65
6.2 关系矩阵及矩阵计算 67
6.2.1 U-U矩阵 67
6.2.2 V-V矩阵 70
6.2.3 U-V矩阵 72
6.3 基于记忆的协同过滤算法 74
6.3.1 基于用户的协同过滤算法 75
6.3.2 基于物品的协同过滤算法 78
6.4 基于模型的协同过滤算法 81
6.4.1 基于隐因子模型的推荐算法 82
6.4.2 基于朴素贝叶斯分类的推荐算法 85
6.5 小结 88
6.6 本章参考文献 88
第7章 基于内容的推荐方法 91
7.1 概述 91
7.2 CB推荐中的特征向量 94
7.2.1 视频推荐中的物品画像 94
7.2.2 视频推荐中的用户画像 96
7.3 基础CB推荐算法 97
7.4 基于TF-IDF的CB推荐算法 99
7.5 基于KNN的CB推荐算法 102
7.6 基于Rocchio的CB推荐算法 104
7.7 基于决策树的CB推荐算法 106
7.8 基于线性分类的CB推荐算法 107
7.9 基于朴素贝叶斯的CB推荐算法 109
7.10 小结 111
7.11 本章参考文献 111
第8章 基于知识的推荐方法 113
8.1 概述 113
8.2 约束知识与约束推荐算法 114
8.2.1 约束知识示例 114
8.2.2 约束满足问题 115
8.2.3 约束推荐算法流程 117
8.3 关联知识与关联推荐算法 118
8.3.1 关联规则描述 118
8.3.2 关联规则挖掘 121
8.3.3 关联推荐算法流程 123
8.4 小结 124
8.5 本章参考文献 124
第9章 混合推荐方法 125
9.1 概述 125
9.2 算法设计层面的混合方法 126
9.2.1 并行式混合 126
9.2.2 整体式混合 129
9.2.3 流水线式混合 131
9.2.4 典型混合应用系统 133
9.3 混合式视频推荐实例 136
9.3.1 MoRe系统概览 136
9.3.2 MoRe算法介绍 137
9.3.3 MoRe算法混合 139
9.3.4 MoRe实验分析 140
9.4 小结 142
9.5 本章参考文献 142
第10章 视频推荐评测 145
10.1 概述 145
10.2 视频推荐试验方法 146
10.2.1 在线评测 147
10.2.2 离线评测 149
10.2.3 用户调查 150
10.3 视频离线推荐评测指标 151
10.3.1 准确度指标 151
10.3.2 多样性指标 159
10.4 小结 161
10.5 本章参考文献 162
下 篇
第11章 系统层面的快速推荐构建 165
11.1 概述 165
11.2 本章主要内容 166
11.3 系统部署 166
11.3.1 Hadoop2.2.0系统部署 166
11.3.2 Hadoop运行时环境设置 169
11.3.3 Spark与Mahout部署 175
11.4 Mahout推荐引擎介绍 181
11.4.1 Item-based算法 181
11.4.2 矩阵分解 185
11.4.3 ALS算法 187
11.4.4 Mahout的Spark实现 190
11.5 快速实战 193
11.5.1 概述 193
11.5.2 日志数据 194
11.5.3 运行环境 196
11.5.4 基于Mahout Item-based算法实践 201
11.5.5 基于Mahout ALS算法实践 205
11.6 小结 208
11.7 本章参考文献 208
第12章 数据层面的分析与推荐案例 211
12.1 概述 211
12.2 本章主要内容 212
12.3 竞赛内容和意义 212
12.3.1 竞赛简介 212
12.3.2 竞赛任务和意义 213
12.4 客户-商户数据 215
12.4.1 数据描述 215
12.4.2 数据理解与分析 217
12.5 算法流程设计 219
12.5.1 特征提取 219
12.5.2 分类器设计 220
12.5.3 算法流程总结 222
12.6 小结 222
12.7 本章参考文献 223
《OpenStack设计与实现》是一本介绍OpenStack设计与实现原理的书。《OpenStack设计与实现》以Juno版本为基础,覆盖了OpenStack的
Word/Excel/PPT 2016从入门到精通 本书特色 ★本书《Word/Excel/PPT 2016从入门到精通》深入浅出,从基础入门知识到专业精通内容...
《BeginningJavaObjects中文版从概念到代码(第2版)》是关于软件对象和Java的,但并不是纯粹地介绍Java语言,而是强调如何从对象模
《最难的事其实最简单》内容简介:起点低,如何改良简历,漂亮逆袭?遇到挫折,怎样精进自我,弯道超车?打造个人品牌,哪些细节决
本书是原创Java技术图书领域继《深入理解Java虚拟机》后的又一实力之作,也是全球首本基于最新OSGiR5.0规范的著作。理论方面,既
数字信号处理(DSP)广泛应用于通信、电子、自动控制等方面,并日益显示出其重要性。本书旨在帮助更多的工程师掌握DSP的基本概念
黑客大曝光网络安全机密与解决方案 本书特色 (1)本书是在前6版的基础上(前期产品累计销售超20万册)对内容进行全面更新和扩充,相信本书(第7版)一定能够延续前...
《旧石器技术:理论与实践》内容简介:本书详细介绍了法国学者于20世纪开创并发展起来的旧石器技术研究的理论和方法,并首次将其系
《在家就能做的80个STEAM科学小实验》内容简介:STEAM教育是融合了科学、技术、工程、艺术、数学多门学科的综合性教育,它提倡对多
《青箱杂记:唐宋史料笔记》由朝散郎知汉阳军吴处厚撰,共十卷,多记宋及五代朝野杂事、诗话及掌故,书中引到的魏野、李淑、王禹伪
《国语》内容简介:本书相传为春秋时期鲁国史官左丘明所作。全书共21卷,分别记载了西周末年至春秋时期(约BC967—BC453)周、鲁、
《社群众筹:传统众筹模式的升级与重构》内容简介:本书从目前众筹发展面临的困境出发,提出了众筹问题的解决之道——社群众筹,并
《XilinxFPGA开发实用教程》系统讲述了XilinxFPGA的开发知识,包括FPGA开发简介、VerilogHDL语言基础、基于Xilinx芯片的HDL语...
《跨界协同育人共同体:思与行的融合》内容简介:上海中医药大学自2015年7成立“跨界协同育人共同体——服务学生成长导师团”。导师
《清华交互设计丛书·智捷课堂经典·交互设计的艺术:iOS7拟物化到扁平化革命》是一本关于移动应用设计的书。《清华交互设计丛书
《你好,自然(小学通识版)》内容简介:这是一个关于自然的博物类套装书,包括图书和材料包(电子书版不含材料包)。它主要介绍了
ProductDescriptionWhatdoesitmeantobeadesignerintoday’scorporate-driven,overbrand...
未来15年:全球化2.0会创造数以百万计的中产阶级,但这块市场肥肉只会被送到真正“懂”它的商家口中。每个新兴市场都会有特定的消
《用户运营方法论:入门、实战与进阶》内容简介:这是一部以产品和运营双重视角,从9个维度讲解用户运营思维、方法、技巧的著作。它
《雀儿山高度:其美多吉的故事》内容简介:其美多吉是中国邮政集团公司四川省甘孜县分公司长途邮车驾驶员,承担川藏邮路甘孜到德格