借助人工智能相关技术,帮助人们方便、高效地利用网络大数据信息,已成为当前IT业的研究热点之一。《文本大数据情感分析》介绍社交网络等海量异构信息采集算法;对文本挖掘与自然语言处理中涉及到情感分析、微博情绪诱因分析、电商产品评价与意见挖掘等内容进行研究,并提供丰富的应用案例。
借助人工智能相关技术,帮助人们方便、高效地利用网络大数据信息,已成为当前IT业的研究热点之一。本书介绍社交网络等海量异构信息采集算法;对文本挖掘与自然语言处理中涉及到情感分析、微博情绪诱因分析、电商产品评价与意见挖掘等内容进行研究,并提供丰富的应用案例。
第1章 引言
第2章 自然语言处理与应用综述
2.1 概述
2.2 自然语言处理的主要研究方法
2.2.1 理性主义与经验主义方法
2.2.2 深度学习与预训练方法及其在自然语言处理中的应用
2.3 自然语言处理的部分任务及应用
2.3.1 词法分析
2.3.2 句法分析
2.3.3 命名实体识别与特征信息提取
2.3.4 文本摘要
2.3.5 机器翻译
2.4 本章小结
参考文献
第3章 文本情感与情绪分析综述
3.1 概述
3.2 文本情感分析
3.2.1 情感信息抽取
3.2.2 情感分类
3.2.3 立场分析
3.3 文本情绪分析
3.3.1 传统的情绪分析方法
3.3.2 基于深度学习的情绪分析
3.4 本章小结
参考文献
第4章 面向微博文本的情绪及其诱因分析
4.1 总体技术路线
4.2 情绪模型
4.2.1 事件结果类
4.2.2 主体行为类
4.2.3 事件结果类和主体行为类的复合情绪
4.2.4 实体对象类
4.3 分析和提取情绪诱因事件
4.3.1 事件结果类的诱因事件分析与提取
4.3.2 主体行为类的诱因事件分析与提取
4.3.3 实体对象类的诱因事件分析与提取
4.4 情绪校验与修正
4.5 基于贝叶斯概率模型的诱因成分分析
4.5.1 基于语料的情绪词典构造
4.5.2 语言特征对情绪诱因的影响分析
4.5.3 基于贝叶斯概率模型的诱因比例计算
4.6 基于语言特征的情绪分类
4.6.1 词性特征分析
4.6.2 句法结构特征分析
4.6.3 情绪词与上下文的关系特征分析
4.6.4 特征降维
4.6.5 情绪分类
4.7 实验与分析
4.7.1 实验语料与测度说明
4.7.2 实验与结果分析
4.8 本章小结
参考文献
第5章 面向话题评论的立场分析
5.1 概述
5.2 基于AATABiLSTM模型的用户立场分析
5.2.1 基于词向量的话题扩充方法
5.2.2 基于双向LSTM与Attention的处理机制
5.2.3 实验
5.3 基于迁移学习的新话题评论预测
5.3.1 跨领域迁移学习模型的组成、预训练与预测
5.3.2 实验与分析
5.4 本章小结
参考文献
第6章 文本表示及在情绪分类中的应用
6.1 概述
6.2 基于注意力机制的双向LSTM的文本表示
6.2.1 输入层
6.2.2 特征学习层
6.2.3 特征权重学习层
6.2.4 输出层
6.2.5 实验设计与结果分析
6.2.6 基于注意力权重可视化的不同词性标签与情绪类别间的关系
6.3 基于两阶注意力机制的文本表示
6.3.1 输入层
6.3.2 特征学习层
6.3.3 特征权重学习层
6.3.4 实验与分析
6.3.5 实例分析
6.4 基于注意力聚合网络的文本表示
6.4.1 输入层
6.4.2 特征学习层
6.4.3 特征权重学习层
6.4.4 实验设计与结果分析
6.5 本章小结
参考文献
高凯,男,汉族,教授;博士毕业于上海交通大学计算机应用技术专业,省级重点学科“计算机软件与理论”中“信息检索与云计算”方向学术带头人,硕士研究生导师;中国计算机学会CCF高级会员,CCF计算机应用专委会常务委员,河北省京津冀大数据产业协会专委,河北省科技专家库成员,石家庄市工业企业特派员;国外学术期刊International Journal of Computer Applications in Technology副主编,5th /6th /7th /8thInternational Conference on Modelling, Identification and Control程序委员会委员;主要研究方向为海量异构信息处理、大数据搜索与挖掘、自然语言处理、网络信息检索、社会计算等;近几年出版了《大数据搜索与挖掘》、《信息检索与智能处理》、《网络信息检索技术及搜索引擎系统开发》等学术专著,以及《大数据搜索与日志挖掘及可视化方案》、《Android 程序设计基础教程》、《计算机专业英语》、《数据库原理与应用》多部编著和规划教材。
学习GNUEmacsGNUEmacs是Emacs编辑器家族中最受欢迎、传播范围最广、也是最强大和最灵活的UNIX文本编辑器。与其他文本编辑器的重要
《大视野》内容简介:这是一个“小确幸”和“大变局”不断深刻发生的时代。新冠疫情、全球经济低迷,失业潮、倒闭潮、债务潮,“去
UDA是一种专门为提高并行程序开发效率而设计的计算架构。在构建高性能应用程序时,CUDA架构能充分发挥GPU的强大计算功能。《GPU高
《中华史纲》内容简介:本书是人民出版社陆续出版的12册本《中国通史》的简本,作者为中国社会科学院荣誉学部委员、近代史所研究员
HTML5权威指南 本书特色 《html5权威指南》是系统学习网页设计的权威参考图书。《html5权威指南》分为五部分:**部分介绍学习本书的预备知识和html...
《一个人的“文艺复兴”》内容简介:人家问我说,你的家在哪里,我一下答不上来。不是地理上的,我说,我的家乡,是中国传统文化。
TCP/IP最佳入门-原书第6版 本书特色 《TCP/IP *佳入门:因特网文原理与应用(原书第6版)》:详细说明TCP/IP的基本运作原理;包含协议分析-Et...
《农产品上行运营策略与案例》内容简介:2018年的中央一号文件开启了中国乡村振兴的“三农”新时代,文件对农村电商的要求进一步聚
《用生活常识学懂成本会计(第2版)》内容简介:成本会计烦琐、复杂、抽象,让很多学会计的人员一头雾水。本书采用通俗易懂的语言、
「openFrameworks」の世界初の解説書です。プログラミング未経験者からより強力なインタラクション開発環境を求めているProcessi
我们究竟生活在一个什么样的世界中?那些沉默不语的金字塔在述说着怎样的神秘故事?那些残破建筑曾经历怎样的辉煌?那些巨大的石
LearnJavaScriptandjQueryanicerwayThisfull-colorbookadoptsavisualapproachtoteachi...
《裂变增长秘籍》内容简介:本书基于微信大生态,围绕裂变获客、留存促活、销售变现、客户管理四大模块展开讲述,旨在帮助更多互联
日本女生的制服变迁过程经历了近代社会制度、社会集团与阶级的整合,是女生对于“穿什么”这一问题的思索与尝试。“女生”这一社
《插画师之路——100堂水彩插画手绘实战课》内容简介:这是一本水彩插画手绘技法书。本书共6章,第1章介绍了插画绘图工具及绘画技法
提要:张永和创作并亲笔绘制的悬疑侦探故事绘本,全书包含四本装帧工艺各不相同的精美单册,分别为“绘本”“文本”“翻本”“彩
新电脑课堂OFFICE2007办公应用基础与提高附光盘 目录 第1章 Office 2007的组成与安装第2章 Word的基本操作第3章 Word排版技术第4章...
一家4口、9只鸡、1条狗、18年。制衣、种菜、捏陶、采蜜、去旅行……《造物的日常》是早川由美的手绘生活笔记,她在书中将自己根植
广告是一种商业活动,也是一门艺术,具有其他学科无法替代的独特性。在当今物质化、信息化并重的时代,如何形成一套更为有效的训
喧嚣商战,细数李彦宏与新浪、网易、搜狐、淘宝掌门人的恩怨纠葛!风云起伏,独创划分十年百度的“三大帝国”断代史!独门秘籍,