本专著对抄袭检测,尤其是高模糊抄袭检测,开展深入的研究。以大幅提高抄袭检测系统性能为目标,提出了基于统计机器学习方法解决抄袭检测问题的方法,探索了抄袭检测的语料库构建、web环境下的抄袭源检索和基于语义的高模糊抄袭检测的问题、方法、架构和模型。具体内容包括:1、综述了抄袭检测的概念、类型和框架;2、提出了基于自然标注的抄袭语料构建方法,解决了高质量、反映真实抄袭情况的抄袭语料匮乏问题;3、提出了基于排序学习的源检索查询生成模型和基于检索结果聚合性的源检索过滤模型,解决了以互联网为抄袭资源的抄袭源检索问题;4、提出了句法和语义交互的文本深度释义匹配模型和基于序列标注的文本对齐模型,解决了高模糊抄袭的检测问题。
《抄袭检测研究》以文本的抄袭检测为研究对象,探索了抄袭检测的语料库构建、Web环境下的抄袭源检索和高模糊抄袭检测的文本对齐的问题、数据、架构和模型。《抄袭检测研究》共9章,第1~3章介绍了抄袭检测的概念、类型和框架,综述了抄袭检测的方法;第4章介绍了现有抄袭语料构建方法,提出了基于自然标注的抄袭语料构建方法;第5和第6章对抄袭源检索开展研究,描述了基于排序学习的源检索查询生成模型和关注检索结果聚合性的源检索过滤模型;第7~9章,对抄袭检测的文本对齐开展研究,提出了基于排序学习的抄袭文本匹配模型、句法和语义交互的释义文本深度匹配模型以及基于序列标注的文本对齐模型。
《孔子答客问》内容简介:本书是一部社科专著,在充分占有史料并严谨辨析论证的基础上,以活泼生动的“问答”文体,请出两千五百年
《中国能源国际合作报告(2018/2019)》内容简介:本报告在整理和分析2018年和2019年中国能源国际合作的趋势和成果的基础上,对中国
《在家就能做的80个STEAM科学小实验》内容简介:STEAM教育是融合了科学、技术、工程、艺术、数学多门学科的综合性教育,它提倡对多
计算机密码应用基础 内容简介 本书是在四川大学密码学公共选修课所用的讲义基础上编写而形成的。内容涉及密码学中几大“核心”领域,包括分组密码、香农理论、序列密码、...
远程接入网络疑难解析 本书特色 本书适用面向日常工作需要的网络管理者或者管理员、网络或咨询工程师以及远程接入咨询师。同时本书适合为希望获得CCNP和CCIE证书...
《通信协议技术》是OHM通信实用技术系列之一。《通信协议技术》中基于以下三方面介绍通信协议技术:(1)通信协议中怎样利用图像
《聂卫平围棋习题精解·手筋专项训练(从3段到5段)》内容简介:本书是我国围棋职业运动员聂卫平同聂卫平围棋道场的明星教师团队联
《乐迷闲话》内容简介:《乐迷闲话》作为辛丰年的第一本音乐随笔著作,曾经启蒙了一代西方古典音乐乐迷。虽是“闲话”,其实“有根
《宋代衣食住行》内容简介:本书为四色印制的有关宋代衣食住行的彩图珍藏类图书。两宋时期是中国古代历史上的一个特殊时期,商品经
《最新日本设计模板:版面设计》着重对海报、DH、POP、书籍等印刷品的设计和运用进行解说,因为“版面设计”存在于人们生活的方方
DigitalCommunicationsisaclassicbookintheareathatisdesignedtobeusedasaseniororgra...
《近世日本朱子学的确立》内容简介:明治维新后,日本一方面以欧洲式的政治和文化标准构建一个近代国家,另一方面仍坚持日本传统的
《一念光明:写给中国人的抑郁自救指南》内容简介:本书是实战派心理咨询专家张久祥教授35年临床心理咨询经验的精华总结,每一条建
{BookDescription}CutascenefromtheUSANetworktelevisionseriesMonk,createapromoforS...
《JavaScript+Vue.js web开发案例教程(在线实训版)》内容简介:随着互联网技术的不断发展,JavaScript语言及其相关技术越来越受人
《走出教育焦虑》内容简介:本书是一部通过引用、分析传统文化理念与知识,解决当下孩子教育问题的传统文化教育应用类读本。随着中
《孟子重估:从牟宗三到西方汉学》内容简介:1.儒家思想资源的重新估定和现代整合一直是学术界、思想界的热门论题,本书以台港新儒
bash是自由软件基金会发布的“BourneAgainShell”的缩写。它是流行的UNIXBourneshell的免费可用替代产品,供全球Linux用户选用。
《源自动机的道德(人文与社会译丛)》内容简介:当代大部分对德性伦理的复兴,都是朝着亚里士多德的方向前进的。斯洛特提出,亚里
《我怎么没想到?》内容简介:这本书是罗伯特· 厄普德格拉夫的第一本著作,也是他影响最大、最重要的一部著作。它初是以小说的形式