本专著对抄袭检测,尤其是高模糊抄袭检测,开展深入的研究。以大幅提高抄袭检测系统性能为目标,提出了基于统计机器学习方法解决抄袭检测问题的方法,探索了抄袭检测的语料库构建、web环境下的抄袭源检索和基于语义的高模糊抄袭检测的问题、方法、架构和模型。具体内容包括:1、综述了抄袭检测的概念、类型和框架;2、提出了基于自然标注的抄袭语料构建方法,解决了高质量、反映真实抄袭情况的抄袭语料匮乏问题;3、提出了基于排序学习的源检索查询生成模型和基于检索结果聚合性的源检索过滤模型,解决了以互联网为抄袭资源的抄袭源检索问题;4、提出了句法和语义交互的文本深度释义匹配模型和基于序列标注的文本对齐模型,解决了高模糊抄袭的检测问题。
《抄袭检测研究》以文本的抄袭检测为研究对象,探索了抄袭检测的语料库构建、Web环境下的抄袭源检索和高模糊抄袭检测的文本对齐的问题、数据、架构和模型。《抄袭检测研究》共9章,第1~3章介绍了抄袭检测的概念、类型和框架,综述了抄袭检测的方法;第4章介绍了现有抄袭语料构建方法,提出了基于自然标注的抄袭语料构建方法;第5和第6章对抄袭源检索开展研究,描述了基于排序学习的源检索查询生成模型和关注检索结果聚合性的源检索过滤模型;第7~9章,对抄袭检测的文本对齐开展研究,提出了基于排序学习的抄袭文本匹配模型、句法和语义交互的释义文本深度匹配模型以及基于序列标注的文本对齐模型。
《你早该这样玩小米手机》内容简介:《你早该这样玩小米手机》教您如何迅速成为小米手机高手。全书对小米手机好玩好用的部分进行精
《河南社会治理发展报告(2017)》内容简介:本书从社会安全、矛盾化解、社会组织、公共服务、社会公平五个维度,对河南省社会治理
Objective-C是创建MacOSX应用和iPhone应用的主要语言,优雅的面向对象编程环境与快速而普及的C语言珠联璧合,造就了它的不俗表现
ThebookcoverstheforthcomingPylons0.9.7releaseandisavailbleforfreetoreadhereonlin...
《读懂自己比读懂别人更重要》内容简介:我们说认清一个人,无非就是看清他是好是坏。其实,别人的缺点总是很容易被我们所发现,而
《十力语要初续》内容简介:本书乃《十力语要》的续编,仍沿用《十力语要》旧例,辑录书札、论文、杂文等总计四十二篇,是了解熊十
《就喜欢你看不惯我又干不掉我的样子4》内容简介:超人气漫画家白茶全新力作!吾皇巴扎黑一家爆笑来袭!《就喜欢你看不惯我又干不掉
《Kotlin语言实例精解》内容简介:本书详细阐述了与Kotlin开发相关的基本解决方案,主要包括俄罗斯方块游戏、设计并实现Messenger后
《说服力·工作型PPT该这样做(第3版)》内容简介:工作型PPT,唯“快”不破!作为日常工作中的PPT,不能为了追求完美设计而无限度
TakeyourExcelskillstothenextlevelwithVBAprogrammingNowthatyouvemasteredExcelbasi...
《一看就停不下来的三国史》内容简介:原来董卓竟曾有过周公梦?贾诩是三国时期最精致的利己主义者?是武圣关羽的傲娇终结了刘备的
2015,中国以“一带一路”为纽带,选择和平与共享的方式,重新缔造与世界的关系;抗战胜利日大阅兵,对应的是70年前中国以血肉之
《北师大法律评论(2020年第1辑·总第1辑)》内容简介:《北师大法律评论》是由北京师范大学主管、北京师范大学法学院主办的学术集
《深度学习在动态媒体中的应用与实践》内容简介:本书是一本深度学习的基础入门读物,对深度学习的基本理论进行了介绍,主要以Ubun
《神经网络设计与实现》内容简介:本书是一本神经网络实践进阶指南,适合对AI和深度学习感兴趣并且想进一步提高技能的读者阅读。本
《东京迷上车》内容简介:有一本书,我想为你写,是关于东京的。很对不起,时间和资源不允许我带着你慢慢走。不过,看了这本书,只
《每天最重要的3件事》内容简介:时间管理不是让人一味忙碌,而是让人有时间享受生活。每天做到以下三件事,你就可以拥有高效、有序
《中东非阿拉伯国家智库研究》内容简介:本书对中东地区的三个非阿拉伯国家以色列、土耳其和伊朗的智库发展及对各国对外政策和中东
在线阅读本书Thelogobible,thisbookprovidesgraphicdesignerswithanindispensablereferences...
本书系Brooks/Cole出版公司(ThomsonLearning出版集团的下属子公司)2000年推出的BookWare系列丛书(BookWareCompan...