本专著对抄袭检测,尤其是高模糊抄袭检测,开展深入的研究。以大幅提高抄袭检测系统性能为目标,提出了基于统计机器学习方法解决抄袭检测问题的方法,探索了抄袭检测的语料库构建、web环境下的抄袭源检索和基于语义的高模糊抄袭检测的问题、方法、架构和模型。具体内容包括:1、综述了抄袭检测的概念、类型和框架;2、提出了基于自然标注的抄袭语料构建方法,解决了高质量、反映真实抄袭情况的抄袭语料匮乏问题;3、提出了基于排序学习的源检索查询生成模型和基于检索结果聚合性的源检索过滤模型,解决了以互联网为抄袭资源的抄袭源检索问题;4、提出了句法和语义交互的文本深度释义匹配模型和基于序列标注的文本对齐模型,解决了高模糊抄袭的检测问题。
《抄袭检测研究》以文本的抄袭检测为研究对象,探索了抄袭检测的语料库构建、Web环境下的抄袭源检索和高模糊抄袭检测的文本对齐的问题、数据、架构和模型。《抄袭检测研究》共9章,第1~3章介绍了抄袭检测的概念、类型和框架,综述了抄袭检测的方法;第4章介绍了现有抄袭语料构建方法,提出了基于自然标注的抄袭语料构建方法;第5和第6章对抄袭源检索开展研究,描述了基于排序学习的源检索查询生成模型和关注检索结果聚合性的源检索过滤模型;第7~9章,对抄袭检测的文本对齐开展研究,提出了基于排序学习的抄袭文本匹配模型、句法和语义交互的释义文本深度匹配模型以及基于序列标注的文本对齐模型。
《HTML+CSS+JavaScript网页制作案例教程》内容简介:Web标准的最大特点是采用HTML+CSS+JavaScript将网页内容、外观样式及动态效...
《从零开始学Flutter开发》内容简介:本书针对目前高速发展的Flutter跨平台移动开发技术方案,从零开始深入讲解其中涉及的技术点,
《水色斑斓Ⅲ》内容简介:总有一些回忆无法用言语表达,总有一些情绪无法用文字记录...... 在song丹青老师的水彩笔下,流淌着的是斑
ApacheisthemostpopularWebserverontheInternetbecauseitisfree,reliable,andextensib...
《风光摄影后期》内容简介:一幅风光摄影佳作,是摄影人艺术修养和摄影技能的结晶,完成前期拍摄只能算完成了一半,如何通过后期调
《精通Web标准建站:标记语言、网站分析、设计理念、SEO与BI》将建站所需要掌握的各种知识分门别类、依照建站的顺序分部分排列,而
《美得令人心醉的宋词》内容简介:《美得令人心醉的宋词》是特别针对现代初阶宋词爱好者而编辑的宋词选本,是新时代的宋词基本读本
《浦东史诗》内容简介:由著名报告文学作家、中国作家协会副主席何建明精心创作的《浦东史诗》,首次以长篇报告文学形式,从经济、
《零基础学平面广告设计》内容简介:本书介绍平面广告设计以及应用案例,内容包括平面广告设计原理,平面广告设计基础,平面广告设
《口水民国:民国名人的笔墨官司》内容简介:本书主要围绕民国时期的口水公案、笔墨官司,详细叙述了民国时期学界、政界、工商界等
Thebest-sellingguidetoovercomingcreativeblocksandunleashingatorrentofgreatideas-...
《要怎么收获,先那么栽》内容简介:以自己的努力定义自己的人生,不要让未来的你讨厌现在的自己;没拼过的青春不值一提,坚持梦想
《生命为什么可以延续》内容简介:从一颗种子的简单崛起,到幼雏的破壳而出;从稚嫩小树的抽枝发芽,到新生儿的孕育和诞生……生命
《创新家装设计图典(第4季):客厅》内容简介:全新升级的《创新家装设计图典第4季》将继续为读者提供新的设计案例,针对居室各空
《酒店,家的感觉:住进世界38家设计型酒店》所介绍的酒店,大致上按作者过去七年入住的时间顺序排列,故此,这也可以看成作者的
这本有趣而通俗易懂的著作包括了24篇短文,共分6个主题,每个主题下有4篇文章。这些主题涵盖了一些重要的遗传学话题——每一个都
《历史名镇:千灯镇》内容简介:千灯是昆南的重镇,民康物阜,钟灵毓秀。2007年获中国历史文化名镇,2008年获国家AAAA级旅游景区。
《智能学习的未来》内容简介:人工智能发展迅猛,与之相比,我们人类到底还有没有优势?我们会被取代吗? 想要在这场人机大战中取胜
《玩法变了:淘宝卖家运赢弱品牌时代》内容简介:目前网店的销售、运营、营销都碰到很多瓶颈,钱不再好赚,流量不再免费的情况下。
工业机器人与自控系统的集成应用 本书特色 本书从实用的角度出发,对工业机器人与PLC 控制系统的综合应用、触摸屏与机器人的联合应用、机器人与视觉系统的综合应用,...