本专著对抄袭检测,尤其是高模糊抄袭检测,开展深入的研究。以大幅提高抄袭检测系统性能为目标,提出了基于统计机器学习方法解决抄袭检测问题的方法,探索了抄袭检测的语料库构建、web环境下的抄袭源检索和基于语义的高模糊抄袭检测的问题、方法、架构和模型。具体内容包括:1、综述了抄袭检测的概念、类型和框架;2、提出了基于自然标注的抄袭语料构建方法,解决了高质量、反映真实抄袭情况的抄袭语料匮乏问题;3、提出了基于排序学习的源检索查询生成模型和基于检索结果聚合性的源检索过滤模型,解决了以互联网为抄袭资源的抄袭源检索问题;4、提出了句法和语义交互的文本深度释义匹配模型和基于序列标注的文本对齐模型,解决了高模糊抄袭的检测问题。
《抄袭检测研究》以文本的抄袭检测为研究对象,探索了抄袭检测的语料库构建、Web环境下的抄袭源检索和高模糊抄袭检测的文本对齐的问题、数据、架构和模型。《抄袭检测研究》共9章,第1~3章介绍了抄袭检测的概念、类型和框架,综述了抄袭检测的方法;第4章介绍了现有抄袭语料构建方法,提出了基于自然标注的抄袭语料构建方法;第5和第6章对抄袭源检索开展研究,描述了基于排序学习的源检索查询生成模型和关注检索结果聚合性的源检索过滤模型;第7~9章,对抄袭检测的文本对齐开展研究,提出了基于排序学习的抄袭文本匹配模型、句法和语义交互的释义文本深度匹配模型以及基于序列标注的文本对齐模型。
Progressiveenhancementisanapproachtowebdevelopmentthataimstodeliverthebestpossib...
豆瓣阅读小雅奖获奖作品豆瓣阅读ZUI热时尚专栏关于时尚穿搭,看这一本就够了曾经的文学译者,现在的专业服装设计师——于晓丹老师
《赋能业务》内容简介:现有团队的定位与公司的需要脱节?团队积累的技能和经验,并不符合公司的需求方向?某些部门和团队的工作变
《牛妞与羊爸》内容简介:如何关爱孩子?如何教育儿女?历来是家庭生活中的大事,也是父母最上心最挠头的问题。羊爸为牛妞写了19年
《信号与系统(上册)(第2版)》是1981年出版《信号与系统》(高等教育出版社出版)的修订版。本版与第一版的结构层次大体相同,仍然
《经济转型背景下的财富管理与资产配置》内容简介:当前,国际国内经济金融形势复杂多变,投资单一市场、单一资产的不确定性不断加
《当我们走进心理咨询室》内容简介:为什么在亲密关系中,一些人总是扮演“受害者”的角色?为什么一些人总是习惯讨好别人,对所有
《婚恋清醒指南》内容简介:◆给所有女生的婚恋清醒指南,手把手教你看清亲密关系的底层逻辑,别在该动脑子的时候动感情。拒绝“恋
《分裂者宫崎骏》内容简介:分裂感在宫崎骏的身上几乎无处不在。他是著名的反战主义者,同时也是著名的武器爱好者。童年经历让他曾
本书第1-10章介绍同步数字体系(SDH),内容包括:SDH的概念,信号结构、复用和映射,光接口和电接口,传输损伤(误码、抖动和漂
《特大型城市公共服务资源配置》内容简介:本书运用问卷调查、个案访谈、典型事件等社会调查方法,研究了特大型城市基层治理与创业
电脑组装与维护全攻略 内容简介 当前电脑市场中,品牌电脑虽然提供了多款机型,但并不能切实满足用户的实际需求,更有许多品牌电脑的配置并不合适。如果拥有DIY的相关...
《绿色诊断理论与实践》内容简介:本书根据绿色诊断的理论方法和企业绿色诊断的实践,对绿色诊断标准和法律法规体系、绿色诊断主要
◎台灣第一本以專業角度探討暗網以及網路非法社群次文化等的書籍◎亞馬遜好評4.3顆星、美國國家公共廣播電台(NPR)2015年度最佳
《我读:陪你读到世界尽头》内容简介:《我读:陪你读到世界尽头》是由梁文道主讲的书评集。用最简洁直白的方式带领读者领略好书的
TheHandbookofNaturalLanguageProcessing,SecondEditionpresentspracticaltoolsandtec...
本书针对媒体、通讯、传感等信息技术发展的需要,提出在未来的数字传播中,影像技术与交互设计将成为设计学科中重要的学习内容。
Web Color Design:设计师谈网页配色 内容简介 本书是为网页设计师量身定制的配色方案专业书籍。全书共分七个部分,分别结合丰富的实例讲述了配色基础知...
《中华传统节日诗词故事:清明·端午》内容简介:节日诗词,把民间习俗和文人意趣结合在一起,很好地体现了中华文化源远流长、丰富
本书按历史顺序,以丝绸品种和纹样的演变为主线,系统地考证与阐述我国丝绸从起源到公元20世纪这七千年间丝绸织绣艺术和工艺科技