图像语义分割(Image Semantic Segmentation,ISS)是涉及计算机视觉、模式识别与人工智能的研究热点,基于深度学习的图像语义分割(Image Semantic Segmentation based on Deep Learning,ISSbDL)方法利用深层计算模型来学习抽象的图像特征,促进了ISS 相关研究的发展。在ISSbDL方法中,基于编码器.解码器模型的ISS方法存在像素空间位置信息丢失、无法有效利用图像上下文等问题。本文对编码器.解码器模型进行了两点改进并以这两点改进为基础,设计了一种“密集连接带孔空间金字塔池化反卷积网络”(Densely ConnectedAtrous Spatial Pyramid Pooling Deconvlution Network,DenseASPPDeconvNet)用于图像语义分割。本书的主要贡献如下:(1)对ISSbDL的经典方法与研究现状进行系统性总结和梳理。对基于深度学习的图像语义分割的经典方法与研究现状进行系统分类、梳理和总结。根据分割特点和处理粒度的不同,将基于深度学习的图像语义分割方法分为基于区域分类的图像语义分割方法和基于像素分类的图像语义分割方法。把基于区域分类的图像语义分割方法细分为2类子方法,把基于像素分类的图像语义分割方法进一步细分为7类不同的方法。对每类方法的代表性算法进行了详细地分析介绍,并详细总结了每类方法的基本思想和优缺点,系统阐述了深度学习技术对图像语义分割领域的贡献。(2)改进基于编码器一解码器模型的ISS算法,设计出DenseASPPDeconvNet网络模型。为提取更多的图像特征和图像上下文,对基于编码器一解码器模型的ISS算法中的编码器模块进行了两点改进:①以更密集的连接方式连接多个带孔卷积,优化初级特征提取器,提出“密集连接带孔卷积网络”(Densely Connected Atrous Convolution Network,DenseAtrous CNet),使用DenseAtrousCNet代替卷积神经网络(Convolutional NeuralNetworks,CNN)作为初级特征提取器,能够捕获更多的稠密特征。②对传统带孔空间金字塔池化模型进行优化,以密集连接组合数个不同带孔率的带孔卷积,对稠密特征图进行融合,提出“密集连接全局平均带孔金字塔池化”(Densely Connected Global Atrous Spatial Pyramid Pooling,DenseGlobalASPP)模型,使用DenseGlobalASPP代替带孔空间金字塔池化(Atrous Spatial Pyramid Pooling)作为特征再编码器,对初级特征进行再编码,以捕获更多的全局语义信息和图像上下文。基于以上两点改进,对传统的编码器一解码器模型的网络结构进行优化,设计了一种“密集连接带孔空间金字塔池化反卷积网络”(DenseASPPDeconvNet网络模型)。DenseASPPDeconvNet是一种非对称的网络结构,其编码器模块使用DenseAtrousCNet进行初级特征提取,使用DenseGobalASPP对初级特征进行再编码,解码器模块使用反卷积来逐步恢复特征图的分辨率。DenseASPPDeconvNet能够捕获更多的稠密特征图,扩大网络的感受野,捕获更多的图像上下文,进而提高ISS的分割准确率。实验部分使用PASCAL VOC 2012公开数据集进行实验和测试:将Dense ASPPDeconvNet 与其他经典网络模型进行详细地分析与对比,证明了DenseASPPDeconvNet能够提升ISS 的性能,具有一定的合理性和优越性。将DenseAtrousCNet、DenseASPPD econvNet分别与CNN、ASPP进行对比,证明了DenseAtrousCNet与DenseASPPDeconvNet拥有较好的特征提取效果,能够捕获更多的图像特征,有助于提升ISS的性能。
这不是一本常规意义上Python的入门书。这本书中没有Python关键字和for循环的使用,也没有细致入微的标准库介绍,而是完全从实战的
本书是一本讲解Web应用中最常见的安全风险以及解决方案的实用教材。它以当今公认的安全权威机构OWASP(OpenWebApplicationSecuri
文明以止,人文也。硅谷的成功,不完全在人或钱,也不在科技,而在整体的生态。硅谷创投家郑志凯先生带领你领略硅谷的精髓。本书以
在不久的将来,“智能”科技与“大数据”将更大规模地、无微不至地介入我们的政治、文化和日常生活。数字化生存的诱惑就在于,人
测量程序与新型全站仪的应用-(第2版)(含1DVD) 目录 前言第1章 具有矩阵运算功能的结构化程序设计语言Ture BASIC 2.031.1 概述1.2 T...
《私域流量池》内容简介:本书是私域流量领域具有权威性和实战性的运营教科书,是作者在2年多的时间里成功指导3万余家企业实现最大
《广义网络空间》内容简介:本书将广义网络空间定义为赛博、物理、社会和思维融合的四维超空间,系统地介绍了广义网络空间的相关主
《Android 9编程通俗演义》内容简介:本书严格参考Android 9官方开发文档的逻辑,全面讲解Android开发中的各种技术,章节内容循序渐
《大脑减压的子弹笔记法》内容简介:为什么风靡全球的子弹笔记,最终变成杂乱无章的待办清单? 为什么尝试过时间管理,最终还是回到
《八万里路云和月》内容简介:全书共分为三篇。上篇“通榆‘触网’之路”,作者以半自传的形式回顾了通榆电商品牌成长历程。从零开
《Web安全防护指南(基础篇)》内容简介:Web安全与防护技术是当前安全界关注的热点,本书尝试针对各类漏洞的攻防技术进行体系化整
《跟李锐学Excel数据分析》内容简介:本书是作者20年实战经验的总结、提炼,汇集了职场人在实际工作中常见的需求。书中结合具体场景
《Python学习手册(第3版)》讲述了:Python可移植、功能强大、易于使用,是编写独立应用程序和脚本应用程序的理想选择。无论你是刚
《避风港:金融风暴中的安全投资》内容简介:《避风港》探讨了一个重要的问题:在变化波动的市场中,什么是安全的投资? 现代金融理
《信号与系统》采用先时域后变换域的顺序,以对偶和类比的方式逐章逐节、完全并行地讲述连续时间和离散时间信号与系统的一系列基
●本书是作者多年来教学实践经验的总结,汇集了学员在学习课程或认证考试中遇到的概念、操作、应用等问题及解决方案●针对JavaSE
《赋能业务》内容简介:现有团队的定位与公司的需要脱节?团队积累的技能和经验,并不符合公司的需求方向?某些部门和团队的工作变
《淞滨漫话》内容简介:地处黄浦江和长江交汇点的宝山,是长江第一门户、浦江风景第一线,上海的“水路门户”。宝山历史悠久,文化
《愿你成为最好的女子(经典版)》内容简介:不可爱的缺点;既能看到美好的一面,也充满自省、努力成为更好的女子的启示。女人,要
《产品三观》内容简介:今天,无论是实体产品还是互联网产品,打动用户都变得越来越难。作为洛可可创新设计集团、洛客设计平台创始