图像语义分割(Image Semantic Segmentation,ISS)是涉及计算机视觉、模式识别与人工智能的研究热点,基于深度学习的图像语义分割(Image Semantic Segmentation based on Deep Learning,ISSbDL)方法利用深层计算模型来学习抽象的图像特征,促进了ISS 相关研究的发展。在ISSbDL方法中,基于编码器.解码器模型的ISS方法存在像素空间位置信息丢失、无法有效利用图像上下文等问题。本文对编码器.解码器模型进行了两点改进并以这两点改进为基础,设计了一种“密集连接带孔空间金字塔池化反卷积网络”(Densely ConnectedAtrous Spatial Pyramid Pooling Deconvlution Network,DenseASPPDeconvNet)用于图像语义分割。本书的主要贡献如下:(1)对ISSbDL的经典方法与研究现状进行系统性总结和梳理。对基于深度学习的图像语义分割的经典方法与研究现状进行系统分类、梳理和总结。根据分割特点和处理粒度的不同,将基于深度学习的图像语义分割方法分为基于区域分类的图像语义分割方法和基于像素分类的图像语义分割方法。把基于区域分类的图像语义分割方法细分为2类子方法,把基于像素分类的图像语义分割方法进一步细分为7类不同的方法。对每类方法的代表性算法进行了详细地分析介绍,并详细总结了每类方法的基本思想和优缺点,系统阐述了深度学习技术对图像语义分割领域的贡献。(2)改进基于编码器一解码器模型的ISS算法,设计出DenseASPPDeconvNet网络模型。为提取更多的图像特征和图像上下文,对基于编码器一解码器模型的ISS算法中的编码器模块进行了两点改进:①以更密集的连接方式连接多个带孔卷积,优化初级特征提取器,提出“密集连接带孔卷积网络”(Densely Connected Atrous Convolution Network,DenseAtrous CNet),使用DenseAtrousCNet代替卷积神经网络(Convolutional NeuralNetworks,CNN)作为初级特征提取器,能够捕获更多的稠密特征。②对传统带孔空间金字塔池化模型进行优化,以密集连接组合数个不同带孔率的带孔卷积,对稠密特征图进行融合,提出“密集连接全局平均带孔金字塔池化”(Densely Connected Global Atrous Spatial Pyramid Pooling,DenseGlobalASPP)模型,使用DenseGlobalASPP代替带孔空间金字塔池化(Atrous Spatial Pyramid Pooling)作为特征再编码器,对初级特征进行再编码,以捕获更多的全局语义信息和图像上下文。基于以上两点改进,对传统的编码器一解码器模型的网络结构进行优化,设计了一种“密集连接带孔空间金字塔池化反卷积网络”(DenseASPPDeconvNet网络模型)。DenseASPPDeconvNet是一种非对称的网络结构,其编码器模块使用DenseAtrousCNet进行初级特征提取,使用DenseGobalASPP对初级特征进行再编码,解码器模块使用反卷积来逐步恢复特征图的分辨率。DenseASPPDeconvNet能够捕获更多的稠密特征图,扩大网络的感受野,捕获更多的图像上下文,进而提高ISS的分割准确率。实验部分使用PASCAL VOC 2012公开数据集进行实验和测试:将Dense ASPPDeconvNet 与其他经典网络模型进行详细地分析与对比,证明了DenseASPPDeconvNet能够提升ISS 的性能,具有一定的合理性和优越性。将DenseAtrousCNet、DenseASPPD econvNet分别与CNN、ASPP进行对比,证明了DenseAtrousCNet与DenseASPPDeconvNet拥有较好的特征提取效果,能够捕获更多的图像特征,有助于提升ISS的性能。
《中国神话密码》内容简介:本书通过五个方面梳理中国神话体系:《山海经》探秘、上古时代的神界领袖、日常生活中的诸神、动植物与
《黄河三角洲高效生态经济区发展报告(2014)》内容简介:本书是对黄河三角洲地区进行全景式分析的研究报告。总报告对黄河三角洲地
如同某种势不可挡的新型病毒,地下黑客圈子流言四起:某个聪明绝顶、胆大妄为的家伙发动了对线上犯罪网络的恶意接管,这个犯罪网
非常网管WindowsServer2003服务器架设实例详解(修订版) 本书特色 《非常网管:Windows Server 2003服务器架设实例详解(修订版)...
《开国领袖毛泽东》内容简介:《开国领袖毛泽东》真实地再现了共和国开国奠基特定历史环境中领袖人物毛泽东的心路历程、行为轨迹和
本书是一本关于数字技术的科普书,作者通过50篇短小精干的短文,介绍了改变我们这个世界的50种数码知识,包括云计算、文化反赌、
版式设计的原理已经存在了几个世纪,除平面设计外,建筑设计、时装设计等很多领域都广泛地运用这些原理。本书通过挖掘日常生活中
《牛汉散文》内容简介:本书精选牛汉散文60余篇,包括童年名篇《绵绵土》《打枣的季节》《月夜和风筝》《海琴》《父亲,树林和鸟》
消费者主权的崛起推动了一场巨大的零售革命,这就是第三次零售革命。它将引领人类的新商业文明和全球经济增长的模式,不管是传统
《AJAX安全技术》是一本为专业人士提供预防Ajax安全漏洞一手实践的入门指导书。众所周知,Ajax具备变革互联网的潜力,但危险的新
《数据挖掘与数据化运营实战》内容简介:本书是目前有关数据挖掘在数据化运营实践领域比较全面和系统的著作,也是诸多数据挖掘书籍
《企业级数据与AI项目成功之道》内容简介:大型组织正在竞相实施先进的数据科学。大多数时候,我们的人工智能尝试变成了走进死胡同
泉幸甫建筑师,日本大学生产工学系教授1947年熊本县出生,1973年日本大学研究生院硕士课程修了。1975~1977年R工作室。1977年设立
Thistitleisabouthowourgreatestinventionmakesusricher,smarter,greener,healthieran...
《平面设计师职场调研手册》是一本探讨平面设计的调研方法和实际应用的初级读本。在较大的范围内概括常用调研策略和方法,向你介
《FFmpeg音视频开发基础与实战》内容简介:全书内容分为三部分,共15章。第1~6章为第一部分,主要讲解音视频开发的基础知识,简要介
此書為華文世界第一本柳宗理入門,介紹柳宗理最著名的三大設計產品:蝴蝶椅、餐具及象腳椅,剖析其十大設計理念,請到深澤直人、
《CSSWeb站点设计手册》针对初、中级读者,特别是针对入门级读者。书中包含了经过精心筛选的学习CSS必须要了解和掌握的所有内容。
机器学习理论及应用 本书特色 《机器学习理论及应用》:当代科学技术基础理论与前沿问题研究丛书:中国科学技术大学校友文库。机器学习理论及应用 内容简介 机器学习新...
《荀玉根讲策略:少即是多》内容简介:海通证券首席经济学家兼首席策略分析师荀玉根博士拥有14年宏观策略研究经验,是新财富、水晶