内容简介
本书全面介绍了统计自然语言处理的基本概念、理论方法和最新研究进展,内容包括形式语言与自动机及其在自然语言处理中的应用、语言模型、隐马尔可夫模型、语料库技术、汉语自动分词与词性标注、句法分析、词义消歧、统计机器翻译、语音翻译、文本分类、信息检索与问答系统、自动文摘和信息抽取、口语信息处理与人机对话系统等,既有对基础知识和理论模型的介绍,也有对相关问题的研究背景、实现方法和技术现状的详细阐述。
本书可作为高等院校计算机、信息技术等相关专业的高年级本科生或研究生的教材或参考书,也可供从事自然语言处理、数据挖掘和人工智能等研究的相关人员参考。
-------
目录
第1章 绪论
1.1 基本概念
1.1.1 语言学与语音学
1.1.2 自然语言处理
1.1.3 关于“理解”的标准
1.2 自然语言处理研究的内容和面临的困难
1.2.1 自然语言处理研究的内容
1.2.2 自然语言处理涉及的几个层次
1.2.3 自然语言处理面临的困难
1.3 自然语言处理的基本方法及其发展
1.3.1 自然语言处理的基本方法
1.3.2 自然语言处理的发展
1.4 自然语言处理的研究现状
第2章 预备知识
2.1 概率论基本概念
2.1.1 概率
2.1.2 最大似然估计
2.1.3 条件概率
2.1.4 贝叶斯法则
2.1.5 随机变量
2.1.6 二项式分布
2.1.7 联合概率分布和条件概率分布
2.1.8 贝叶斯决策理论
2.1.9 期望和方差
2.2 信息论基本概念
2.2.1 熵
2.2.2 联合熵和条件熵192.2.3 互信息
2.2.4 相对熵
2.2.5 交叉熵
2.2.6 困惑度
2.2.7 噪声信道模型
2.3 支持向量机
2.3.1 线性分类
2.3.2 线性不可分
2.3.3 构造核函数
第3章 形式语言与自动机
第4章 语料库与词汇知识库
第5章 语言模型
第6章 隐马尔可夫模型
第7章 汉语自动分词与词性标注
第8章 句法分析
第9章 语义消歧
第10章 统计机器翻译
第11章 语音翻译
第12章 文本分类
第13章 信息检索与问答系统
第14章 自动文摘与信息抽取
第15章 口语信息处理与人机对话系统
附录 项目作业
名词术语索引
参考文献
让你的PPT会说话 本书特色 适读人群 :1.已初步掌握PPT基本操作,急待提升的职场白领 2.要用PPT打动别人的培训师和学校老师 3.即将走上社会需要快速掌...
《铁箫斋文萃(精)》内容简介:本书是宗璞先生自选散文集,除题记与后记之外,共107篇文章,分作9组。第一组文章围绕家庭与亲人所
《软件产品质量要求和测试细则》内容简介:计算机软件是计算机应用的核心,其质量的好坏关系到计算机应用系统的成败,软件测评是提
《真实经济:消费者真正渴望的是什么》内容简介:在体验经济占主导的21世纪.真实性取代质量成为新的消费者敏感性,就像当初质量取
《我们都一样,年轻又彷徨》内容简介:★青年作家苑子文&苑子豪暖心励志代表作,全新升级典藏版正式上市。★关于勇气、成长与爱的正
本书由上、下两篇组成。上篇为UNIX版本6的源代码,下篇是莱昂先生对UNIX操作系统版本6源代码的详细分析。本书语言简洁、透彻,曾
《东瀛之恋:张大千与山田喜美子》内容简介:张大千与山田喜美子的相识大约是在1953年,那时候张大千54岁。1949年以后,张大千移居
《Java多线程编程核心技术(第3版)》内容简介:现代软件规模大、实时性要求高,所以掌握提升处理和响应速度的多线程技术势在必行。
《论中国学术思想变迁之大势》内容简介:该书原是梁于1902年3-12月、1904年9-12月时在《新民丛报》上陆续发表的一些文章,后由北京
精通数据科学:从线性回归到深度学习 本书特色 本书全面讲解了数据科学的相关知识,从统计分析学到机器学习、深度学习中用到的算法及模型,借鉴经济学视角给出模型的相关...
《唐诗三百首》内容简介:唐代是我国古代文学发展的重要阶段,尤其是古代诗歌发展的全盛时期,同时也是一个诗人辈出的时代,因此后
《药味集》内容简介:周氏散文风格向被形容为“闲适”,在他看来这可分为“小闲适”与“大闲适”,后者即“唯其无奈何所以也就不必
《佳爷房谈:购房租房一本通》内容简介:本书分为房产基础知识、购买新房、购买二手房、租房四部分,采取问答形式,运用通俗易懂的
本书是日本东京吉祥寺人气生活杂货店老板,从他生活中实际使用的物品,严选170件既实用又具美感的经典好设计而集结而成。里头有的
《少年读山海经·千万里江山》内容简介:《山海经》是一部包罗万象的千古奇书,是一座研究古代地理和神话的宝库。“少年读山海经”
陆中浪:一位从零创业,没有打过一天工,也未领过一天工资,仅仅用了5年时间就拥有二十余项投资产业、三十多家公司,涉及服装、餐
{BookDescription}http://www.peachpit.com/title/0321534107Therearebasicallytwotyp...
《LED照明驱动电源模块化设计技术》内容简介:随着LED照明技术的迅速发展和LED灯具的规模化应用,对LED驱动电源的要求也越来越高。
CSS创意课:全球优秀交互页面设计 本书特色 《CSS创意课——全球优秀交互页面设计》由未来出版编著,王慧玲译,本书涵盖了一切你需要提高的CSS网页布局知识。跟...
《做一个清醒的现代人》内容简介:在当代中国传统文化的纵向传承与外来文化的横向互动中,在这种“纵横交错”的文化背景下,刘擎教