《Python自然语言处理(影印版)》提供了非常易学的自然语言处理入门介绍,该领域涵盖从文本和电子邮件预测过滤,到自动总结和翻译等多种语言处理技术。在《Python自然语言处理(影印版)》中,你将学会编写Python程序处理大量非结构化文本。你还将通过使用综合语言数据结构访问含有丰富注释的数据集,理解用于分析书面通信内容和结构的主要算法。
《Python自然语言处理》准备了充足的示例和练习,可以帮助你:
从非结构化文本中抽取信息,甚至猜测主题或识别“命名实体”;
分析文本语言结构,包括解析和语义分析;
访问流行的语言学数据库,包括WordNet和树库(treebank);
从多种语言学和人工智能领域中提取的整合技巧。
《Python自然语言处理(影印版)》将帮助你学习运用Python编程语言和自然语言工具包(NLTK)获得实用的自然语言处理技能。如果对于开发Web应用、分析多语言新闻源或记录濒危语言感兴趣——即便只是想从程序员视角观察人类语言如何运作,你将发现《Python自然语言处理》是一本令人着迷且极为有用的好书。
Preface
1.Language Processing and Python
1.1 Computing with Language: Texts and Words
1.2 A Closer Look at Python: Texts as Lists of Words
1.3 Computing with Language: Simple Statistics
1.4 Back to Python: Making Decisions and Taking Control
1.5 Automatic Natural Language Understanding
1.6 Summary
1.7 Further Reading
1.8 Exercises
2.Accessing Text Corpora and Lexical Resources
2.1 Accessing Text Corpora
2.2 Conditional Frequency Distributions
2.3 More Python: Reusing Code
2.4 Lexical Resources
2.5 WordNet
2.6 Summary
2.7 Further Reading
2.8 Exercises
3.Processing Raw Text
3.1 Accessing Text from the Web and from Disk
3.2 Strings: Text Processing at the Lowest Level
3.3 Text Processing with Unicode
3.4 Regular Expressions for Detecting Word Patterns
3.5 Useful Applications of Regular Expressions
3.6 Normalizing Text
3.7 Regular Expressions for Tokenizing Text
3.8 Segmentation
3.9 Formatting: From Lists to Strings
3.10 Summary
3.11 Further Reading
3.12 Exercises
4.Writing Structured Programs
4.1 Back to the Basics
4.2 Sequences
4.3 Questions of Style
4.4 Functions: The Foundation of Structured Programming
4.5 Doing More with Functions
4.6 Program Development
4.7 Algorithm Design
4.8 A Sample of Python Libraries
4.9 Summary
4.10 Further Reading
4.11 Exercises
5.Categorizing andTagging Words
5.1 Using a Tagger
5.2 Tagged Corpora
5.3 Mapping Words to Properties Using Python Dictionaries
5.4 Automatic Tagging
5.5 N-Gram Tagging
5.6 Transformation-Based Tagging
5.7 How to Determine the Category of a Word
5.8 Summary
5.9 Further Reading
5.10 Exercises
6.Learning to Classify Text
6.1 Supervised Classification
6.2 Further Examples of Supervised Classification
6.3 Evaluation
6.4 Decision Trees
6.5 Naive Bayes Classifiers
6.6 Maximum Entropy Classifiers
6.7 Modeling Linguistic Patterns
6.8 Summary
6.9 Further Reading
6.10 Exercises
7.Extracting Information from Text
7.1 Information Extraction
7.2 Chunking
7.3 Developing and Evaluating Chunkers
7.4 Recursion in Linguistic Structure
7.5 Named Entity Recognition
7.6 Relation Extraction
7.7 Summary
7.8 Further Reading
7.9 Exercises
8.Analyzing Sentence Structure
8.1 Some Grammatical Dilemmas
8.2 Whats the Use of Syntax?
8.3 Context-Free Grammar
8.4 Parsing with Context-Free Grammar
8.5 Dependencies and Dependency Grammar
8.6 Grammar Development
8.7 Summary
8.8 Further Reading
8.9 Exercises
9.Building Feature-Based Grammars
9.1 Grammatical Features
9.2 Processing Feature Structures
9.3 Extending a Feature-Based Grammar
9.4 Summary
9.5 Further Reading
9.6 Exercises
10.Analyzing the Meaning of Sentences
10.1 Natural Language Understanding
10.2 Propositional Logic
10.3 First-Order Logic
10.4 The Semantics of English Sentences
10.5 Discourse Semantics
10.6 Summary
10.7 Further Reading
10.8 Exercises
11.Managing Linguistic Data
11.1 Corpus Structure: A Case Study
11.2 The Life Cycle of a Corpus
11.3 Acquiring Data
11.4 Working with XML
11.5 Working with Toolbox Data
11.6 Describing Language Resources Using OLAC Metadata
11.7 Summary
11.8 Further Reading
11.9 Exercises
Afterword: The Language Challenge
Bibliography
NLTK Index
General Index
《信号与系统》共分十章,内容包括:信号的函数表示与系统分析方法,连续系统时域分析,连续信号傅里叶分析,连续系统频域分析,
《短距离无线数据通信入门与实战》分别以目前世界上广泛应用的8051内核无线片上系统(SoC)NRF9E5、NRF24E1、CCl010以及无线芯片NR
本书的特点是:代替价多复杂的数学推导过程,给出了一系列简明的计算公式;避免了纯粹的理论叙述,给出了大量的设计实例;从系统
《简笔画15分钟速成!卡通形象卷》内容简介:《幸福手绘三部曲简笔画15分钟速成!卡通形象卷》是一本纯手工绘制的卡通形象图集,作
科技发展的速度越来越快了,快得让我们有点儿要跟不上的感觉,不知道你是否有同感?《搜酷——全球智能硬件与技术精华集(全彩)
《新媒体人工作手册:商业文案写作》内容简介:商业文案是能把产品卖出去的创意文字。会写文案,意味着你不仅具备与销售相关的商业
《宋学研究(第二辑)》内容简介:本书为浙江省哲学社会科学重点研究基地浙江大学宋学研究中心主办的学术辑刊。“宋学研究”学术集
五笔字型短训教程 内容简介 本书从*基本的指法开始讲起,全面、系统地介绍了86版五笔字型输入法、98版五笔字型输入法。本书是一本指导读者学习五笔字型输入法的培训...
财务共享实训教程 本书特色 本教材共包括三章内容:第1章是财务共享概述篇,结合众多大型企业集团财务共享中心建设的实践经验,对财务共享中心建设过程中涉及的要素、建...
《智能机器人养成记》内容简介:本书中,作者先描述了人工智能的缺陷(一个关键的缺点是:它没有具象化),然后提出了一种制造类人机
《企业资本运营:投融资实战操作指南》内容简介:受到新冠肺炎疫情等的影响,全球经济形势较为严峻,中小型企业的生存压力日渐增大
AnunparalleledlearningtoolandguidetoerrorcorrectioncodingErrorcorrectioncodingte...
本书从理论到实践系统全面地对PHP和MySQL进行了介绍。在给出了PHP和MySQL的一般概念后,对PHP和MySQL的应用做了全面的阐述。最后
揭示数字化主流大趋势的最新权威论著《主流》作者的最新力作!与法国秋季新版同步上市!面对数字化时代的到来,美国、欧盟、中国
《华与华正道》内容简介:人人都说要走正道,但如何才能走上正道呢?简单来讲,正道就是大道,关键在于知行合一、一以贯之。华与华
《画说作文(上)》内容简介:本书充满了趣味性,让孩子在轻松有趣的阅读中掌握写作的要点,通过漫画和故事帮助孩子建立良好的作文
微型计算机技术及应用:习题、实验题与综合训练题集(第3版) 本书特色 本书特色内容: ·本书是清华大学计算机系列教材和北京市高等教育精品教材立项项目,是在第2版...
《贫困的复杂图景与反贫困的多元路径》内容简介:本书在实地田野调研的基础上,通过宏观、微观考察民族地区农村贫困的复杂图景及致
WhatsInside*HowRubyandRailswork,separatelyandtogether*ExtensiveRubylanguagetutor...
《深入实践C++模板编程》内容简介:C++模板编程领域的经典著作,由资深C++开发工程师撰写。本书以透彻分析原理为前提,深入讲解了模