《Python自然语言处理(影印版)》提供了非常易学的自然语言处理入门介绍,该领域涵盖从文本和电子邮件预测过滤,到自动总结和翻译等多种语言处理技术。在《Python自然语言处理(影印版)》中,你将学会编写Python程序处理大量非结构化文本。你还将通过使用综合语言数据结构访问含有丰富注释的数据集,理解用于分析书面通信内容和结构的主要算法。
《Python自然语言处理》准备了充足的示例和练习,可以帮助你:
从非结构化文本中抽取信息,甚至猜测主题或识别“命名实体”;
分析文本语言结构,包括解析和语义分析;
访问流行的语言学数据库,包括WordNet和树库(treebank);
从多种语言学和人工智能领域中提取的整合技巧。
《Python自然语言处理(影印版)》将帮助你学习运用Python编程语言和自然语言工具包(NLTK)获得实用的自然语言处理技能。如果对于开发Web应用、分析多语言新闻源或记录濒危语言感兴趣——即便只是想从程序员视角观察人类语言如何运作,你将发现《Python自然语言处理》是一本令人着迷且极为有用的好书。
Preface
1.Language Processing and Python
1.1 Computing with Language: Texts and Words
1.2 A Closer Look at Python: Texts as Lists of Words
1.3 Computing with Language: Simple Statistics
1.4 Back to Python: Making Decisions and Taking Control
1.5 Automatic Natural Language Understanding
1.6 Summary
1.7 Further Reading
1.8 Exercises
2.Accessing Text Corpora and Lexical Resources
2.1 Accessing Text Corpora
2.2 Conditional Frequency Distributions
2.3 More Python: Reusing Code
2.4 Lexical Resources
2.5 WordNet
2.6 Summary
2.7 Further Reading
2.8 Exercises
3.Processing Raw Text
3.1 Accessing Text from the Web and from Disk
3.2 Strings: Text Processing at the Lowest Level
3.3 Text Processing with Unicode
3.4 Regular Expressions for Detecting Word Patterns
3.5 Useful Applications of Regular Expressions
3.6 Normalizing Text
3.7 Regular Expressions for Tokenizing Text
3.8 Segmentation
3.9 Formatting: From Lists to Strings
3.10 Summary
3.11 Further Reading
3.12 Exercises
4.Writing Structured Programs
4.1 Back to the Basics
4.2 Sequences
4.3 Questions of Style
4.4 Functions: The Foundation of Structured Programming
4.5 Doing More with Functions
4.6 Program Development
4.7 Algorithm Design
4.8 A Sample of Python Libraries
4.9 Summary
4.10 Further Reading
4.11 Exercises
5.Categorizing andTagging Words
5.1 Using a Tagger
5.2 Tagged Corpora
5.3 Mapping Words to Properties Using Python Dictionaries
5.4 Automatic Tagging
5.5 N-Gram Tagging
5.6 Transformation-Based Tagging
5.7 How to Determine the Category of a Word
5.8 Summary
5.9 Further Reading
5.10 Exercises
6.Learning to Classify Text
6.1 Supervised Classification
6.2 Further Examples of Supervised Classification
6.3 Evaluation
6.4 Decision Trees
6.5 Naive Bayes Classifiers
6.6 Maximum Entropy Classifiers
6.7 Modeling Linguistic Patterns
6.8 Summary
6.9 Further Reading
6.10 Exercises
7.Extracting Information from Text
7.1 Information Extraction
7.2 Chunking
7.3 Developing and Evaluating Chunkers
7.4 Recursion in Linguistic Structure
7.5 Named Entity Recognition
7.6 Relation Extraction
7.7 Summary
7.8 Further Reading
7.9 Exercises
8.Analyzing Sentence Structure
8.1 Some Grammatical Dilemmas
8.2 Whats the Use of Syntax?
8.3 Context-Free Grammar
8.4 Parsing with Context-Free Grammar
8.5 Dependencies and Dependency Grammar
8.6 Grammar Development
8.7 Summary
8.8 Further Reading
8.9 Exercises
9.Building Feature-Based Grammars
9.1 Grammatical Features
9.2 Processing Feature Structures
9.3 Extending a Feature-Based Grammar
9.4 Summary
9.5 Further Reading
9.6 Exercises
10.Analyzing the Meaning of Sentences
10.1 Natural Language Understanding
10.2 Propositional Logic
10.3 First-Order Logic
10.4 The Semantics of English Sentences
10.5 Discourse Semantics
10.6 Summary
10.7 Further Reading
10.8 Exercises
11.Managing Linguistic Data
11.1 Corpus Structure: A Case Study
11.2 The Life Cycle of a Corpus
11.3 Acquiring Data
11.4 Working with XML
11.5 Working with Toolbox Data
11.6 Describing Language Resources Using OLAC Metadata
11.7 Summary
11.8 Further Reading
11.9 Exercises
Afterword: The Language Challenge
Bibliography
NLTK Index
General Index
《中国本草图谱》内容简介:《食物本草》可以说是明代食药养生的集大成者,是我国现存内容很丰富、很全面的食药疗法专著。全书共有
本书作为一本专门针对网页美工的书籍,在阐述网页设计理念的基础上,以生动的实例引导读者深入地掌握网页的美工技术,使读者在短
CSSMasteristailor-madeforthewebdesignerwhosreallyseriousabouttakingtheirskillsto...
《秋山集:故纸谈往录》内容简介:本书是李军老师对既往的追忆,是对秋的纪念,是对春的期待。正如《春水集》之名源于《纸上春水桃
《如何赢得大客户》内容简介:本书讲述在如今这个一切都讲究高效率的时代,销售人员已经不仅仅单纯地去追求成交率和销售利润,促成
《绘画的捷径》内容简介:本书共14章,前半部分内容主要包括为什么画、画什么、绘画基础、有效练习、人体造型等内容,使读者有一个
《希利尔讲艺术史》内容简介:你知道为什么古希腊画家笔下的人物一般都是裸体吗? 你知道《最后的晚餐》为什么永远无法在美术馆里展
《IP电话技术与软交换(第2版)》较全面地介绍了与IP电话和软交换有关的技术。主要包括IP电话的基本概念,IP电话网的一般结构和IP电
几何拓扑:局部性、周期性何伽罗瓦对成性 内容简介 本书以全英文影印版的形式介绍了局部性、周期性和伽罗瓦对称性等内容。几何拓扑:局部性、周期性何伽罗瓦对成性 目录...
《编程卓越之道(卷2):运用底层语言思想编写高级语言代码》内容简介:《编程卓越之道(卷2):运用底层语言思想编写高级语言代码
《ASP.NET 开发从入门到精通》内容简介:本书由浅入深地详细讲解了ASP.NET的开发技术,并通过具体实例的实现过程演练了各个知识点的
《CPU自制入门》内容简介:本书教读者制作原创的计算机系统。第1章以介绍CPU为主,同时介绍如何制作存储程序与数据的内存、输入与输
轻松学习C程序设计-揭开计算机与程序设计的奥秘 本书特色 尽自己*大能力写一本比较轻,松颖,清晰,透彻,有价值的计算机科学入门是我的夙愿;把真正掌握计算奥秘和学...
重构 改善既有代码的设计 本书特色本书清晰揭示了重构的过程,解释了重构的原理和*佳实践方式,并给出了何时以及何地应该开始挖掘代码以求改善。书中给出了70 多个可...
《智慧工业互联网》内容简介:本书对“互联网、人工智能、大数据”时代的内涵进行了解读,分析了工业云产生的背景,提出了工业云的
Ifyouthinkwebdesignisbeyondyourreach,orifyouwantyourexistingwebsitetolookmorepro...
《JavaScript程序设计实例教程(第2版)》内容简介:本书采用任务驱动模式编写,内容涵盖JavaScript概述、HTML、CSS+DIV应用、Java
《绅权与国家权力关系研究:从明清到民初》内容简介:从乡村权力结构角度研究绅权与国家权力的关系,这不仅是一个法律史学问题,同
《先秦学术概论》内容简介:本书纵论先秦学术,首先鸟瞰先秦各学派的源流和相互关系,其次对道、儒、法、名、墨、阴阳、纵横、兵、
本书分为四个部分,每个部分都围绕一个总的主题进行详细讨论。第一部分:网页设计入门,提供了人们在开始学习网页设计时经常碰到