《Python自然语言处理(影印版)》提供了非常易学的自然语言处理入门介绍,该领域涵盖从文本和电子邮件预测过滤,到自动总结和翻译等多种语言处理技术。在《Python自然语言处理(影印版)》中,你将学会编写Python程序处理大量非结构化文本。你还将通过使用综合语言数据结构访问含有丰富注释的数据集,理解用于分析书面通信内容和结构的主要算法。
《Python自然语言处理》准备了充足的示例和练习,可以帮助你:
从非结构化文本中抽取信息,甚至猜测主题或识别“命名实体”;
分析文本语言结构,包括解析和语义分析;
访问流行的语言学数据库,包括WordNet和树库(treebank);
从多种语言学和人工智能领域中提取的整合技巧。
《Python自然语言处理(影印版)》将帮助你学习运用Python编程语言和自然语言工具包(NLTK)获得实用的自然语言处理技能。如果对于开发Web应用、分析多语言新闻源或记录濒危语言感兴趣——即便只是想从程序员视角观察人类语言如何运作,你将发现《Python自然语言处理》是一本令人着迷且极为有用的好书。
Preface
1.Language Processing and Python
1.1 Computing with Language: Texts and Words
1.2 A Closer Look at Python: Texts as Lists of Words
1.3 Computing with Language: Simple Statistics
1.4 Back to Python: Making Decisions and Taking Control
1.5 Automatic Natural Language Understanding
1.6 Summary
1.7 Further Reading
1.8 Exercises
2.Accessing Text Corpora and Lexical Resources
2.1 Accessing Text Corpora
2.2 Conditional Frequency Distributions
2.3 More Python: Reusing Code
2.4 Lexical Resources
2.5 WordNet
2.6 Summary
2.7 Further Reading
2.8 Exercises
3.Processing Raw Text
3.1 Accessing Text from the Web and from Disk
3.2 Strings: Text Processing at the Lowest Level
3.3 Text Processing with Unicode
3.4 Regular Expressions for Detecting Word Patterns
3.5 Useful Applications of Regular Expressions
3.6 Normalizing Text
3.7 Regular Expressions for Tokenizing Text
3.8 Segmentation
3.9 Formatting: From Lists to Strings
3.10 Summary
3.11 Further Reading
3.12 Exercises
4.Writing Structured Programs
4.1 Back to the Basics
4.2 Sequences
4.3 Questions of Style
4.4 Functions: The Foundation of Structured Programming
4.5 Doing More with Functions
4.6 Program Development
4.7 Algorithm Design
4.8 A Sample of Python Libraries
4.9 Summary
4.10 Further Reading
4.11 Exercises
5.Categorizing andTagging Words
5.1 Using a Tagger
5.2 Tagged Corpora
5.3 Mapping Words to Properties Using Python Dictionaries
5.4 Automatic Tagging
5.5 N-Gram Tagging
5.6 Transformation-Based Tagging
5.7 How to Determine the Category of a Word
5.8 Summary
5.9 Further Reading
5.10 Exercises
6.Learning to Classify Text
6.1 Supervised Classification
6.2 Further Examples of Supervised Classification
6.3 Evaluation
6.4 Decision Trees
6.5 Naive Bayes Classifiers
6.6 Maximum Entropy Classifiers
6.7 Modeling Linguistic Patterns
6.8 Summary
6.9 Further Reading
6.10 Exercises
7.Extracting Information from Text
7.1 Information Extraction
7.2 Chunking
7.3 Developing and Evaluating Chunkers
7.4 Recursion in Linguistic Structure
7.5 Named Entity Recognition
7.6 Relation Extraction
7.7 Summary
7.8 Further Reading
7.9 Exercises
8.Analyzing Sentence Structure
8.1 Some Grammatical Dilemmas
8.2 Whats the Use of Syntax?
8.3 Context-Free Grammar
8.4 Parsing with Context-Free Grammar
8.5 Dependencies and Dependency Grammar
8.6 Grammar Development
8.7 Summary
8.8 Further Reading
8.9 Exercises
9.Building Feature-Based Grammars
9.1 Grammatical Features
9.2 Processing Feature Structures
9.3 Extending a Feature-Based Grammar
9.4 Summary
9.5 Further Reading
9.6 Exercises
10.Analyzing the Meaning of Sentences
10.1 Natural Language Understanding
10.2 Propositional Logic
10.3 First-Order Logic
10.4 The Semantics of English Sentences
10.5 Discourse Semantics
10.6 Summary
10.7 Further Reading
10.8 Exercises
11.Managing Linguistic Data
11.1 Corpus Structure: A Case Study
11.2 The Life Cycle of a Corpus
11.3 Acquiring Data
11.4 Working with XML
11.5 Working with Toolbox Data
11.6 Describing Language Resources Using OLAC Metadata
11.7 Summary
11.8 Further Reading
11.9 Exercises
Afterword: The Language Challenge
Bibliography
NLTK Index
General Index
《图论算法理论、实现及应用》系统地介绍了图论算法理论,并选取经典的ACM/ICPC竞赛题目为例题阐述图论算法思想,侧重于图论算法
内容简介:打造现代布局的专业技术本书远非只是介绍基础知识,它不仅全面细致地讲解布局与效果,而且展望了HTML5和CSS3的未来。业
《ASP.NETAJAX程序设计》(第1卷)系统介绍ASP.NETAjax程序设计知识,共3卷。本卷从最易于理解和使用的那部分入手,介绍ASP.NETAJA
GIS空间分析理论与方法 内容简介 在国家自然科学基金和黄河联合研究基金项目(50379048)以及武汉大学教务部资助下,完成了本书的编写和出版。本书共分九章,...
《给孩子的趣味唐诗课:四季篇》内容简介:《中国诗词大会》评委蒙曼老师为孩子量身打造的漫画唐诗课 读起来有趣、学起来零压力、背
完全掌握Windows 7超级手册 本书特色 windows 7排忧解惑,告诉你微软没有讲清楚的事windows 7无线网络架设笔记本电脑使用windows 7...
机器人几何代数模型与控制 内容简介 本书以作者的研究成果为依托,讲述了向量空间、李代数以及对偶数环上的旋量理论等数学工具在机器人运动学中的应用。全书包含了...
Djangoisahigh-levelPythonwebapplicationframeworkdesignedtosupporttherapiddevelop...
《声音体验设计》内容简介:真正好的设计是让人感觉不到设计痕迹的设计。声音体验设计就是实现这种好设计的魔鬼细节,本书从声音体
《写给大家看的色彩书2:色彩怎么选,设计怎么做》内容简介:色彩不仅仅是感性思维的展示,也可以通过理性认知来发挥它。《写给大家
《朕的圆明园》内容简介:这是一本结合典籍与历史图片,介绍雍正至咸丰五位皇帝与圆明园关系的历史书籍。他们中的雍正和道光就去世
我的Photoshop学习手记 内容简介 本书以photoshopcs5为技术平台,精心设计了80多个案例,内容涵盖鼠绘、色彩调整、图像合成、特效制作、创意、抠...
本书是《俄罗斯航空发动机制造史》丛书的中册,其内容涵盖了第45号航空发动机工厂——莫斯科“礼炮”厂(现改名为“礼炮”燃气涡
《LaTeX2e完全学习手册》内容简介:LaTeX2e,简称LaTeX,是一种专业的高品质文稿排版系统,目前已成为国际学术出版界广泛使用的排
时至今日,Linux系统已经从一个个人作品发展为可以用于各种关键任务的成熟、高效和稳定的操作系统,因为具备跨平台、开源、支持众
《叶秀山全集·第六卷》内容简介:本选题分类结集叶秀山先生全部已经出版的专著,在学术期刊上发表的所有论文,以及部分笔记、札记
《世界现役制导武器全解析(上篇)》内容简介:导弹是一种携带战斗部、依靠自身动力装置推进、由制导系统导引控制飞行航迹的飞行器
精通Git-第2版 本书特色 Git仅用了几年时间就一跃成为了几乎一统商业及开源领域的版本控制系统。本书全面介绍Git进行版本管理的基础和进阶知识。全书共10章...
《世界名著大师课:俄罗斯卷》内容简介:本书是世界文学领域的翻译家、权威学者们对俄语文学史上最具有代表性的11部名著的深入解读
HeadFirstC#isacompletelearningexperienceforobject-orientedprogramming,C#,andtheV...