本书以关系标记为切入点,以“小句中枢”和“词语发配”为理论背景,将搭配研究基本手段与“两个三角”,即“表-里-值”小三角和“普-方-古”大三角的研究方法紧密地结合起来,利用“汉语复句语料库”与“《人民日报》语料样本”作为数据支持,追求对语言事实的“观察充分”、“描写充分”和“解释充分”。研究中运用了统计分析、层次聚类等多种跨学科研究方法,目的是从全新的角度来观察和分析关系标记搭配的句式与语义特点。
**章研究背景:“小句中枢理论”与复句信息工程
引言
本章介绍全书的研究背景——“小句中枢理论”与复句信息工程。主要包括两节:**节“‘小句中枢理论,在中文信息处理中的应用”,从词语的自动切分和标注、短语的识别和标注、歧义的消解、语法实体复杂特征集的描写四个方面讨论“小句中枢理论”在中文信息处理领域的应用;第二节“‘小句中枢理论’与复句信息工程”,讨论复句信息工程的研究内容、研究目标以及“汉语复句语料库”的建设和利用等问题。
**节“小句中枢理论”在中文信息处理中的应用
“小句中枢理论”的核心内容是“句管控”,“句管控”思想在解决中文信息处理面临的一些难题中可以发挥作用。“小句中枢理论”中的“小三角”研究思路实际上是人们全面认识和描述事物的一种方法,从信息论的角度来说是一种全信息表示法,它和当前自然语言处理倡导的“复杂特征集”的描写在本质上是相通的。在中文信息处理中,小句中枢理论可以应用于以下几个方面。
一、应用于词语的自动切分和标注
词语的自动切分和标注是进行汉语句法分析的前提。目前,汉语的自动分词和词性标注基本上达到了能够实际应用的水平,但准确率还有待提高。未登录词的识辨和歧义切分字段的处理是自动分词研究中遇到的两个主要困难,不能识别未登录词或者错误的识别都会导致不正确的标注。汉语中,词的兼类现象特别是活用现象大量存在,增加了分词系统中词库的建设难度。即使在词库中确定了形形色色的兼类词,也难以确定兼类词的具体词性,因为兼类词处于此句法环境中可能是甲类词,而处于彼句法环境中可能是乙类词。活用的现象更复杂,什么词可以活用,可以活用为什么词,都很难把握。然而,兼类也好,活用也好,任何词进入到具体的句子之中,就一定会受到句子的约束和管控。正因如此,“句管控”思想在理论与实践上具有不言而喻的价值。
……
现代文言 本书特色 《现代文言》辑录篇什,是当今中学生大体可以读懂的文言文,也是大学教授未必读过的文言文。全书共五卷,**卷绪论,论述中华民族的文言传统绵亘不绝...
中国俗文化丛书 民间医俗 内容简介 在中华民族光辉而悠久的历史传统文化中,俗文化占有十分重宴的地位。它不仅是雅文化不可缺少的伴侣,而且具有自身独立的社会价值。它...
中国文化故事 内容简介 讲中国文化的书,简单罗列的和抽象论述的,都不好读。中国文化被说得多了,还能有新东西可讲吗?本书的主题无不是精挑细选出来的,作者颇有“小题...
语言文献论集 本书特色 回想起来,我的求学道路可谓漫长,直到现在,虽然已过不惑之年,却未能免俗,还在为一个博士学位而“奋斗”,说“不惑”,有点儿自欺欺人。 19...
欧洲如一面镜子 本书特色 触摸欧洲文明,从碎石窄巷、小桥流水人家;到咖啡馆、面包房;再到爱琴海和葡萄园;直至博物馆和教堂;城堡和王室;还有歌剧院和大学;还有绿色...
老照片.第二十一辑 内容简介 《老照片》出到二十一辑了,一直长销不衰,大抵回忆是人生一道必不可少的程序,我们总是在一道道黑与白的光影里流连忘返,看似水流年中的别...
新编实用行业联-中华对联丛书精选系列 本书特色 对联,雅称“楹联”,又称“联语”、“对子”等,它是汉语言文化所特有的一种艺术形式,在我国灿烂的文化艺术宝库中占有...
传统文化中的生计策略:以侗族为例案 内容简介 本书共分七章,主要内容涵盖绪论;生态环境的改性与侗族传统生计的嬗变历程;稻鱼鸭共生的稻作农业;生计方式的积累创新与...
随书随笔-(外五种) 本书特色 《刘师培国学讲论丛书:读书随笔(外五种)》内容包括《读书随笔》、《读书续笔》、《左盦题跋》、《读道藏记》、《敦煌新出唐写本提要》...
中国文化概论 内容简介 本书概论中国文化,在编章展开之前,有必要就全书的核心概念、涉及范围、基本宗旨等问题预作说明,是为绪论。本书作为高等学校人文素质教育公共课...
资中筠作品:老生常谈(精装) 本书特色 1. 本书一以贯之的,是作者对现实的忧思和焦虑,拳拳之心,感人肺腑。2. 作者对现实的观察和问题的反思,常常是深入历史,...
享受人生-我的生命美学 本书特色 作者退休后,定居海滨小城,每日闭门谢客,静心读书思考,将自己的心得体会记录下来,形成这部作品。主要倡导超然、豁达、淡泊名利、追...
心理空间-自然语言意义建构面面观:西方语言学与应用语言学视野 本书特色 本书是“西方语言学与应用语言学视野”之一,全书共分5个章节,运用心理空间这一概念讨论了指...
格林童话-外国文学经典.名家名译(全译本) 本书特色 19世纪初,格林兄弟收集并整理了大量的民间故事,改编成了《儿童与家庭童话集》。此后,许多动画片、电影和文学...
珍档里的上海-雅俗上海的格调与情怀 本书特色大光明、国际饭店、大世界、十六铺、国泰电影院、音乐厅、红房子、中山公园、四马路、金都戏院、医学院路……一长串有独特内...
俗语 本书特色 俗语,也称俗话。典型的俗语即所谓的谚语,是一种在民间广泛流传的通俗的定型语句,是人民群众在生产劳动和社会生活实践中创造出来的,反映了人民的生活经...
外语阅读教学与心理学 本书特色 本书是作者近年来学习阅读心理学理论,研究阅读教学的一些心得,是试图将理论与实践联系起来的应用性探讨。首先向从事外语教学的同行们介...
民间社火 本书特色 《民间社火》为弘扬中华传统文化建设,民族精神家园的美德,中华民俗是炎黄子孙沟通情感的纽带,是彼此认同的标志,是规范行为的准绳,是维系群体团结...
可蕊本名閆冰,女,網名可蕊,一九七五年出生,山東省青州市人。自幼酷愛文學,尤其喜歡幻想類作品,著有詩歌散文集《遠去的歌》(2000年)。 2002年起在網路發表...
日本近代国语批判 内容简介 这部著作采用的是一种近似“欧文直译体”的翻译文体。其句式表达、文脉架构、逻辑推理、修辞手法等极富个性。本书对日语民族主义“忤逆式”的...