近古汉语标记语料库

近古汉语标记语料库

所属分类:古籍网

官方网址:http://lingcorpus.iis.sinica.edu.tw/early/

-- -- 0

站点介绍

「中央研究院近代漢語語料庫」 (Academia Sinica Tagged Corpus of Early Mandarin Chinese) 是「中央研究院古漢語語料庫」 (Academia Sinica Ancient Chinese Corpus)的一個次語料庫。「中央研究院古漢語語料庫」是應漢語史研究需求而建構的語料庫。這個語料庫又可依是否經過斷詞及加標詞類而分成兩類,即未加標的素語料庫以及有標注的標記語料庫。目前素語料庫所蒐集的語料已含蓋上古漢語(先秦至西漢)、中古漢語(東漢魏晉南北朝)、近代漢語(唐五代以後)大部分的重要語料,並己陸續開放使用;在標記語料庫方面,上古漢語及近代漢語都已有部分語料完成標注的工作,並視結果逐步提供上線檢索。
「中央研究院古漢語語料庫」的建構始於一九九0年,創始者為黃居仁(語言所研究員)、譚樸森 (英國倫敦大學亞非學院教授)、陳克健(資訊所研究員)、魏培泉(語言所研究員)等,最初的經費來 源為蔣經國基金會及中央研究院歷史語言研究所,目標只是蒐集上古漢語的素語料。素語料庫的構 建自此未曾停歇,語料也由上古漢語擴充到中古漢語和近代漢語。這個蒐集工作的持續基本上是由 魏培泉負責執行,經費來源則主要為中央研究院。上古漢語語料的標注自一九九五年開始進行,近 代漢語的標注也從一九九七年開始規劃,隨後即付諸實行,主其事者為魏培泉與劉承慧(清華大學中 文系教授)。支持這個標注工作的經費主要來自中央研究院及國科會,在標注及搜檢的技術方面則有 黃居仁、陳克健及本院計算中心的協助。
「中央研究院近代漢語標記語料庫」WWW版於二00一年十一月首次開放供各界使用。目前提 供《紅樓夢》、《金瓶梅》、《平妖傳》、《水滸傳》、《儒林外史》、《醒世姻緣》、《西遊記》 、《關漢卿戲曲集》、《元刊雜劇三十種》、《永樂大典戲文三種》等十部古典文獻語料線上檢索。 本語料庫的查詢功能和斷詞標類的憑準,與 「中央研究院現代漢語平衡語料庫」大致相同,但也有 其特色:如在查詢功能方面,可以在顯示詞項及其詞類的同時,顯示例句的出處,便於歷史語法的研 究者使用;在斷詞標類的憑準方面,也因著眼不同而作了一些變動,如動補結構標示的較詳盡即為一 例。

相关推荐

  • 魏晋玄学研究资料论著目录数据库

    魏晋玄学研究资料论著目录数据库

    魏晉玄學研究論著目錄資料庫。本目錄係由臺灣大學中文系林麗真教授主編,收錄1884-2004年海峽兩岸及亞洲、歐美地區等地學者之有關魏晉玄學研究目錄12,077條...

  • 甲骨实物 国图

    甲骨实物 国图

    被誉为二十世纪四大文献发现之一的甲骨文,集文献性、文物性、收藏性于一身,是研究我国商朝晚期不可多得的珍贵史料。该库包括北京国家图书馆甲骨实物:元数据2964条,...

  • 中国近代文献联合目录

    中国近代文献联合目录

    《中国近代文献联合目录》由中国国家图书馆和上海图书馆等单位共同建设。中国国家图书馆和上海图书馆为国内保存近代文献资料最为丰富的图书馆,《中国近代文献联合目录》在...

  • 古典目录导航 台湾

    古典目录导航 台湾

    中研院史语所建设的古典目录典籍导航系统

  • 学术地图平台

    学术地图平台

    学术地图发布平台由浙江大学社会科学研究院与哈佛大学地理分析中心共同建设,自2018年3月19日上线以来,已发布了300余幅数据地图、600余个图层、40余万条数...

  • 台湾甲骨金文简牍词汇库

    台湾甲骨金文简牍词汇库

    「先秦甲骨金文簡牘詞彙庫」分為詞彙檢索與全文檢索,收錄甲骨文、金文、簡牘三種文字材料,依詞類、材質做為搜尋條件,展示詞彙的詞性、時代、書目來源、釋文段落。特色在...

微信二维码