上古汉语标记语料库

上古汉语标记语料库

所属分类:古籍网

官方网址:http://lingcorpus.iis.sinica.edu.tw/ancient/

-- -- 0

站点介绍

「中央研究院上古漢語標記語料庫」是「中央研究院古漢語語料庫」(Academia Sinica Ancient Chinese Corpus)的一個次語料庫。「中央研究院古漢語語料庫」是應漢語史研究需求而建構的語料庫。這個語料庫又可依是否經過斷詞及加標詞類而分成兩類,即未加標的素語料庫以及有標注的標記語料庫。目前素語料庫所蒐集的語料已含蓋上古漢語(先秦至西漢)、中古漢語(東漢魏晉南北朝)、近代漢語(唐五代以後)大部分的重要語料,並已陸續開放使用;在標記語料庫方面,上古漢語及近代漢語都已有部分語料完成標注的工作,並視結果逐步提供線上檢索。
「中央研究院古漢語語料庫」的建構始於一九九0年,創始者為黃居仁(語言所研究員)、譚樸森(英國倫敦大學亞非學院教授)、陳克健(資訊所研究員)、魏培泉(語言所研究員)等,最初的經費來源為蔣經國基金會及中央研究院歷史語言研究所,目標是蒐集上古漢語的素語料。素語料庫的構建自此未曾停歇,語料也由上古漢語擴充到中古漢語和近代漢語。
這個蒐集工作的持續基本上是由魏培泉負責執行,經費來源主要為中央研究院。上古漢語語料的標注自一九九五年開始進行,近代漢語的標注也從一九九七年開始規劃,隨後即付諸實行,主其事者為魏培泉與劉承慧 (清華大學中文系教授)。支持這個標注工作的經費主要來自中央研究院及國科會,在標注及搜檢的技術方面則有黃居仁、陳克健及本院計算中心的協助。

相关推荐

  • 香港汉达文库

    香港汉达文库

    汉达文库由香港中文大学中国文化研究所中国古籍研究中心于1998年建立,至今已有六个中国古代传世文献及出土文献资料库。资料库共收录约8,000万字,其年代由商周以...

  • 台湾华艺学术文献数据库

    台湾华艺学术文献数据库

    本数据库=台湾科学期刊库+台湾科学论文库+台湾人社期刊库+台湾人社论文库。52余万篇学术文献,50余所菁英大学学位论文。

  • 法国国图

    法国国图

    法国国家图书馆所藏的与中国有关的数字化资源。【备注】感谢韩凤冉老师提供信息。

  • 日本东洋文库

    日本东洋文库

    東洋文庫の蔵書は、漢籍を含むアジア諸地域歴史文献(チベット語、タイ語、アラビア語、ペルシア語、トルコ語など諸言語文献)と欧文資料および和書とに三大別されます。現...

  • 左传检索平台

    左传检索平台

    左传全文检索Poweredby:南京师范大学文学院2012级汉语言专业:王璐朱福耘李晓炜曹艺凡;2012级古典文献专业:王雨非;指导老师:李斌

  • 贩书偶记续编

    贩书偶记续编

    《贩书偶记续编》为雷梦水著,1980年出版,共收录6000余种清代图书,是对《贩书偶记》的补充。

微信二维码