古联自动标点

古联自动标点

所属分类:古籍网

官方网址:http://autopun.ancientbooks.cn

-- -- 0

站点介绍

“古籍自动标点系统”是分别由古联智能数据研究室和“古联-北师大联合实验室”基于不同训练方法研发的系统平台。与其他团队自动标点模型训练不同的是,古联公司使用了《中华经典古籍库》独有的数据量高达15亿的整理本古籍作为训练集。模型效果在验证集上的标点F1值超过92%,断句F1 值超过96%。经过测试用户的实际感受,对于大部分文献的自动标点和句读效果还要好于数值表现,完全可以成为一般读者阅读古籍文献的得力助手。

相关推荐

  • 古籍智能网

    古籍智能网

    "古籍智能"网站的目标是:在古籍整理与研究领域和信息技术领域二者之间,搭建起沟通和协作的桥梁,报道业界和学术界最新进展,汇聚高校、收藏单位和企业界人士,促进人工...

  • 法国国图

    法国国图

    法国国家图书馆所藏的与中国有关的数字化资源。【备注】感谢韩凤冉老师提供信息。

  • 语委古汉语语料库

    语委古汉语语料库

    语料库:古籍语料库.语料库字数:约7000万字.语料库说明:古代汉语语料库包含自周至清各朝代的文本语料,含四库全书中的大部分古籍资料。部分书目如下:诗经、尚书、...

  • 双红堂文库

    双红堂文库

    雙紅堂文庫的內容,是由長澤規矩也先生所收集中國明清時代的戲曲小說類古書,約550部(約3000冊)。這些書籍可細分為戲曲類380部、小說類172部。關於「雙紅堂...

  • 古今文字集成

    古今文字集成

    古今文字集成(ccamc.co)是一個集古今文字释義、字形更革、音韻演變之大全的大型在線辭書。我們致力於提供更完美的一站式字典查詢服務。所謂古今文字之古文指的是...

  • 中文断词系统 台湾

    中文断词系统 台湾

    詞是最小有意義且可以自由使用的語言單位。任何語言處理的系統都必須先能分辨文本中的詞才能進行進一步的處理,例如機器翻譯、語言分析、語言了解、資訊抽取。因此中文自動...

微信二维码