古联公司基于机器学习技术研发的面向古籍的智能OCR(图像文本识别)系统,主要处理版刻、写本等各式版本类型的古籍图像,具有智能版面分析、智能成分标注及标注结果的输...
BCC汉语语料库,总字数约150亿字,包括:报刊(20亿)、文学(30亿)、微博(30亿)、科技(30亿)、综合(10亿)和古汉语(20亿)等多领域语料,是可以...
是以馆藏民国期刊的缩微胶片数字化资料为基础建设的数据库,预计将在三年内完成近600万拍缩微胶片的数字转换。
《經籍籑詁》的數字化數據。能檢索全部字頭及相關異體字共15007個,注明所屬韻部及韻目初始頁碼。原刻本中的譌誤字頭,徑予改正,檢索“W”可得。新增異體字,以便檢...
中华古籍保护计划的重要成果,目前在线发布的古籍影像资源包括:国家图书馆藏善本和普通古籍、法国国家图书馆藏敦煌遗书、天津图书馆藏普通古籍等,资源总量超过3.2万部...