古联OCR

古联OCR

所属分类:古籍网

官方网址:http://ocr.ancientbooks.cn

-- -- 0

站点介绍

古联公司基于机器学习技术研发的面向古籍的智能OCR(图像文本识别)系统,主要处理版刻、写本等各式版本类型的古籍图像,具有智能版面分析、智能成分标注及标注结果的输出能力,常规古籍版面,包含双行夹注、眉批、行间批注、表格的特殊版面都能较好处理,提供即时修订文本、下载doc格式文档的功能。
当前版本支持一次上传1页图像,半页、筒子页、上下拼页、上中下页版面皆可,识别结果精准定位单字, 提供三种校对模式:原版图文综合对照的版式校对、行列切分后每行图文罗列的单列校对、单行图文滚动展示的折校,各模式校对结果实时共享。
多页及图书编辑模式正在研发中。

相关推荐

  • 居延汉简

    居延汉简

    「簡牘字典—史語所藏居延漢簡資料庫」收錄歷年來史語所漢代簡牘數位典藏成果及《居延漢簡》出版內容。以開放的角度協助使用者查詢簡牘資料、字形圖像,是一個能檢索字形、...

  • 香港期刊在线

    香港期刊在线

    HongKongJournalsOnline(HKJO)isafull-textimagedatabaseprovidingaccesstoselectedac...

  • 台湾报纸数据库

    台湾报纸数据库

    查询台湾地区馆藏中西文报纸。【备注】该站已改为馆内浏览。

  • 四库系列索引

    四库系列索引

    整合了《四库全书》《续修四库全书》《四库存目》《四库禁毁》《四库未收》《四库珍本》《摛藻堂四库全书》等系列丛书的书目。

  • 西域历史记忆

    西域历史记忆

  • 台湾“国图”古籍

    台湾“国图”古籍

    台北“國家圖書館”古籍數位典藏,至2016年底為止,系統所收古籍影像約6,528,494葉、金石拓片影像21,076幅。為嘉惠學界,本系統所收之影像已於2017...

微信二维码