“尚古匯典”專欄 | 獻禮讀書節(jié) · “尚古匯典”O(jiān)CR公測上線
全面免費開放個人版公測
獻禮讀書節(jié),“尚古匯典·古籍數(shù)字服務平臺”,古籍OCR(個人版)公測全面上線,用戶可通過掃碼后,登錄平臺首頁領取200面額度的免費試用,并30天全平臺資源暢享VIP權限!!!

中國有幾千年的輝煌文明,在上下五千年的歷史長河中,傳承了非常多的珍貴古籍。這些古籍承載著豐富的歷史、文化、政治、經(jīng)濟等方面的信息,具有非常重要的價值。據(jù)《中國古籍總目》統(tǒng)計,中國目前現(xiàn)存可知古籍數(shù)量大約有20萬種,50萬個版本。在古籍數(shù)字化迅速發(fā)展的今日,依然有大量的古籍沒有完成文字識別轉(zhuǎn)錄工作。
“尚古匯典·古籍數(shù)字服務平臺”所搭載的光學字符識別(OCR)技術工具,能高效助力我們精準識別古籍中的內(nèi)容與文字,深入分析版面并支持版式信息結構性輸出。這對于古籍的保護、檢索工作,乃至信息的深入挖掘和知識發(fā)現(xiàn),均具有重大意義。
“尚古匯典” 古籍OCR工具根據(jù)用戶的特色,設計了兩大版本:一為個人版,一為機構版。
尚古匯典” 古籍OCR工具個人版優(yōu)勢
●建立在高質(zhì)量、大規(guī)模的古籍標準化標注數(shù)據(jù)基礎上,對原版古籍數(shù)據(jù)進行了針對性訓練。版式和文字的平均識別準確率均達98%。

●行識別與字識別兩相對照,支持版式校正,以及原文與識別文字列對列逐字校正。


●支持識別文本結構性區(qū)分導出。
“
尚古匯典” 古籍OCR工具機構版優(yōu)勢
在繼承OCR個人版優(yōu)勢的同時,機構版更貼合實際項目管理需求,為機構用戶提供了更加全面、高效的文字識別體驗。
●?易錯字提醒:在高質(zhì)量、大規(guī)模的古籍標準化標注數(shù)據(jù)基礎上,利用大數(shù)據(jù)算法,在OCR識別時將易錯字高亮提醒。

●?字聚類功能:支持在選定的文本范圍內(nèi),進行以識別字為單位的關聯(lián)字圖聚合,并支持實時修正。該功能通過同一字圖的統(tǒng)一聚類來進行識別。
●文本對比功能:在高質(zhì)量、大規(guī)模的古籍標準化標注,以及古籍訓練的海量數(shù)據(jù)中,通過人工智能技術的相似文本篩選,支持識別結果比對驗證。
“尚古匯典·古籍數(shù)字服務平臺”將持續(xù)更新升級
歡迎長按以下二維碼,了解更多。

相關推薦