阿里達(dá)摩院成功開(kāi)發(fā)出古籍?dāng)?shù)字化平臺(tái):識(shí)別準(zhǔn)確率高達(dá)97.5%

發(fā)布時(shí)間:2021-05-19 09:43:26  |  來(lái)源:網(wǎng)易科技  

5 月 18 日,“漢典重光”海外古籍?dāng)?shù)字化回歸發(fā)布會(huì)在中國(guó)科技館舉行。“漢典重光”項(xiàng)目由阿里巴巴公益基金會(huì)、四川大學(xué)、美國(guó)加州大學(xué)伯克利分校、中國(guó)國(guó)家圖書館、浙江圖書館合作開(kāi)展,旨在尋覓流散海外的中國(guó)古籍并將其數(shù)字化、公共化。

據(jù)介紹,借助阿里達(dá)摩院的技術(shù),首批 20 萬(wàn)頁(yè)古籍已完成數(shù)字化,并沉淀為覆蓋 3 萬(wàn)多字的古籍字典,公眾可通過(guò)漢典重光平臺(tái)翻閱、檢索古籍。據(jù)悉,達(dá)摩院 AI 對(duì) 20 萬(wàn)頁(yè)古籍的識(shí)別準(zhǔn)確率達(dá)到 97.5%。

據(jù)悉,伯克利提供古籍的掃描圖片和編目數(shù)據(jù),達(dá)摩院將其全部文字化。此外,達(dá)摩院技術(shù)團(tuán)隊(duì)還與四川大學(xué)專家聯(lián)手研發(fā)了一套全新的古籍識(shí)別系統(tǒng)。利用單字檢測(cè)、無(wú)監(jiān)督單字聚類、小樣本學(xué)習(xí)、主動(dòng)學(xué)習(xí)等機(jī)器學(xué)習(xí)方法,構(gòu)造了一套邊識(shí)別古籍、邊訓(xùn)練模型的系統(tǒng)。

阿里巴巴達(dá)摩院院長(zhǎng)張建鋒表示,守護(hù)中華傳世典籍,是科技工作者和文化工作者共同的使命。阿里計(jì)劃將這套技術(shù)工具連同古籍?dāng)?shù)字化平臺(tái)一并捐贈(zèng),交由權(quán)威公共機(jī)構(gòu)長(zhǎng)期運(yùn)營(yíng)。

關(guān)鍵詞: 阿里 達(dá)摩院

 

滾動(dòng)

關(guān)于我們 - 聯(lián)系我們 - 版權(quán)聲明 - 招聘信息 - 友鏈交換

2014-2020  電腦商網(wǎng) 版權(quán)所有. All Rights Reserved.

備案號(hào):京ICP備2022022245號(hào)-1 未經(jīng)過(guò)本站允許,請(qǐng)勿將本站內(nèi)容傳播或復(fù)制.

聯(lián)系我們:435 226 40@qq.com