聊城由嚷娱乐有限公司

DAV首頁
數(shù)字音視工程網(wǎng)

微信公眾號

數(shù)字音視工程網(wǎng)

手機DAV

null
null
null
卓華,
招商,
null
null
null
快捷,
null

我的位置:

share

科大訊飛獲得 ICFHR 2020 數(shù)學(xué)公式識別挑戰(zhàn)賽冠軍!

來源:訊飛智慧政法        編輯:lsy631994092    2020-06-17 17:34:40     加入收藏

近日,科大訊飛A.I.研究院聯(lián)合中科大語音及語言信息處理國家工程實驗室,以顯著優(yōu)勢獲得 ICFHR 2 020 OffRaSHME數(shù)學(xué)公式識別挑戰(zhàn)賽冠軍 。

圖片

  沒錯,我們又拿了第一!

  近日,科大訊飛A.I.研究院聯(lián)合中科大語音及語言信息處理國家工程實驗室,以顯著優(yōu)勢獲得 ICFHR 2 020 OffRaSHME數(shù)學(xué)公式識別挑戰(zhàn)賽冠軍 。

圖片

離線手寫數(shù)學(xué)公式識別(官方數(shù)據(jù))榜單

圖片

離線手寫數(shù)學(xué)公式識別(外源數(shù)據(jù))榜單

  注:“Correct”表示公式識別的句正確率,“≤1s.err”和“≤2s.err”分別表示整條公式中允許出現(xiàn)1處和2處錯誤的識別的句正確率

 

  此次OffRaSHME數(shù)學(xué)公式識別挑戰(zhàn)賽由ICFHR 2020舉辦,除科大訊飛外,韓國三星、東京農(nóng)工大學(xué)、華南理工大學(xué)、中山大學(xué)等多家常年深耕文檔分析理解領(lǐng)域的研究機構(gòu)都參與其中。

  本次識別挑戰(zhàn)賽「難」在哪里?

  公式結(jié)構(gòu)復(fù)雜,尤其是各種結(jié)構(gòu)的嵌套, 例如:

圖片

  形近字難識別,如X和x,Z和2,γ和r, 例如:

圖片

 

  本次比賽添加了很多非常規(guī)符號的組合,這些容易和公式混淆, 例如:

圖片

  科大訊飛是如何獲得「冠軍」的?

  我們在數(shù)學(xué)公式識別中創(chuàng)造性地提出了Encoder-TreeDecoder識別算法 。

  針對有復(fù)雜嵌套結(jié)構(gòu)關(guān)系的數(shù)學(xué)公式識別:

  我們提出了基于樹形結(jié)構(gòu)信息建模的Encoder-TreeDecoder識別算法,通過使用樹形結(jié)構(gòu)信息對數(shù)學(xué)公式的符號和符號間結(jié)構(gòu)關(guān)系分別進行建模,來進行數(shù)學(xué)公式識別。

  針對難以辨別的形近字符和非常規(guī)符號的組合:

  我們使用了基于LaTeX語言模型的數(shù)據(jù)增強策略,對官方提供的數(shù)據(jù)進行合理的拆分分解訓(xùn)練公式語言模型,并使用語言模型合成出更加合理的符合上下文關(guān)聯(lián)性的數(shù)據(jù),很大程度上緩解形近符號識別困難的問題。

  通過多項技術(shù)能力的綜合運用, 在“能看會認”上,我們做得更好了!

  ——不僅能識別更復(fù)雜的數(shù)學(xué)公式,還能做到“中文+數(shù)學(xué)公式”混合搭配的內(nèi)容識別。

  數(shù)學(xué)公式識別領(lǐng)域的突破,對實際學(xué)生作業(yè)試卷文檔的版面結(jié)構(gòu)復(fù)雜、書寫風(fēng)格差異顯著等難點問題,提供更為豐富有效的解決方案。

  此外,我們還在ICDAR ReCTS評測任務(wù)中刷新了 單字識別、文本行識別、文本行檢測和端到端識別全部 四項榜單世界紀 錄, 使得我們的系統(tǒng)在解決復(fù)雜場景下文字檢測和識別的難題中更為游刃有余。

圖片

  應(yīng)用立地,更有A.I.的產(chǎn)品等你體驗

  “技術(shù)頂天,應(yīng)用立地”,基于在圖文識別等核心技術(shù)上取得的持續(xù)突破,我們打造出了一批具備“能看會認”能力的A.I.產(chǎn)品。

  ▌訊飛智能學(xué)習(xí)機

  我們在此次「數(shù)學(xué)公式識別任務(wù)」 中突破了諸多關(guān)鍵技術(shù)。依托這些技術(shù),訊飛智能學(xué)習(xí)機幫助學(xué)生精確地進行大數(shù)據(jù)學(xué)情分析找到知識點的薄弱項,實現(xiàn)“個性化精準學(xué)”,提升學(xué)習(xí)效率、鞏固學(xué)習(xí)效果。

  手寫數(shù)學(xué)題解答功能即將開放

  ▌訊飛智能辦公本

  我們實現(xiàn)了手寫圖文識別也與智能語音等關(guān)鍵技術(shù)深度融合。依托這些技術(shù),“出口成章,躍然紙上”的訊飛智能辦公本可以實現(xiàn)語音直接搜索手寫筆記內(nèi)容,「一句話找到手寫筆記」 ,滿足用戶在更多筆記場景下的記錄、寫作、搜索、多端同步需求,有效提高辦公效率。

  ▌訊飛翻譯機

  我們基于注意力機制的Encoder-Decoder模型在「自然場景文字識別任務(wù)」 上,通過融合語言模型進行端到端訓(xùn)練,使得拍照模糊的文字也能通過語言模型“聯(lián)想”而被正確識別。依托此項技術(shù),訊飛翻譯機拍照翻譯更清晰更準確,能夠滿足更多消費者在國外旅游、購物的場景應(yīng)用需求。

圖片

  ▌訊飛輸入法

  我們在「在線手寫字符識別任務(wù)」 上取得突破性進展,將輕量級的卷積神經(jīng)網(wǎng)絡(luò)首次在手機設(shè)備上實際應(yīng)用。依托此項技術(shù),訊飛輸入法手寫輸入體驗顯著提升。

圖片

  堅守人工智能道路21年,我們不斷攀越技術(shù)高峰,在智能語音、計算機視覺、自然語言理解等技術(shù)領(lǐng)域摘得一項又一項桂冠,但這并不是終點。

  我們將始終秉承“頂天立地”的技術(shù)信仰,打造一件件“能聽會說”“能看會認”“能理解會思考”的人工智能產(chǎn)品,用人工智能點亮人間煙火。

免責(zé)聲明:本文來源于訊飛智慧政法,本文僅代表作者個人觀點,本站不作任何保證和承諾,若有任何疑問,請與本文作者聯(lián)系或有侵權(quán)行為聯(lián)系本站刪除。(原創(chuàng)稿件未經(jīng)許可,不可轉(zhuǎn)載,轉(zhuǎn)載請注明來源)
掃一掃關(guān)注數(shù)字音視工程網(wǎng)公眾號

相關(guān)閱讀related

評論comment

 
驗證碼:
您還能輸入500
    增城市| 章丘市| 金川县| 浦江县| 板桥市| 兴安盟| 工布江达县| 云林县| 兰州市| 建平县| 当雄县| 洪江市| 霍州市| 茶陵县| 景宁| 万安县| 板桥市| 鹿泉市| 福鼎市| 汶上县| 弥勒县| 吐鲁番市| 滁州市| 白城市| 贵溪市| 瑞昌市| 长宁区| 张家川| 寿阳县| 靖州| 丁青县| 封丘县| 新余市| 和静县| 宁乡县| 云和县| 齐齐哈尔市| 图木舒克市| 吉安县| 诸暨市| 长汀县|