(VALSE2019騰訊優(yōu)圖展位)
VALSE大會發(fā)起于2011年,致力于為計算機視覺、圖像處理、模式識別與機器學(xué)習(xí)研究領(lǐng)域的華人青年學(xué)者提供一個自由、平等的深層次學(xué)術(shù)交流舞臺,促進相關(guān)領(lǐng)域取得突破性學(xué)術(shù)成就和成果轉(zhuǎn)化,提升中國青年學(xué)者在國際學(xué)術(shù)舞臺上的影響力。騰訊優(yōu)圖算法研究員劉皓作為演講嘉賓出席,對外分享了騰訊優(yōu)圖在OCR技術(shù)領(lǐng)域的學(xué)術(shù)研究成果與產(chǎn)品解決方案應(yīng)用實踐。
(騰訊優(yōu)圖算法研究員劉皓在VALSE2019)
騰訊優(yōu)圖OCR技術(shù)四大優(yōu)勢:適配強、計算快、識別準、應(yīng)用廣
騰訊優(yōu)圖實驗室成立于 2012 年,是騰訊旗下頂級的 AI 實驗室之一,專注人臉人體、圖像處理、模式識別、機器學(xué)習(xí)等領(lǐng)域的技術(shù)研究和業(yè)務(wù)落地。目前,優(yōu)圖的AI 技術(shù)已廣泛應(yīng)用在零售、安防、金融、物流等諸多領(lǐng)域,提供超過12個行業(yè)解決方案,接入70多條騰訊明星產(chǎn)品業(yè)務(wù),擁有超過700項全球?qū)@T趯W(xué)術(shù)成就方面,優(yōu)圖實驗室累計申請了327篇國內(nèi)AI專利和169篇國際AI專利,2019年 3月,優(yōu)圖實驗室25篇論文入選全球頂級計算機視覺會議CVPR2019的成績,備受業(yè)界矚目。
經(jīng)過長期深耕發(fā)展,優(yōu)圖在發(fā)展得最早也最為成熟的OCR應(yīng)用方面,已擁有領(lǐng)先行業(yè)的四大競爭優(yōu)勢。首先,業(yè)務(wù)適配強,通用性好。騰訊優(yōu)圖擁有千萬級的數(shù)據(jù)支撐,支持英、日、韓、西、法等19種語言及數(shù)字符號,超過20000個漢字識別,具備廣泛的適配能力。其次,計算速度快、效率更高。優(yōu)圖OCR技術(shù)文字識別速度GPU平均2ms/字符,CPU平均6ms/字符,模型優(yōu)化迭代快,服務(wù)更為穩(wěn)定。
第三,識別準,在手寫體識別領(lǐng)域顯著領(lǐng)先。騰訊優(yōu)圖OCR技術(shù)手寫體識別能力達到國內(nèi)首家企業(yè)級應(yīng)用標準,手寫中文識別準確率達90%以上,手寫英文單詞級識別準確率更是高達95%以上。最后,應(yīng)用場景廣泛,經(jīng)過海量服務(wù)檢驗。目前優(yōu)圖已經(jīng)在騰訊企業(yè)內(nèi)外上百個不同業(yè)務(wù)中落地應(yīng)用,日調(diào)用量超千萬,尤其在物流、銀行、保險、政務(wù)、手機、教育、互聯(lián)網(wǎng)等重點行業(yè)的幾十家大型企業(yè)上線應(yīng)用后,備受用戶好評。
促進技術(shù)與產(chǎn)業(yè)場景融合? 助力各行各業(yè)實現(xiàn)智慧升級
騰訊優(yōu)圖始終積極推動研究成果在業(yè)務(wù)領(lǐng)域的落地。在OCR領(lǐng)域,騰訊優(yōu)圖基于多角度文本檢測、語義增強的文字識別、公式識別、NLP后處理等基礎(chǔ)技術(shù),輸出了財務(wù)報銷憑證識別、證照識別、通用文字識別、單據(jù)識別、汽車信息識別、教育試題識別等多個產(chǎn)品解決方案, 并在微信、QQ、順豐、滴滴出行等一批頭部應(yīng)用中落地。
借助騰訊優(yōu)圖OCR技術(shù),通過對業(yè)務(wù)場景進行智能改造,能夠極大地減少人力成本、提高生產(chǎn)效率。例如優(yōu)圖與順豐合作,針對運單的收寄件人電話號碼和收件人省市區(qū)地址信息做了深入的研究,取得高精度的識別成果??爝f公司基于這些OCR自動識別信息,再結(jié)合自有運單數(shù)據(jù)庫,可以自動匹配到更完整更充分的運單各字段信息,大幅提升了運單信息錄入效率和物流資源的調(diào)度匹配能力。
在技術(shù)攻堅方面,針對行業(yè)普遍困擾的英文識別難點,包括印刷體、手寫體差異大,手寫體書寫潦草、涂抹痕跡多等問題,騰訊優(yōu)圖OCR技術(shù)創(chuàng)造性地采用多種數(shù)據(jù)增強辦法,并融入NPL模型和優(yōu)化數(shù)據(jù)篩選等機制,提升了解決方案的魯棒性,令識別結(jié)果更精確,被廣泛應(yīng)用在銀行支票、英文菜單、個人名片等諸多領(lǐng)域,極大地提升了用戶體驗。
秉承“研究成果落地才能產(chǎn)生價值”的原則,騰訊優(yōu)圖始終緊跟時代和技術(shù)前沿,在技術(shù)研究和業(yè)務(wù)落地等方面持續(xù)發(fā)力,輸出前沿的視覺技術(shù)解決方案,促進技術(shù)成果在產(chǎn)業(yè)中的落地轉(zhuǎn)化,助力各行各業(yè)實現(xiàn)數(shù)字化、智慧化轉(zhuǎn)型,加速智慧產(chǎn)業(yè)時代的到來。