(ICDAR2017獲獎證書)

OCR技術(shù)落地,給予全新解決方案

國際文檔分析與識別大會(ICDAR)專注于文本領(lǐng)域的識別與應(yīng)用,自2003年大會設(shè)立“Robust Reading Competitions”以來,該競賽就成了評測和檢驗(yàn)自然場景/網(wǎng)絡(luò)圖片/復(fù)雜視頻文本自動提取與智能識別最新技術(shù)研究進(jìn)展的最為重要的國際賽事及標(biāo)準(zhǔn),競賽中的諸多方法對OCR技術(shù)的發(fā)展具有強(qiáng)大推動力。高技術(shù)難度、強(qiáng)大實(shí)際應(yīng)用性,也使該盛會受到科研院校、科技公司等的關(guān)注,至今已有89個國家的3500多支隊(duì)伍參與。

(參賽隊(duì)伍數(shù)量統(tǒng)計(jì))

據(jù)了解,首次參與競逐的騰訊數(shù)平精準(zhǔn)推薦團(tuán)隊(duì)在文本識別領(lǐng)域上已深耕多年,自研的基于深度學(xué)習(xí)方法的文本檢測與識別技術(shù)在往屆ICDAR競賽數(shù)據(jù)集上也曾多次刷新世界紀(jì)錄。相關(guān)技術(shù)在騰訊內(nèi)部多款產(chǎn)品成功應(yīng)用,特別在廣告推薦的場景中,通過OCR 技術(shù)深度識別和理解廣告素材創(chuàng)意,大幅提升了用戶點(diǎn)擊率預(yù)估的效果。

騰訊優(yōu)圖OCR技術(shù)也早在ICDAR 2015大賽的場景文字識別和自然場景文本檢測兩項(xiàng)目中取得第一,并且,基于騰訊優(yōu)圖實(shí)驗(yàn)室的業(yè)界領(lǐng)先的核心能力,騰訊云將OCR文本識別和檢測技術(shù)真正落地,深度介入印刷體和手寫體存在的各種場景,給予行業(yè)流程繁瑣、效率低下以及成本居高不下的全新解決方案。

智能解放生產(chǎn)力,助力行業(yè)標(biāo)桿

OCR是人工智能里面非常重要的基礎(chǔ)能力之一,對于傳統(tǒng)行業(yè),在優(yōu)化業(yè)務(wù)流程、解放生產(chǎn)力和降低企業(yè)成本方面,實(shí)效凸顯。而受眾群體極廣、業(yè)務(wù)量相對較大、頻次較高的物流場景對這一技術(shù)的追求,顯得迫切,紛紛通過騰訊云依托優(yōu)圖實(shí)驗(yàn)室的OCR技術(shù)給予的全新解決方案成就行業(yè)標(biāo)桿。

物流行業(yè)勞動密集型的屬性,在順豐身上比較明顯。據(jù)悉,目前順豐擁有將近20萬地面小哥,平均每天傳遞將近900萬個包裹和商務(wù)信件,這在以前需要順豐雇傭大量輸單員手動輸入運(yùn)單信息。和騰訊云戰(zhàn)略合作之后,憑借其OCR技術(shù)全新解決方案,實(shí)現(xiàn)快速識別手寫體和打印體的快遞單,準(zhǔn)確率高達(dá)91%。以往因容易認(rèn)錯而加大物流中的人力、物力和時間成本的潦草的手寫寄件收件信息,也能夠識別,正確率接近人工識別水平。最終,加上本身OCR技術(shù)的“7X24”服務(wù)能力,給予順豐3小時內(nèi)識別2000萬張訂單信息的業(yè)務(wù)效率,一定程度上也極大的提高了整體物流效率,而且不經(jīng)人工,也一定程度上降低了用戶隱私泄露的風(fēng)險。

騰訊云與中國外運(yùn)合作,依托優(yōu)圖實(shí)驗(yàn)室識別技術(shù)幫助解決企業(yè)效率問題,也是一個典型的智能實(shí)踐案例。中外運(yùn)是國際整合物流服務(wù)商,海外網(wǎng)絡(luò)覆蓋全球五大洲,其每年業(yè)務(wù)系統(tǒng)訂單超過300萬,而在傳統(tǒng)作業(yè)方式下,人工識別、錄入一筆單據(jù)需要3分鐘。而通過應(yīng)用OCR技術(shù)解決方案,識別單據(jù)僅需4秒,而且實(shí)現(xiàn)識別即入系統(tǒng),效率提升45倍。據(jù)了解,除了單據(jù)錄入,中外運(yùn)在訂艙委托、訂艙確認(rèn)件、提單樣本、發(fā)票等環(huán)節(jié)都應(yīng)用了這一技術(shù),傳統(tǒng)人力操作業(yè)務(wù)流程徹底變成自動化智能化,降低企業(yè)負(fù)擔(dān)。

635480335322409698

強(qiáng)大技術(shù)能力,支撐多場景應(yīng)用環(huán)境

除了物流行業(yè)場景的天然需求,騰訊云依托優(yōu)圖實(shí)驗(yàn)室OCR技術(shù)給予的解決方案,還被廣泛應(yīng)用在金融、保險以及政府部門等行業(yè)組織場景中的證件識別,如身份證、駕駛證、行駛證、營業(yè)執(zhí)照、車牌、名片等。據(jù)了解,該解決方案已支持英文數(shù)字識別,和超過9000個常用漢字的簡繁體識別。針對身份證識別,其已支持身份證的正、反面識別,一次掃描即可識別所有字段,對于像傾斜、暗光、曝光、陰影等異常場景環(huán)境的識別,也能保障準(zhǔn)確率。該解決方案還能通過自適應(yīng)判別糾正技術(shù),將身份證上的數(shù)字識別準(zhǔn)確率提高到99.9%以上,而對印刷體名片,其能自動識別和定位姓名、手機(jī)號、QQ等字段,并實(shí)現(xiàn)30度以內(nèi)的角度偏轉(zhuǎn),姓名字段與手機(jī)號碼字段的自動識別準(zhǔn)確率超過90%,領(lǐng)跑業(yè)界。

值得一提的是,傳統(tǒng)的營業(yè)執(zhí)照信息錄入,要依賴人工對信息進(jìn)行錄入、處理和核對,存在信息錄入錯誤、效率低等問題。上傳營業(yè)執(zhí)照便能自動識別名稱、執(zhí)照號等,支持核實(shí)與糾正識別的信息。避免繁瑣的人工輸入,同時又能提高注冊和客服審核的效率與準(zhǔn)確度。對營業(yè)執(zhí)照存在的不同版本的字段分布差異以及執(zhí)照圖片質(zhì)量差等問題,其定制研發(fā)的OCR檢測識別引擎,識別準(zhǔn)確率達(dá)到95%以上。

騰訊云打造的多場景智能識別解決方案,其本身不斷優(yōu)化升級的同時,還攜手更多行業(yè)合作伙伴,通過技術(shù)賦能實(shí)現(xiàn)行業(yè)改革,提升整體行業(yè)效率,最終也將受惠于每一個人。

分享到

songjy

相關(guān)推薦