業(yè)界首發(fā)EasyDL OCR自訓(xùn)練平臺(tái),低成本滿足OCR定制化需求
近年來,OCR的識(shí)別能力不斷突破,逐漸在更加復(fù)雜的數(shù)字化場(chǎng)景發(fā)揮作用,有效降低信息提取和錄入的人力成本,幫助企業(yè)專注于上層業(yè)務(wù)應(yīng)用。與此同時(shí),企業(yè)對(duì)于OCR識(shí)別模型定制化的需求日益旺盛,包括OCR在特定場(chǎng)景下是否有高精度識(shí)別效果、能否高效響應(yīng)自身業(yè)務(wù)需求、是否能在模型訓(xùn)練過程中保證數(shù)據(jù)安全,以上三點(diǎn)成為行業(yè)共性訴求。
為滿足企業(yè)快速定制OCR識(shí)別模型的訴求,EasyDL OCR自訓(xùn)練平臺(tái)應(yīng)運(yùn)而生。據(jù)介紹,EasyDL OCR 自訓(xùn)練平臺(tái)具有兩大核心產(chǎn)品功能,即自動(dòng)訓(xùn)練OCR和定制化訓(xùn)練OCR;同時(shí)具備三大產(chǎn)品特性,包括內(nèi)置成熟OCR技術(shù)方案,預(yù)置經(jīng)過真實(shí)業(yè)務(wù)檢驗(yàn)的多種自動(dòng)化機(jī)制,如智能標(biāo)注、自動(dòng)數(shù)據(jù)預(yù)處理、虛擬數(shù)據(jù)生成等,同時(shí)還開放了調(diào)參能力,滿足多種場(chǎng)景OCR模型定制訓(xùn)練需求,保證高準(zhǔn)確率;可視化模型訓(xùn)練,預(yù)置領(lǐng)先的OCR算法,可實(shí)現(xiàn)零門檻模型訓(xùn)練,高效響應(yīng)業(yè)務(wù)需求;支持本地私有化部署,數(shù)據(jù)無需出廠,有效保障數(shù)據(jù)安全。
會(huì)上,EasyDL OCR產(chǎn)品負(fù)責(zé)人還分別演示了自動(dòng)化訓(xùn)練OCR和定制化訓(xùn)練OCR模型訓(xùn)練過程,并在最后總結(jié)了適合應(yīng)用的不同場(chǎng)景和優(yōu)勢(shì)。
具體而言,自動(dòng)化訓(xùn)練OCR每個(gè)版式僅需1張訓(xùn)練圖片,“智能標(biāo)注”功能支持快速標(biāo)注關(guān)鍵字段,顯著提升標(biāo)注效率,系統(tǒng)自動(dòng)完成模板分類,可應(yīng)用于版式多樣、識(shí)別特定字段、圖像質(zhì)量統(tǒng)一的場(chǎng)景,同時(shí)模型重訓(xùn)功能支持新增版式的快速擴(kuò)充。定制化訓(xùn)練OCR則具有數(shù)據(jù)自動(dòng)生成能力,可模擬各類真實(shí)場(chǎng)景中復(fù)雜數(shù)據(jù)狀況,如模糊、變形、缺角等,少量標(biāo)注數(shù)據(jù)即可獲得更高的識(shí)別準(zhǔn)確率,可應(yīng)用于版式固定、全字段識(shí)別、圖片質(zhì)量復(fù)雜的場(chǎng)景。
百度OCR“技術(shù)+產(chǎn)品+應(yīng)用”行業(yè)領(lǐng)先,助力企業(yè)智能化升級(jí)
百度OCR是國內(nèi)應(yīng)用最廣泛的文字識(shí)別服務(wù),依托業(yè)界領(lǐng)先的深度學(xué)習(xí)技術(shù)和海量?jī)?yōu)質(zhì)數(shù)據(jù),提供多場(chǎng)景、多語種、高精度的文字檢測(cè)與識(shí)別服務(wù),并針對(duì)圖片模糊、傾斜、翻轉(zhuǎn)等情況進(jìn)行深度優(yōu)化,魯棒性強(qiáng),多項(xiàng)ICDAR指標(biāo)居世界第一,通用、主流卡證識(shí)別準(zhǔn)確率高達(dá)99%。
而其背后正是由百度AI核心技術(shù)引擎——百度大腦支撐,如今升級(jí)到6.0的百度大腦已成為AI新型基礎(chǔ)設(shè)施。從基礎(chǔ)層的算力、數(shù)據(jù)、飛槳深度學(xué)習(xí)平臺(tái),到感知層的語音、視覺、AR/VR,再到認(rèn)知層的語言與知識(shí),以及平臺(tái)層的AI平臺(tái)與生態(tài),百度大腦始終保持核心技術(shù)持續(xù)領(lǐng)先,不斷夯實(shí)“軟硬一體AI大生產(chǎn)平臺(tái)”,并通過百度智能云整合輸出產(chǎn)品服務(wù),加速產(chǎn)業(yè)智能轉(zhuǎn)型升級(jí)。截至目前,百度大腦已經(jīng)開放了273項(xiàng)AI能力,凝聚超過230萬開發(fā)者,培養(yǎng)了超過100萬AI人才,在眾多行業(yè)領(lǐng)域落地應(yīng)用,推動(dòng)了中國AI技術(shù)研發(fā)、實(shí)踐應(yīng)用與生態(tài)建設(shè)。
產(chǎn)業(yè)智能化升級(jí)一個(gè)核心前提就是,信息數(shù)字化和結(jié)構(gòu)化。OCR作為最早應(yīng)用于企業(yè)效率提升的AI方向之一,顯著提升了信息提取和錄入的效率,實(shí)現(xiàn)了信息處理的“電子化”、“自動(dòng)化”,為上層業(yè)務(wù)應(yīng)用提供有力支撐。
據(jù)現(xiàn)場(chǎng)介紹,百度OCR技術(shù)經(jīng)過多年沉淀和實(shí)踐打磨,在多項(xiàng)行業(yè)競(jìng)賽評(píng)比當(dāng)中持續(xù)摘得桂冠。例如:2019年從90多支參賽隊(duì)伍中脫穎而出,獲得中國最高等級(jí)商業(yè)領(lǐng)域人工智能技術(shù)競(jìng)賽唯一A級(jí)別證書;在OCR領(lǐng)域最具影響力的ICDAR 19 MLT (多語種task)榜單當(dāng)中獲得文字檢測(cè)領(lǐng)域世界冠軍;。同時(shí),百度OCR也在不斷推進(jìn)算法創(chuàng)新和突破,引領(lǐng)行業(yè)技術(shù)發(fā)展,例如:發(fā)布了業(yè)界最大的中文OCR數(shù)據(jù)集,首次提出端到端OCR-部分監(jiān)督算法End2End-PSL,實(shí)現(xiàn)精標(biāo)數(shù)據(jù)+弱標(biāo)數(shù)據(jù)的混合訓(xùn)練,克服精標(biāo)數(shù)據(jù)成本高問題,使得標(biāo)注成本降低至1/90。
依托百度大腦領(lǐng)先的深度學(xué)習(xí)技術(shù),百度OCR已開放全系列50多款產(chǎn)品,不僅可以實(shí)現(xiàn)通用場(chǎng)景的文字識(shí)別,還可滿足各類垂直場(chǎng)景的信息電子化、結(jié)構(gòu)化識(shí)別需求,例如財(cái)務(wù)票據(jù)識(shí)別、醫(yī)療票據(jù)識(shí)別、教育場(chǎng)景的公式識(shí)別和試卷識(shí)別等等。
打破封閉研發(fā)生態(tài),積極賦能企業(yè)在具體場(chǎng)景落地
作為保險(xiǎn)醫(yī)療領(lǐng)域的代表,泰康保險(xiǎn)集團(tuán)科技研究院、圖文分析實(shí)驗(yàn)室負(fù)責(zé)人劉興旺在會(huì)上表示:“如何提高理賠效率,降低成本成為各大保險(xiǎn)公司非常關(guān)注的一點(diǎn)?;诎俣萇CR識(shí)別提取各類醫(yī)療票據(jù)/單據(jù)字段信息的技術(shù)能力,我們共同首創(chuàng)的端到端關(guān)系識(shí)別模型,整個(gè)質(zhì)檢分類準(zhǔn)確率可達(dá)到97%,實(shí)際復(fù)雜生產(chǎn)環(huán)境中的結(jié)構(gòu)化識(shí)別準(zhǔn)確率可達(dá)86%,大大節(jié)約了人力成本,同時(shí)顯著提升了理賠業(yè)務(wù)效率?!?/p>
北京融匯金信信息技術(shù)有限公司創(chuàng)始人羅彤從金融服務(wù)的角度發(fā)表了自己的看法,他講到:“金融主要做的兩件事其實(shí)就是,需要大量數(shù)據(jù)進(jìn)行預(yù)測(cè),以及大量文檔、圖片等信息進(jìn)行客戶服務(wù)。而百度OCR提供的解決方案,可以讓我們把數(shù)據(jù)和知識(shí)打通,解決人工錄入信息出錯(cuò)率高、效率低等行業(yè)痛點(diǎn)的同時(shí),能夠顯著節(jié)約成本、得到更加精準(zhǔn)的預(yù)測(cè)結(jié)果,同時(shí)提升整體業(yè)務(wù)效率?!睋?jù)悉,在金融服務(wù)領(lǐng)域,百度OCR已在銀行、保險(xiǎn)、證券、信貸、支付等場(chǎng)景應(yīng)用落地。
除此之外,百度OCR還已廣泛應(yīng)用于財(cái)稅報(bào)銷、快遞物流、法律政務(wù)、交通出行、教育培訓(xùn)、內(nèi)容審核等眾多領(lǐng)域,為企業(yè)降本增效,提升用戶體驗(yàn)。例如:代賬公司借助百度OCR,為中小企業(yè)提供智能報(bào)賬服務(wù),大幅提升業(yè)務(wù)流程效率;中國移動(dòng)設(shè)計(jì)院使用百度OCR對(duì)內(nèi)部報(bào)賬系統(tǒng)進(jìn)行智能化改造,20分鐘的人工填報(bào)流程縮短至1分多鐘;在快遞物流領(lǐng)域,則可以綜合應(yīng)用OCR、NLP地址識(shí)別、語音識(shí)別等多項(xiàng)AI能力,提升分揀、配送效率及用戶使用體驗(yàn)。
目前,使用百度OCR的用戶已超過70萬。未來,百度OCR作為百度智能云服務(wù)的重要一環(huán),在百度大腦領(lǐng)先技術(shù)的支持下,將持續(xù)快速迭代,不斷優(yōu)化產(chǎn)品服務(wù),探索更多應(yīng)用場(chǎng)景,同時(shí)賦能更多合作伙伴,助力企業(yè)開啟智能化升級(jí)快速通道,創(chuàng)造更大價(jià)值。