目前業(yè)界在應(yīng)用層AI方面取得了一些進(jìn)展,實(shí)現(xiàn)了”小數(shù)據(jù)、小智能”;當(dāng)前在”智能+”時代,數(shù)據(jù)的復(fù)雜度、模型變量的復(fù)雜度、業(yè)務(wù)協(xié)同的復(fù)雜度和數(shù)據(jù)安全的復(fù)雜度都大幅提升,在海量數(shù)據(jù)的管理過程中需要通過人工智能技術(shù)的加持來結(jié)構(gòu)性解決效率、精準(zhǔn)度和多元適配問題。數(shù)夢工場認(rèn)為大數(shù)據(jù)和人工智能的結(jié)合應(yīng)覆蓋全流程、全體系,貫穿數(shù)據(jù)資產(chǎn)管理和大數(shù)據(jù)應(yīng)用的始終。大數(shù)據(jù)為人工智能的發(fā)展提供基礎(chǔ)資源,而人工智能的加持使數(shù)據(jù)資產(chǎn)管理實(shí)現(xiàn)智能化。
數(shù)夢工場立足于大數(shù)據(jù)領(lǐng)域的技能和經(jīng)驗(yàn),從全局角度創(chuàng)造性地進(jìn)行融合,強(qiáng)調(diào)數(shù)據(jù)資產(chǎn)管理過程的智能屬性,也專注于數(shù)據(jù)資產(chǎn)管理結(jié)果的智能體現(xiàn)。”第一個智能+,就是數(shù)據(jù)資產(chǎn)管理過程中的智能”,崔曉峰解釋道,”數(shù)年積累的大數(shù)據(jù)能力結(jié)合人工智能,讓數(shù)夢工場在數(shù)據(jù)處理效率和準(zhǔn)確性等方面優(yōu)勢盡顯,數(shù)據(jù)資產(chǎn)管理呈現(xiàn)出高效、精準(zhǔn)、多元的特點(diǎn)”。
基于元數(shù)據(jù)在數(shù)據(jù)接入、數(shù)據(jù)探查、數(shù)據(jù)清洗、模型設(shè)計(jì)與加工等階段,通過自然語言語義分析和機(jī)器學(xué)習(xí),構(gòu)建”元數(shù)據(jù)”驅(qū)動的”數(shù)據(jù)項(xiàng)和數(shù)據(jù)標(biāo)準(zhǔn)推薦關(guān)聯(lián)”和”關(guān)聯(lián)后的自動清洗”; 以”元數(shù)據(jù)”為基礎(chǔ),自動建立全鏈路數(shù)據(jù)血緣,進(jìn)行數(shù)據(jù)流轉(zhuǎn)分析、屬性繼承分析和影響分析;以”元數(shù)據(jù)”和”數(shù)據(jù)標(biāo)準(zhǔn)”為基礎(chǔ),構(gòu)建深度學(xué)習(xí)的數(shù)據(jù)標(biāo)準(zhǔn)和模型標(biāo)準(zhǔn),建立起符合預(yù)期的數(shù)據(jù)質(zhì)量體系,提高數(shù)據(jù)治理精準(zhǔn)度; 以主題庫和標(biāo)簽為基礎(chǔ),來承載”專家經(jīng)驗(yàn)”,支撐行業(yè)化數(shù)據(jù)智能; 在普遍耗時的環(huán)節(jié),嵌入 AI 能力,比如智能數(shù)據(jù)增量同步的自動配置、 智能數(shù)據(jù)切片、智能去重、智能清洗等環(huán)節(jié)。通過各個環(huán)節(jié)的提升,實(shí)現(xiàn)數(shù)據(jù)治理過程的高效、精準(zhǔn)和多元。綜合人口庫超過12000個字段的標(biāo)準(zhǔn)化工作從20人月被優(yōu)化至1人月,極大地提高了數(shù)據(jù)標(biāo)準(zhǔn)化的效率。
數(shù)據(jù)經(jīng)過治理成為資產(chǎn)后,通過智能評估生成數(shù)據(jù)質(zhì)量報(bào)告和安全評估報(bào)告,并依靠全鏈路數(shù)據(jù)風(fēng)險感知、數(shù)據(jù)安全堡壘和敏感數(shù)據(jù)智能發(fā)現(xiàn)等技術(shù),進(jìn)行質(zhì)量監(jiān)控、運(yùn)維保障和安全防護(hù)。在保障全生命周期數(shù)據(jù)安全的同時,數(shù)夢工場建立并持續(xù)積累了大量具有行業(yè)屬性的業(yè)務(wù)標(biāo)簽和模型,讓數(shù)據(jù)資產(chǎn)管理變得更加高效和精準(zhǔn)。
“除了過程的智能化,我們還在具體的業(yè)務(wù)效果上呈現(xiàn)出智能化的特點(diǎn):可解釋、可量化和可迭代”。崔曉峰認(rèn)為,這正是第二個”智能+”的含義。
人工智能越來越多地用于輔助人類決策和業(yè)務(wù)創(chuàng)新,用戶需要更直觀的、更透明的數(shù)據(jù)智能。數(shù)夢工場在自然人大數(shù)據(jù)實(shí)踐中,沉淀出大量的模型和標(biāo)簽,生成扶貧專題庫,通過數(shù)據(jù)共享與民政救助應(yīng)用進(jìn)行數(shù)據(jù)聯(lián)通,進(jìn)而主動發(fā)現(xiàn)貧困戶,進(jìn)行精準(zhǔn)扶貧。從標(biāo)簽識別到最終的救助服務(wù),每一步都有跡可循,有理可依,直觀而清晰,可拆解、可溯源、可分析。
數(shù)據(jù)資產(chǎn)管理的結(jié)果需要用數(shù)據(jù)說話,即使是定性的分析,也要有定量的數(shù)據(jù)做支撐,包括數(shù)據(jù)分類分級、各級類目、標(biāo)準(zhǔn)數(shù)據(jù)元和量化標(biāo)簽等。自提升、自優(yōu)化是可迭代智能的典型表現(xiàn),即通過持續(xù)不斷的反饋和修正,來形成可持續(xù)的、愈加精準(zhǔn)高效的數(shù)據(jù)智能。如數(shù)夢工場通過可持續(xù)優(yōu)化的行業(yè)語義關(guān)聯(lián)推薦引擎,結(jié)合豐富的行業(yè)實(shí)踐,使綜合人口庫數(shù)據(jù)關(guān)聯(lián)推薦的準(zhǔn)確率從60%躍升至98%。在公安領(lǐng)域,數(shù)夢工場已沉淀出135組標(biāo)簽,結(jié)合精準(zhǔn)督察算法,在酒駕督察、掃黑除惡、重點(diǎn)人員預(yù)警等實(shí)踐中,均取得了亮眼的成績,如秒級獲取酒駕督察結(jié)果,通過長途客運(yùn)旅客實(shí)名信息管控平臺抓獲77名在逃人員等,獲得了客戶的一致認(rèn)可,也進(jìn)一步豐富了公安大數(shù)據(jù)領(lǐng)域的數(shù)據(jù)積累。
未來,數(shù)夢工場將繼續(xù)在過程智能和結(jié)果智能上深入耕耘,讓數(shù)據(jù)資產(chǎn)管理的過程更智能,讓業(yè)務(wù)場景的表現(xiàn)更智能,從數(shù)據(jù)到價值,每一步都暢通無阻。