傅徐軍:非常感謝。大家眼里,百度是一個(gè)非常傳統(tǒng)的2C公司,是做搜索引擎的公司,正因?yàn)榍皟赡暌恢敝铝τ诎阉阉饕孀龅酶?,所以在云?jì)算和大數(shù)據(jù)兩個(gè)方面積累了非常堅(jiān)實(shí)的基礎(chǔ),這兩年又在人工智能有非常重大的投入,所以我們?cè)趦?nèi)部叫ABC,怎么樣讓百度在這一方向轉(zhuǎn)型,怎么去更好的服務(wù)我們的行業(yè)客戶。今天也是借峰會(huì)的機(jī)會(huì)就這些方面的探索規(guī)劃做一些探討和互動(dòng)。
百度的前任首席科學(xué)家是吳文達(dá),他說(shuō)如果人工智能是一個(gè)火箭,大數(shù)據(jù)就是燃料,發(fā)動(dòng)機(jī)和云計(jì)算就是引擎,以前的云是1.0,現(xiàn)在是2.0,1.0的特征就是以資源分享為驅(qū)動(dòng),以業(yè)務(wù)升級(jí)為特征,2.0我們希望能為企業(yè)帶來(lái)更多的業(yè)務(wù)價(jià)值。當(dāng)ABC和產(chǎn)業(yè)結(jié)合的時(shí)候,我們覺得會(huì)發(fā)生兩種方式的變化。
第一種是漸進(jìn)式的,我的產(chǎn)業(yè)和互聯(lián)網(wǎng)之間怎么融合,互聯(lián)網(wǎng)的技術(shù)可以快速的進(jìn)入產(chǎn)業(yè),產(chǎn)業(yè)對(duì)行業(yè)的洞察可以給互聯(lián)網(wǎng)企業(yè)更多的視野,雙方會(huì)產(chǎn)生一定的化學(xué)反應(yīng),會(huì)創(chuàng)造新的商業(yè)模式。
第二種方式,革命性的創(chuàng)新,我們看到的一些對(duì)話式的人工智能產(chǎn)品,無(wú)人車、無(wú)人商城等等。
這兩種變化又會(huì)進(jìn)一步的對(duì)IT的能力,對(duì)計(jì)算和數(shù)據(jù)的能力,提出非常大的挑戰(zhàn)。當(dāng)這個(gè)能力發(fā)生一些質(zhì)的變化,又會(huì)循環(huán)的回去促進(jìn)我前面的兩個(gè)變化快速發(fā)生,直到越走越快。
百度在ABC方面的布局,無(wú)論是業(yè)務(wù)架構(gòu)還是組織架構(gòu)上,基本分為三大塊,一塊是度秘,第二塊是無(wú)人車,第三塊是百度云。
度秘在美國(guó)前兩年走得更快,我們知道蘋果的siri和亞馬遜的amzon,在國(guó)內(nèi)微軟小冰也火過(guò),科大訊飛的靈犀,度秘是李彥宏起的,說(shuō)每個(gè)人都希望有一個(gè)秘書,出門的時(shí)候訂飛機(jī)票,后來(lái)畢竟百度是一家互聯(lián)網(wǎng)公司,他們覺得這個(gè)取名太嚴(yán)肅了,所以我們從今年開始,整個(gè)度秘喚醒詞是小度。
怎么做好對(duì)話是人工智能助力的,百度有三個(gè)條件,聽得清,聽得懂,能滿足。
聽得清是語(yǔ)音識(shí)別能力,聽得懂是百度以前自然語(yǔ)言處理的能力,知識(shí)圖譜能力和搜索的推薦能力,聽得懂就是能滿足我真正要滿足用戶的需求,滿足終端客戶和終端用戶生活中工作中的小小要求。
我有一個(gè)小的demo,演示是讓人工智能的技術(shù)更好的理解上下文的語(yǔ)境、知道老百姓的大白話的表述。我們看到它可以簡(jiǎn)單的記錄上下文的語(yǔ)境,可以進(jìn)入十五輪對(duì)話左右,但是超過(guò)了就會(huì)丟失掉,下面的例子是一段視頻,度秘和智能家具合作的視頻,這個(gè)產(chǎn)品怎么在家居環(huán)境得到更好應(yīng)用,無(wú)論是冰箱孩子電視機(jī),都可以作為智能對(duì)話的設(shè)備,未來(lái)不會(huì)再像以前的冷冰冰,而是做非常多的智能交互。
我們希望把智能對(duì)、話語(yǔ)音技術(shù)應(yīng)用到家庭的方方面面,因?yàn)榘俣缺旧硎且粋€(gè)最大的搜索引擎知識(shí)庫(kù),所以去問這是什么地方的時(shí)候,這個(gè)圖片被截屏,和內(nèi)部的百度百科或者百度知道幾百萬(wàn)張酒店的圖片對(duì)比,得到正確的結(jié)果的時(shí)候,結(jié)果就會(huì)反饋到電視機(jī)上。還有你忘記這個(gè)明星是誰(shuí),他會(huì)告訴你是誰(shuí),這個(gè)是準(zhǔn)確率最高的。
百度的能力也非常有限,把生態(tài)做好,讓百度只要關(guān)心的關(guān)注語(yǔ)音識(shí)別和自然語(yǔ)言處理能力就可以了,所以我們做了一套系統(tǒng)多S的開放平臺(tái)。這個(gè)平臺(tái)也是在百度云之上,讓我們第三方合作伙伴可以非常把能力放在平臺(tái)上。
無(wú)人駕駛是非?;鸬姆较?,百度在2014年就建立了無(wú)人駕駛事業(yè)部,2015年無(wú)人駕駛開上五環(huán),當(dāng)時(shí)的時(shí)速80公里每小時(shí)以上,天氣晴朗沒有紅綠燈和行人,相對(duì)來(lái)講是要求不那么高的環(huán)境,但是技術(shù)發(fā)展非常快,2016年10月烏鎮(zhèn)互聯(lián)網(wǎng)大會(huì)無(wú)人車開進(jìn)了大會(huì)現(xiàn)場(chǎng),當(dāng)時(shí)我們提供了18款車,品牌覆蓋比亞迪、QQ、奇瑞三種車型,所以這段路叫子葉路,是完全開放的道路,有行人和機(jī)動(dòng)車紅綠燈等等。我想說(shuō)百度無(wú)人車經(jīng)住了考驗(yàn),300多次試駕沒有一次發(fā)生問題,工程師也會(huì)發(fā)現(xiàn)一些問題,太陽(yáng)太大的時(shí)候樹蔭會(huì)把白線遮住。
到了2017年,百度的內(nèi)部想法發(fā)生變化,他覺得靠百度一家想推動(dòng)中國(guó)無(wú)人車發(fā)展非常難,怎么樣能夠調(diào)動(dòng)所有人的積極性,調(diào)動(dòng)合作伙伴的積極性和車廠積極性,更好更快的把無(wú)人車做得更好,百度推出阿波羅計(jì)劃,把無(wú)人車的代碼全部開源出,以后專注做無(wú)人車,幫助合作伙伴盡快的把實(shí)驗(yàn)室環(huán)境的無(wú)人車放到生產(chǎn)環(huán)節(jié)。
(播放視頻)
阿波羅計(jì)劃推廣的非??欤衲昴甑装l(fā)布2.0版本,不同的阿波羅計(jì)劃更先進(jìn)的版本使得我們的客戶調(diào)試代碼程度會(huì)大大的降低,調(diào)試的過(guò)程會(huì)很復(fù)雜,但是我們可以看到,隨著阿波羅計(jì)劃的推廣,使中國(guó)無(wú)人車的步伐大大的推動(dòng)。
無(wú)人車也會(huì)開放平臺(tái),這是一個(gè)軟硬件一體化的仿生平臺(tái),一天可以平臺(tái)上跑幾百萬(wàn)公里,這是由百度云內(nèi)部支持的。
講一下百度云,前面無(wú)人車和小度,都是非常專業(yè)的領(lǐng)域,小度對(duì)應(yīng)車聯(lián)網(wǎng)和智能家居,百度云是百度人工智能能力,拆成更小的力度,重新組合,針對(duì)不同的行業(yè)做各種優(yōu)化定制化的過(guò)程。
先給大家介紹一下智能媒體,它的底層能力是計(jì)算機(jī)視覺,我們今年1月份參加了江蘇衛(wèi)視最強(qiáng)大腦節(jié)目,這次是人類和小度PK,現(xiàn)場(chǎng)就有很多嘉賓和嘉賓小時(shí)候的照片,人跟計(jì)算機(jī)比拼現(xiàn)在的嘉賓和小時(shí)候的照片誰(shuí)匹配得更準(zhǔn),百度以前沒有這個(gè)技術(shù)的,因?yàn)楝F(xiàn)在的人臉場(chǎng)景不管是一比一還是一比二,都是同年齡層的匹配,百度在內(nèi)部發(fā)布了兩萬(wàn)名員工提交了自己的畢業(yè)照和成年照片,進(jìn)行了大概一個(gè)月的訓(xùn)練,做了一個(gè)模型,所以比較微弱的優(yōu)勢(shì)戰(zhàn)勝了人類的最強(qiáng)選手,當(dāng)然百度做這個(gè)最早不是為了上綜藝節(jié)目,而是綜藝找到了我們,最早我們是和寶貝回家公益組織合作,我們希望天下無(wú)拐,我們跟兩萬(wàn)七千個(gè)照片庫(kù)進(jìn)行了對(duì)比,找到了幾十名走失的孩子,其中年齡差距最大的兩個(gè),一個(gè)是20年,一個(gè)是17年,20年的那位是6歲的時(shí)候從重慶走失,我們?cè)谌莅l(fā)現(xiàn),警方進(jìn)行DNA對(duì)比是一個(gè)人,也送他回了重慶,我覺得如果可以用技術(shù)做這樣的事情也是非常有意義的。
計(jì)算機(jī)視覺怎么和產(chǎn)業(yè)結(jié)合?我想舉一些例子,我們提供ABC一個(gè)完整的能力,最底層是視頻點(diǎn)播直播加速,中間是搜索系統(tǒng)推薦包括廣告營(yíng)銷框架,最上層是內(nèi)部叫VCA、VCR,本質(zhì)就是對(duì)視頻進(jìn)行圖片、語(yǔ)音的人臉場(chǎng)景識(shí)別,不需要靠人去看,而動(dòng)態(tài)的識(shí)別圖片的內(nèi)容,這段視頻的內(nèi)容是什么東西。其中一個(gè)例子是我們跟CCTV共建創(chuàng)新實(shí)驗(yàn)室,可以看到它的demo。
我們看到,通過(guò)語(yǔ)音識(shí)別,可以把食品里面的語(yǔ)音文字和人臉動(dòng)態(tài)的抓出來(lái)。同步可以生成很多的標(biāo)簽,使原來(lái)計(jì)算機(jī)無(wú)法檢索的非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)變成結(jié)構(gòu)化數(shù)據(jù),大大提升搜索精度。對(duì)于廣電系統(tǒng)等,會(huì)大量的省去了人工編務(wù)的時(shí)間,以前需要人看幾個(gè)小時(shí)的視頻,非常累,現(xiàn)在通過(guò)計(jì)算機(jī)的方式可以大大的提升效率,準(zhǔn)確率80%左右,還是有很大提升空間,我相信人工智能和產(chǎn)業(yè)化學(xué)反應(yīng)會(huì)極大的推動(dòng)技術(shù)的進(jìn)步。
這個(gè)是我們跟蘇州市公安局一起合作的安防場(chǎng)景,第一天上線就抓到一個(gè)在逃三年時(shí)間的逃犯,他當(dāng)天戴著帽子和墨鏡,警察和百度的員工面對(duì)面看的時(shí)候也發(fā)現(xiàn)不是一個(gè)人,三四年的時(shí)間照片也不是最新的,可能匹配不上了,但是計(jì)算機(jī)有它獨(dú)特的視角做一個(gè)比人類更聰明的對(duì)比,因?yàn)楝F(xiàn)在我們發(fā)現(xiàn)某些情況人比計(jì)算機(jī)更好一些,但是有些情況計(jì)算機(jī)比人聰明。
鄭州的美蘭機(jī)場(chǎng),每次登機(jī)之前要刷條形碼,導(dǎo)致排隊(duì)很長(zhǎng),裝了人臉閘機(jī)以后就不需要了,這塊也是計(jì)算機(jī)視覺的應(yīng)用;這是我們跟首都鋼鐵公司自動(dòng)化技術(shù)公司合作的,它解決了工業(yè)缺陷審核的場(chǎng)景,很多的鋼材會(huì)有很小比例的誤品率,紅色鐵皮,孔洞,褶皺,怎么把這些這么小比例的鋼材找到?傳統(tǒng)的方式是用高速攝像機(jī)半毫秒拍一下,現(xiàn)在的解決方式是用國(guó)外的軟件,幾千萬(wàn)一套,百度和首鋼有一些合作,我們花一個(gè)月時(shí)間對(duì)25萬(wàn)張照片進(jìn)行標(biāo)注,標(biāo)注用了一周時(shí)間,之后用深度學(xué)習(xí)進(jìn)行訓(xùn)練。檢測(cè)速度很快,經(jīng)過(guò)實(shí)測(cè)試,準(zhǔn)確率是99.98%。
上面展示的只是我們跟各行各業(yè)合作的案例,百度本質(zhì)上是一個(gè)技術(shù)公司,很多時(shí)候是從技術(shù)去看行業(yè)的,比較傳統(tǒng),雖然它現(xiàn)在在不斷的改變自己的想法,應(yīng)該是看行業(yè)需要什么,怎么完善我的技術(shù),這是百度整個(gè)行業(yè)不斷的思考不斷規(guī)劃的一些東西,我今天也是拋磚引玉,希望跟在座各位有更多的合作機(jī)會(huì)。
由于金融的客戶相對(duì)對(duì)合作的保密性要求比較高,所以我不會(huì)給任何的案例,但是看得出來(lái),我們跟金融的合作非常多,因?yàn)榻鹑诳瓷先ナ亲罘€(wěn)健要求最高的,同時(shí)它也永遠(yuǎn)站在創(chuàng)新的最前沿,我們可以看到大概在九個(gè)方面可以有三四十個(gè)產(chǎn)品跟金融行業(yè)有非常多的合作,無(wú)論是知識(shí)圖譜還是企業(yè)輿情,可以幫助他們更好的去做貸中后前的管理,比如店鋪選擇和智慧選址,比如我現(xiàn)在有一個(gè)網(wǎng)點(diǎn),人流其實(shí)是不夠清晰的,我不知道他們從什么地方來(lái),也不知道他們?nèi)ミ^(guò)什么地方,可以基于百度地圖和百度搜索的數(shù)據(jù)給這個(gè)網(wǎng)點(diǎn)非常清晰的人流和熱力圖,當(dāng)然,我們不會(huì)給基于個(gè)人的信息。
再舉例子,比如信用卡的領(lǐng)域,大家知道信用卡盜卡和套卡養(yǎng)卡的問題比較嚴(yán)重,比方說(shuō)營(yíng)銷機(jī)構(gòu)買了身份證,去注冊(cè)我的信用卡信息,所有填寫的信息都是真實(shí)的,但是拿了卡以后不做正常的消費(fèi),過(guò)段時(shí)間銀行覺得我信用有錯(cuò),這個(gè)時(shí)候我錢套出來(lái)可能就消失掉了,公安部不會(huì)為幾萬(wàn)塊錢立案,但是錢非常多也是非??植赖臄?shù)字,我們是不是可以跳出來(lái)想想我們基于交易習(xí)慣或者信息也好,做一個(gè)機(jī)器學(xué)習(xí),讓機(jī)器訓(xùn)練去替代人的主觀上的專家系統(tǒng)和人的邏輯設(shè)計(jì),我們做了這樣的事情,效果非常好,準(zhǔn)確率可以達(dá)到90%以上,我們記憶不的把這個(gè)模型做得更好。
這個(gè)是百度云的全家福,百度云有將近兩百個(gè)產(chǎn)品,有成熟的也有不太成熟的,這邊是相對(duì)成熟的一部分,我們會(huì)分為幾塊,產(chǎn)品的解決方案和行業(yè)的解決方案,也歡迎各位在任何時(shí)間找我做任何交流,謝謝大家。