一直以來,專業(yè)的拼寫檢查器(spell checker)都沒有達(dá)到人們的應(yīng)用要求,其原因有很多。比如說,人類的語言是極其復(fù)雜而且內(nèi)容繁多的,有非常多的規(guī)則需要設(shè)計,同一句話可表達(dá)不同意思,不同的話可表達(dá)相同意思,流行語更新很快,等等。比較起來,目前最先進(jìn)的拼寫檢查工具不是任何一個專業(yè)的工具,而是搜索引擎! 很多用戶大概都有過這種經(jīng)歷,就是對于一個句子,一個單詞,一句古詩不確定的時候,拿Google或者百度搜一下。有意思的是,不管Google還是百度都不是作為拼寫檢查器被設(shè)計出來的,而且他們也沒有專門的“拼寫檢查”功能。之所以這個歪打正著的功能居然這么好用,是因為它收集而且組織了極其大量的信息。搜索引擎能看到所有人們提出的問題,所以如果你在拼寫中或者用詞中犯了一個錯誤,它能通過比對海量數(shù)據(jù)來預(yù)測出你的這個錯誤 – 而結(jié)果就是搜索引擎事實上成為了目前為止最先進(jìn)的拼寫檢查器。

相同的方法和原理在人工智能、預(yù)測分析學(xué)的很多其他方面都有著應(yīng)用,比如人臉識別技術(shù),等等。這些應(yīng)用的基礎(chǔ)只有一個 – 那就是極其大量的數(shù)據(jù)。從這個角度上說,云存儲和云計算帶來的大量數(shù)據(jù)也許會對類似的應(yīng)用帶來無限的機(jī)會,怪不得Peter Thiel前段時間又一反傳統(tǒng)觀點的預(yù)測人工智能的黃金時代剛剛開始。把Google當(dāng)拼寫檢查器用 –這個有趣的現(xiàn)象值得我們好好去觀察和思考,也許海量數(shù)據(jù)真的會帶來人工智能的新時代。

分享到

zhangwenxi

相關(guān)推薦