過(guò)去二十年來(lái),亞馬遜不斷研發(fā)新的技術(shù),用于優(yōu)化用戶在亞馬遜(amzon.com)上網(wǎng)購(gòu)的用戶體驗(yàn)。
早在2003年的時(shí)候,物流方面,亞馬遜的貨物倉(cāng)庫(kù)里用自動(dòng)機(jī)器人系統(tǒng)揀貨,為的是讓用戶更早拿到買的東西。
在產(chǎn)品推薦方面,亞馬遜的購(gòu)物推薦早就成了大數(shù)據(jù)應(yīng)用的典型場(chǎng)景,根據(jù)用戶自己的購(gòu)買經(jīng)歷或者購(gòu)買過(guò)同一個(gè)產(chǎn)品的別的用戶的購(gòu)買經(jīng)歷進(jìn)行推薦展示。
這樣需要一個(gè)龐大的電子表格,AWS開(kāi)發(fā)出了一個(gè)強(qiáng)大的算法來(lái)預(yù)測(cè)出購(gòu)買某個(gè)產(chǎn)品的概率,類似的Netflix也用了這樣的算法,據(jù)說(shuō),Netflix上75%的視頻流量都是推進(jìn)引擎導(dǎo)流過(guò)來(lái)的。
近幾年來(lái),亞馬遜嘗試用無(wú)人機(jī)來(lái)送貨,目前正處于試驗(yàn)階段。實(shí)際上,所有的送貨無(wú)人機(jī)都是由一系列的算法來(lái)控制的,比如有基于GPS來(lái)規(guī)劃路徑的算法,計(jì)算機(jī)視覺(jué)算法,目前僅適用于五斤以下,三十分鐘行程以內(nèi)的包裹。
智能音箱Echo,伊恩坦言智能音箱是個(gè)比較低級(jí)的智能,喚醒音箱之后,將用戶的語(yǔ)音輸入轉(zhuǎn)化成文本輸送到云端,調(diào)用自然語(yǔ)言理解服務(wù)了解人說(shuō)話的真正意圖。
以上是幾種亞馬遜AWS的幾種人工智能和機(jī)器學(xué)習(xí)的應(yīng)用實(shí)例,作為一家云服務(wù)商,如何將人工智能和機(jī)器學(xué)習(xí)的能力做輸出呢?
AWS將用這些資源的人分成了三類,對(duì)應(yīng)有不同的服務(wù)。
一層是框架和基礎(chǔ)設(shè)施層,需要的是底層的工具和資源,適用于機(jī)器學(xué)習(xí)專家、軟件開(kāi)發(fā)人員以及數(shù)據(jù)科學(xué)家。AWS提供了GPU/FPU(浮點(diǎn)運(yùn)算器)這類高性能的并行計(jì)算硬件環(huán)境,比如有AWS EC2 P3這樣專門用來(lái)做機(jī)器學(xué)習(xí)的機(jī)型。在軟件環(huán)境方面,有打包了框架和各種驅(qū)動(dòng)的AMI鏡像,用起來(lái)很方便。
二層是平臺(tái)服務(wù),它主要是做深度學(xué)習(xí)工作流的管理,幫助一般的軟件開(kāi)發(fā)人員,把他們?cè)谲浖_(kāi)發(fā)方面的知識(shí)應(yīng)用到機(jī)器學(xué)習(xí)的當(dāng)中。它提供數(shù)據(jù)清洗所用的工具,提供模型訓(xùn)練的工具最后輸出模型,過(guò)程中,機(jī)器學(xué)習(xí)需要反復(fù)調(diào)參迭代,AWS提供了迭代自動(dòng)化工具。
AWS發(fā)布的AI和人工智能的方案SageMaker就是做AI機(jī)器學(xué)習(xí)流程管理的,涉及從數(shù)據(jù)處理,算法設(shè)置,到模型訓(xùn)練,乃至迭代調(diào)優(yōu)的全過(guò)程,可以對(duì)接AWS的云服務(wù),比如可以存放訓(xùn)練數(shù)據(jù)的s3,SageMaker里面集成了Jupyter Notebook,主要的代碼都可以在這里完成,調(diào)整batch_size,epoch,學(xué)習(xí)率這些參數(shù)的操作可以交給SageMaker來(lái)完成,省時(shí)省力高效。
Jupyter Notebook
第三層是一些應(yīng)用服務(wù),指的是已經(jīng)做了預(yù)抽取或者訓(xùn)練好的機(jī)器學(xué)習(xí)模型或者服務(wù),供開(kāi)發(fā)人員直接調(diào)用。用戶可以調(diào)用SageMaker SDK的API來(lái)開(kāi)發(fā)應(yīng)用,使用剛剛訓(xùn)練成的模型,機(jī)器學(xué)習(xí)模型快速為得以應(yīng)用。
機(jī)器學(xué)習(xí)常見(jiàn)的幾大場(chǎng)景中有關(guān)于圖像的,有關(guān)于音頻的,關(guān)于自然語(yǔ)言理解的,AWS在這些方面也有自己的服務(wù),Amazon Comprehend是做NLP(自然語(yǔ)言處理的),Amazon Rekognition Video是做視頻識(shí)別的。
為了方便開(kāi)發(fā)者在本地捕捉數(shù)據(jù)和運(yùn)行機(jī)器學(xué)習(xí)模型,AWS發(fā)布了一個(gè)叫DeepLens的攝像頭,可以連到AWS上對(duì)接別的服務(wù),比如SageMaker。
以上就是AWS在AI和機(jī)器學(xué)習(xí)方面的實(shí)踐和對(duì)外提供的服務(wù),AWS提供的AI服務(wù)有兩方面的優(yōu)勢(shì),一個(gè)是在于AWS開(kāi)放平臺(tái)上的海量數(shù)據(jù),另外,就是AWS有一系列的服務(wù)可以對(duì)人工智能的服務(wù)提供支持和集成。
一家云計(jì)算服務(wù)商能提供什么樣的服務(wù)呢?云說(shuō)到底是資源,是服務(wù),AI本身需要做的事情現(xiàn)在也很明確,需要數(shù)據(jù),需要清洗處理過(guò)的數(shù)據(jù),需要云計(jì)算的數(shù)據(jù)存儲(chǔ)和處理服務(wù),訓(xùn)練所需的算法在過(guò)去幾十年中一直在實(shí)踐中發(fā)展著,不需要云服務(wù)商做什么,云服務(wù)商還能做的就是讓繁瑣的調(diào)參迭代的過(guò)程更高效一些,讓訓(xùn)練出的模型快速得到應(yīng)用。從這個(gè)角度來(lái)看,AWS的服務(wù)是全覆蓋。
AI還在發(fā)展當(dāng)中,AI在未來(lái)的發(fā)展主線肯定是隨著數(shù)據(jù)的不斷積累,AI場(chǎng)景的不斷發(fā)掘而不斷走向成熟的,過(guò)程中AWS這樣的云服務(wù)商必不可少。