在全世界的關(guān)注之下,人工智能的發(fā)展速度似乎也在加速,機(jī)器學(xué)習(xí)模型越來越大,能做的事情也越來越多,最近刷屏的AI繪畫Dall·E2讓人激動(dòng)不已,又一次提高了人們對(duì)AI的期望。
然而,中國人工智能人才相對(duì)還是要少很多,據(jù)領(lǐng)英發(fā)布的《全球AI領(lǐng)域人才報(bào)告》顯示,截止到2017年一季度,全球人工智能人才超190萬,其中,美國有85萬,而中國只有5萬。
這一數(shù)據(jù)可能有點(diǎn)老,但大致顯示了中國人工智能領(lǐng)域人才偏少的事實(shí)。過去幾年,在各種政策和措施引導(dǎo)下局面會(huì)有所改善,相信實(shí)際進(jìn)入機(jī)器學(xué)習(xí)領(lǐng)域的人數(shù)會(huì)有非常大幅的增長。
而我,作為機(jī)器學(xué)習(xí)領(lǐng)域略知一二的觀察者,給希望進(jìn)入或已經(jīng)在人工智能領(lǐng)域的朋友一點(diǎn)建議:
工欲善其事、必先利其器,建議關(guān)注和了解云上的機(jī)器學(xué)習(xí)開發(fā)平臺(tái),比如我最熟悉的亞馬遜云科技的Amazon SageMaker。
Gartner在2022年五月份公布了一個(gè)魔力象限報(bào)告,是關(guān)于面向云上AI開發(fā)者的服務(wù)(CAIDS)的,報(bào)告中,亞馬遜云科技(AWS)與微軟、谷歌以及IBM處于領(lǐng)導(dǎo)者的位置。
這份報(bào)告大概是從2020年開始發(fā)布的,同年發(fā)布的還有“數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)平臺(tái)魔力象限圖”,隨后兩年Gartner好像只是更新了CAIDS報(bào)告,“數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)平臺(tái)魔力象限圖”沒有再更新,可以理解為:Gartner更推薦你在云上進(jìn)行AI開發(fā)工作。
為什么說是看好呢?
Gartner對(duì)CAIDS的定義指的是,那些能讓開發(fā)者團(tuán)隊(duì)或者業(yè)務(wù)人員,在無需數(shù)據(jù)科學(xué)專業(yè)知識(shí)就能進(jìn)行AI開發(fā)的服務(wù),可以是云托管的或者容器化服務(wù),通過API或者SDK或者應(yīng)用來使用。
Gartner的調(diào)查顯示,超過75%的IT負(fù)責(zé)人表示,其組織的軟件工程師中只有不到25%接受過機(jī)器學(xué)習(xí)培訓(xùn),而云上AI開發(fā)者服務(wù),是填補(bǔ)這一差距的關(guān)鍵。
到2025年,組織內(nèi)部開發(fā)的新應(yīng)用中,有70%將采用AI技術(shù),而云AI開發(fā)者服務(wù)(CAIDS)為開發(fā)者提供了所需的機(jī)器學(xué)習(xí)開發(fā)能力。
Gartner報(bào)告里這么長一大段都在講云上AI開發(fā)的重要性
所以,我也非常推薦希望進(jìn)入或已經(jīng)在人工智能領(lǐng)域的朋友關(guān)注CAIDS,以我最熟悉的亞馬遜云科技的云AI開發(fā)者服務(wù)(CAIDS)為例來介紹。
在最底層,亞馬遜云科技有自研的機(jī)器學(xué)習(xí)訓(xùn)練芯片Amazon Trainium和機(jī)器學(xué)習(xí)推理芯片Amazon Inferentia,自研芯片的好處是降低成本,專用芯片的好處是提高效率,當(dāng)自研專有芯片放到公有云上之后,能利用云上大規(guī)模擴(kuò)展的優(yōu)勢,以最大的可能提高訓(xùn)練速度。
在中間層,就是全托管的機(jī)器學(xué)習(xí)服務(wù)Amazon SageMaker,它提供了全球首個(gè)面向機(jī)器學(xué)習(xí)的集成開發(fā)環(huán)境SageMaker Studio,消除了機(jī)器學(xué)習(xí)過程中的繁重工作,也降低了機(jī)器學(xué)習(xí)的入門門檻,我曾在沒有任何人指導(dǎo)下完成過一個(gè)機(jī)器學(xué)習(xí)模型的開發(fā)過程。
在頂層,亞馬遜云科技提供了20多種訓(xùn)練好的AI服務(wù),涵蓋計(jì)算機(jī)覺、語音文字轉(zhuǎn)換、機(jī)器對(duì)話、文本處理、個(gè)性化推薦、時(shí)間序列預(yù)測、客服、企業(yè)內(nèi)信息搜索、開發(fā)與運(yùn)維、工業(yè)AI等方面,用戶可以直接調(diào)用。
我個(gè)人感受最深的就是Amazon SageMaker。
Amazon SageMaker的功能除了能提供基本的資源以外,還有各種功能能提供很大便利,我試著用Amazon SageMaker運(yùn)行了幾個(gè)Demo,過程進(jìn)行的很順利,我甚至用Amazon SageMaker Studio的Autopilot自動(dòng)生成了一個(gè)機(jī)器學(xué)習(xí)模型,差不多就是做到了有手就行。
對(duì)于初入門的人來說,Amazon SageMaker能降低門檻,省去一定要自己購買硬件,配置開發(fā)環(huán)境的麻煩,還能幫你很快熟悉開發(fā)的流程。它能幫初學(xué)者快速度過一開始的冷啟動(dòng)時(shí)間,如果對(duì)于機(jī)器學(xué)習(xí)比較熟悉之后,也可以考慮不用Amazon SageMaker,自己DIY一套開發(fā)環(huán)境。
另外一部分,對(duì)于機(jī)器學(xué)習(xí)或者數(shù)據(jù)科學(xué)家,則推薦深入用Amazon SageMaker,它能加快開發(fā)的流程,開發(fā)的速度。與其苦苦加班996,不如找個(gè)順手的工具提高開發(fā)效率。
Amazon SageMaker還有很實(shí)用功能,我知道的比如有,能識(shí)別和調(diào)整數(shù)據(jù)偏見,當(dāng)用于訓(xùn)練的數(shù)據(jù)不夠的時(shí)候,還能用機(jī)器學(xué)習(xí)能力自動(dòng)生成用于訓(xùn)練的數(shù)據(jù),還有一些可視化的工具,還有一些我看不太明白的工具。
既有很多我能想到的,還有很多我想不到的工具??傊?,亞馬遜云科技有一堆比較前沿的工具,還有一套比較流暢的機(jī)器學(xué)習(xí)流程,值得體驗(yàn)和了解。
如果是囊中羞澀的學(xué)生黨,也想用云上的機(jī)器學(xué)習(xí)服務(wù),那也可以先嘗試一下免費(fèi)版的Amazon SageMaker,地址在這里,想先了解的可以看看這篇文章?!?a rel="nofollow" >做畢設(shè)用不起GPU?亞馬遜云SageMaker免費(fèi)給你用》,它跟谷歌家的Colab類似,但國內(nèi)用戶上起來的門檻略高。
目前,全球數(shù)以十萬計(jì)客戶選擇亞馬遜云科技運(yùn)行其機(jī)器學(xué)習(xí)工作負(fù)載,包括網(wǎng)易有道旗下少兒的有道樂讀、上海欣兆陽Convertlab、西門子工業(yè)自動(dòng)化產(chǎn)品成都生產(chǎn)及研發(fā)基地、樂普醫(yī)療等。
此前筆者采訪過的,Joyme、覓??萍肌dTiming、FunPlus、FreeWheel等等都或多或少的在用Amazon Sagemaker,如果感興趣,你不妨也試試吧。