目前國外的AI框架有很多,其中包括TensorFlow、PyTorch、Keras、Theano、MXNet等深度學(xué)習(xí)框架;Scikit-learn、LightGBM等機(jī)器學(xué)習(xí)框架;OpenCV、Scikit-Image等計(jì)算機(jī)視覺框架以及NLTK、AllenNLP等自然語言處理框架。國內(nèi)則有昇思 MindSpore、飛槳(PaddlePaddle)、OneFlow、曠視天元(MegEngine)和計(jì)圖(Jittor)等。

這里的AI框架非常重要。它使得用戶、開發(fā)者無需從頭編寫復(fù)雜的底層代碼,而是借助AI框架集成的算法、數(shù)據(jù)結(jié)構(gòu)和工具,提高開發(fā)的效率,例如動態(tài)計(jì)算圖的功能特性方便研究人員隨時調(diào)整模型結(jié)構(gòu)和參數(shù);內(nèi)置的隨機(jī)梯度下降、Adagrad、Adadelta 等工具,能夠自動調(diào)整模型參數(shù),加快模型訓(xùn)練速度,提高模型的準(zhǔn)確性和泛化能力。

試想對于用戶而言,目前會有幾十種訓(xùn)練好的模型,以及算法可供選擇,同時需要考星到硬件資源并行程度,以及跨平臺部署等技術(shù)問題,沒有一個好的AI框架來承擔(dān)這些基礎(chǔ)工作,任何美好的想法和愿望也是很難滿足和實(shí)現(xiàn)的。

AI框架媲美超越 CUDA

在AI大模型時代,我們見證了英偉達(dá)的成功,也驚嘆于GPU提供的強(qiáng)大算力,但很多時候,我們忽略了CUDA對于英偉達(dá)GPU成功的重要性。

CUDA 是的一種并行計(jì)算平臺和編程模型,主要用于GPU高效并行計(jì)算,提供了直接操作GPU硬件的接口和工具,使得開發(fā)人員能夠利用 GPU 的強(qiáng)大計(jì)算能力來加速各種計(jì)算任務(wù),尤其是深度學(xué)習(xí)模型的訓(xùn)練和推理過程 。但CUDA 并不算一種 AI 框架,AI 框架通常提供了豐富的神經(jīng)網(wǎng)絡(luò)層、模型構(gòu)建模塊以及訓(xùn)練算法等,方便用戶直接構(gòu)建和訓(xùn)練各種深度學(xué)習(xí)模型。而 CUDA 主要是提供了一種并行計(jì)算的編程接口和工具,用于在 NVIDIA 的 GPU 上進(jìn)行高效的計(jì)算,本身并不具備直接構(gòu)建和訓(xùn)練深度學(xué)習(xí)模型的功能。

AI 框架往往集成了大量的高級算法和工具,如自動微分、優(yōu)化器、數(shù)據(jù)增強(qiáng)等,以方便用戶進(jìn)行模型的開發(fā)和優(yōu)化。CUDA 則主要關(guān)注于 GPU 的并行計(jì)算,對于這些高級算法和工具的支持相對較少。為了彌補(bǔ)CUDA在這方面的不足,英偉達(dá)的策略是加強(qiáng)與主流的深度學(xué)習(xí)框架,如 PyTorch、TensorFlow 等的合作,開發(fā)了一系列與 CUDA 緊密集成的工具和插件,方便用戶調(diào)用。與此同時,針對卷積、池化、歸一化等常用神經(jīng)網(wǎng)絡(luò)操作以及加速數(shù)據(jù)加載和預(yù)處理的過程,英偉達(dá)提供了cuDNN(CUDA Deep Neural Network library)、 DALI(Data Loading Library)等加速庫的支持,提供了英偉達(dá)的 TAO(Transfer Learning Toolkit)開發(fā)和部署工具包,集成了大量開源的示例代碼和預(yù)訓(xùn)練模型庫,英偉達(dá)積極建立和維護(hù) CUDA 開發(fā)者社區(qū),通過舉辦技術(shù)研討會、線上論壇、線下活動等方式,促進(jìn)開發(fā)者之間的交流和合作。

CUDA的成功也預(yù)示著AI框架光明的未來。以昇思MindSpore為例,自2020年開源以來,目前已孵化、支持國內(nèi)外50多個主流大模型;覆蓋全球130多個國家和地區(qū)的2400多個城市;3.7萬多名開發(fā)者參與社區(qū)貢獻(xiàn);聯(lián)合1700多位生態(tài)伙伴,打造超過2000+解決方案,據(jù)預(yù)測中國AI框架2024年新增市場昇思份額將達(dá)30%。

可以說,以昇思MindSpore為代表的AI框架將是大模型時代,行業(yè)用戶擁抱AI,讓AI落地的最強(qiáng)有力的武器,除此之外,沒有太多的捷徑可走。

小結(jié)

所謂授人魚,不如授人以漁。大模型時代,行業(yè)用戶的漁就是AI框架,自己動手,豐衣足食。這里的重點(diǎn)是自己動手DIY,不要等待Total Solution,不要等待“交鑰匙”工程,如此,才能夠跟上AI大模型時代發(fā)展的步伐。

分享到

songjy

相關(guān)推薦