圖1. 中國人工智能市場支出預測
與此同時,技術的飛速發(fā)展也帶來了巨大的人才缺口。有統計數據表明,目前我國人工智能人才需求缺口達 500 萬人2,在人才需求結構上,基礎層人才需求尤為迫切。近兩年,國內對于人工智能人才的需求更是呈現出水漲船高的態(tài)勢。數據統計還顯示,2021年人工智能行業(yè)人才需求指數較去年增長103%,其中算法人才缺口達170萬3,這也成為人工智能教育行業(yè)發(fā)展的巨大動力。
圖2:人工智能行業(yè)人才需求指數
在此背景下,強化面向青少年等群體的人工智能教育成為社會的廣泛共識,人工智能教育也逐步被納入到學校的教學規(guī)劃中。2017年,國務院就印發(fā)了《新一代人工智能發(fā)展規(guī)劃》,明確提出“人工智能成為國際競爭新焦點。在中小學階段設置人工智能相關課程,逐步推廣編程教育” 4,2019年,教育部印發(fā)《中小學綜合實踐活動課程指導綱要》,設計了人工智能相關主題活動。此外,多個省市的教育機構發(fā)文要求,各地要依托人工智能教育實驗區(qū)和試點校,完善本地區(qū)中小學人工智能教育工作規(guī)劃,細化工作分工,健全扶持政策,加快推進中小學校人工智能教育普及化。
教育部教育信息化專家組認為,應把人工智能列入必修內容,目標是素養(yǎng)培育,抓手是編程實踐,需要著重從傳授人工智能基礎知識,進行人工智能啟蒙教育;培養(yǎng)學生使用智能工具的能力;學習用編程解決實際問題,培養(yǎng)計算思維、創(chuàng)新思維等基本素養(yǎng)等多方面入手,深化教育體制改革5,6。
要推進人工智能教育,構建人工智能實訓環(huán)境至關重要,人工智能實訓可以幫助學生從簡單、基礎的人工智能模型訓練、推理等流程入手,了解人工智能應用的相關知識。因此,越來越多的學校開始開設人工智能實驗室/實訓室,在人工智能算力基礎設施之上提供人工智能教學課程。
由于人工智能教育的主要目標是培養(yǎng)學生的人工智能技能,鍛煉學生的數據科學思維7。因此,與企業(yè)的人工智能應用相比,部署于 K12 階段的人工智能實驗室/實訓室具備著以下特點:
在K12 教育階段,大部分學生并未接觸過人工智能,因此,學校需要構建“從零開始”的課程培訓體系,并支持全流程的人工智能應用,這包括數據準備、模型訓練、模型部署、模型推理等各個階段。
其中,在數據準備階段,人工智能教育實驗室/實訓室需要支持對于給定的數據集進行處理,將其輸入到模型之中;在建模階段,需要為學生提供適合學習階段的預置模型庫,允許學生通過訓練需求來選擇合適的模型;在部署與推理階段,學生能夠利用訓練好的模型,驗證訓練的模型能否在精度等方面滿足預定的目標。
人工智能教育實驗室/實訓室的基礎是一整套的人工智能應用平臺,核心則是人工智能課程體系。這套課程體系既需要符合信息技術教材等規(guī)范性要求,還需要針對學生的學習特點,提供重點明確、體系完整、功能強大的課程設計,支持學生使用簡單的人工智能工具,進行更富主觀能動性的探索,實現從感性引導到興趣實踐,再到創(chuàng)新應用的流程。
圖3:K 12 階段的人工智能教育目標
一般而言,人工智能課程體系需要包括以下內容:人工智能課程的課程綱要、教材、代碼示例;面向 人工智能基礎知識傳授的交互式課程;支持自主模型訓練/推理的實踐應用平臺;作業(yè)批改以及評價系統;師生互動應用。要支撐這一課程體系,就需要構建就緒型的人工智能教育環(huán)境,在硬件平臺基礎上提供必要的軟件組件。
面向 K12 的人工智能教育實訓室面臨的挑戰(zhàn)
當前,我國人工智能教育發(fā)展迅速但尚處于起步階段,存在人工智能教育人才儲備不足,人工智能教育存在技術瓶頸,人工智能教育產品不完善,人工智能教育大數據平臺缺乏,人工智能教育可能產生倫理風險等問題8,亟需進行持續(xù)的探索與創(chuàng)新。
而從平臺建設來看,算力平臺是人工智能教育實驗室/實訓室構建的基礎,面向 K12 的人工智能教育場景應用有著以下特征,對于人工智能基礎設施的構建帶來了相應的挑戰(zhàn):
人工智能教育實驗室/實訓室需要解決算力的分配問題,將算力集中在云或數據中心的服務器中有利于實現更高的靈活度,但可能在集中應用的時候出現算力不足的問題;將算力部署于終端適用于對本地算力要求更高的應用,但在運維與管理問題可能會遇到較大的挑戰(zhàn)。
英特爾人工智能實訓愿景與架構參考
為助力打造更高效的人工智能教育實訓環(huán)境,英特爾憑借其不斷創(chuàng)新的產品與技術體系,以及在 “云邊協同” 上積累的豐富實戰(zhàn)經驗,與人工智能教育解決方案廠商一起為教育機構打造 “云 – 邊 – 端” 架構的端到端人工智能實訓解決方案,為師生提供高性能、高可用和靈活可擴展的人工智能動手實踐平臺。
圖4:典型的 “云 – 邊 – 端” 人工智能教育實訓環(huán)境
其中,邊緣平臺是人工智能教育實訓環(huán)境的重要基礎平臺,在異構硬件融合的基礎上提供了人工智能開發(fā)環(huán)境,為人工智能推理、開發(fā)套件等應用提供強大算力支持。特別是對于 K12 階段的人工智能教育來說,其無需學校在數據中心或云服務方面進行大量投入,就可以搭建更敏捷、更高穩(wěn)定性、更低成本的人工智能實訓室。
此外,方案還能夠提供基于英特爾?架構的AI智能硬件開發(fā)套件,包含面向計算機視覺、人工智能、邊緣計算、推理運算等各類實訓場景的外接實訓設備。結合不同課程和實訓應用場景,配套不同實訓套件,基于英特爾?加速器深度學習推理性能,輔助課程實訓模擬,可快速開發(fā)和部署、簡化軟件開發(fā)。
基于英特爾? 架構的蘑菇云高中人工智能教學解決方案
蘑菇云高中人工智能教學解決方案是一套基于本地AI教學服務器、課程緊貼高中課標、軟硬結合的整體解決方案,能夠讓學生學以致用,保證授課老師課堂高效穩(wěn)定。方案包含了本地AI教學服務器、格物象課程實踐平臺、拿鐵熊貓智能終端三個部分。
圖5:蘑菇云高中人工智能教學解決方案關系圖
“任何高科技產業(yè)的發(fā)展最終都將取決于人才的培養(yǎng)和儲備,尤其是最新的人工智能技術對現在的老師而言更是如此。蘑菇云高中人工智能教學解決方案為老師與學生提供了一個簡單易用的人工智能教育平臺,有助于實現基礎算力資源與完善的人工智能教學體系的融合,加速人工智能教育的落地?!庇囔o蘑菇云科創(chuàng)教育產品總監(jiān) |
蘑菇云高中人工智能教學解決方案能夠提供如下主要功能:
人工智能課程學習:平臺中含有20+課時的AI學習課程,主要分為三個階段,初識AI技術基本原理、AI應用領域、AI應用從淺入深進行學習。通過動畫模擬效果,學生能夠學習計算機視覺、語音等工作原理和工作過程,更清晰和具象的了解運算過程,進一步理解算法構成。
圖6:模擬卷積神經網絡運算動態(tài)圖
Python編輯器:平臺采用理論與實踐相結合,界面上一鍵切換到Python編輯器界面進行代碼編輯,撰寫項目,應用課程所學解決問題。
官方案例:平臺提供了20+官方案例,為初學者提供簡單易懂的樣例,能夠更快速的進行算法的學習和運算過程的體驗。
圖7:支持學生導入數據進行個性化訓練
AI項目部署與運行:學生可以將制作好的項目直接連通拿鐵熊貓智能終端,通過格物象教學實訓平臺,能夠將制作好的模型文件,進行一鍵部署,使得AI項目快速部署和運行在主控硬件上。
英特爾助力蘑菇云構建高性能、高經濟性的人工智能教學環(huán)境
在進行人工智能教學方案設計時,選擇 GPU 方案還是 CPU 方案通常會成為一道棘手的“選擇題”。GPU 方案在算力上可以滿足需求,但是,無論是共享 GPU 方案還是終端獨立 GPU 方案,都涉及到昂貴的 GPU 采購,而且在兼容性和可擴展性等方面都需要較多的開發(fā)工作,帶來更高的應用門檻。在典型的教學環(huán)境中,并發(fā)量通??蛇_57路,每一路需要4GB-5GB的顯存支持,單張GPU卡只能支持4-5名學生,因此學校需要購置多張GPU卡,不僅采購成本高企,同時也會增加能耗成本和管理復雜性。相較之下,CPU 方案擁有更高的成本優(yōu)勢,而且在進行性能優(yōu)化之后,足以滿足高中人工智能教學對于訓練和推理等應用的性能要求。
因此,蘑菇云高中人工智能教學解決方案最終選擇了高性能、面向人工智能進行性能優(yōu)化的英特爾?處理器。其中,部署于本地 AI 教學服務器的英特爾?至強?可擴展處理器內置人工智能加速并已針對工作負載進行優(yōu)化,能夠為各種高性能計算工作負載、AI應用以及高密度基礎設施帶來一流的性能和內存帶寬。同時,采用矢量神經網絡指令(VNNI)的英特爾? 深度學習加速(英特爾? DL Boost)顯著提高了人工智能推理的表現。
此外,蘑菇云高中人工智能教學解決方案還使用了OpenVINO? 工具套件進行性能加速,OpenVINO? 工具套件能夠實現廣泛的深度學習推理應用和解決方案的快速部署,可支持開發(fā)人員使用行業(yè)標準人工智能框架、標準或自定義層,將深度學習推理輕松集成到應用中,在英特爾? 硬件(包括加速器)中擴展工作負載并改善性能。借助面向預推理模型的內置模型優(yōu)化器(Model Optimizer,MO),和面向專用硬件加速的推理引擎(Inference Engine,IE)運行時,OpenVINO? 工具套件可在英特爾的不同平臺上部署并加速神經網絡模型,能夠在保持精度的同時顯著提高圖像推理速度。
模型優(yōu)化器是一個跨平臺的命令行工具,可實現訓練環(huán)境和部署環(huán)境之間的轉換,執(zhí)行靜態(tài)模型分析并調整深度學習模型,致力于在終端目標設備上實現最優(yōu)執(zhí)行能力。它支持從流行的框架(包括 TensorFlow/ONNX/ 模型)到中間數據格式(IR,intermediate representation)的離線模型轉換。推理引擎則提供了統一的跨平臺C、C++ 和Python API,用于推理加速和優(yōu)化。
蘑菇云實測數據顯示,基于英特爾?至強?可擴展處理器 + OpenVINO? 工具套件的蘑菇云高中人工智能教學解決方案能夠在最高并發(fā)量下,支持 57 路教學應用同時運行,并滿足最長訓練時間在 5 分鐘之內,最長推理時間在 1 分鐘之內的性能指標9。尤為重要的是,該算力配置的成本相比主流 GPU 方案大幅降低,性價比優(yōu)勢極為顯著。
在終端層面,拿鐵熊貓智能終端采用了英特爾?賽揚?處理器,為Python 3、OpenCV、TensorFlow 和 Keras 人工智能開發(fā)環(huán)境配置提供了高效的算力支持,同時板載了一塊Arduino芯片,兼容Arduino的硬件模塊和軟件類庫。此外,英特爾?賽揚?處理器還具備高可擴展性、高兼容性的優(yōu)勢,支持拿鐵熊貓智能終端通過擴展口打通開源硬件生態(tài),滿足更多智能場景的教學實踐需求。
蘑菇云解決方案 | 英特爾? CPU + A GPU (24GB) | 英特爾?CPU + B GPU (32GB) | 英特爾? CPU+ C GPU (4GB) | |
CPU | 雙路英特爾?至強?金牌5218R 處理器(20 核 40 線程,2.1GHz) | 雙路英特爾?至強?金牌5218R 處理器(20 核 40 線程,2.1GHz) | 雙路英特爾?至強?金牌5218R 處理器(20 核 40 線程,2.1GHz) | 8 x 雙路英特爾?至強?銅牌 3104 處理器(6 核 6 線程,1.7GHz) |
內存 | 256 GB DDR4 2666 RECC (16*16GB) | 256 GB DDR4 2666 RECC (16*16GB) | 256 GB DDR4 2666 RECC (16*16GB) | 256 GB DDR4 2666 RECC (16*16GB) |
存儲 | 960GB SATA SSD | 960 GB SATA SSD | 960 GB SATA SSD | 8 x 240 GB SATA SSD |
獨立 GPU | 無 | 是,8 x 24G | 是,6 x 32G | 是,57 x 4G |
解決方案要求 | ||||
最大并發(fā)流:57 | 支持,無需獨立顯卡 | 支持,8張顯卡 | 支持,6張顯卡 | 支持,57張顯卡 |
模型內存要求:每個數據流4GB | 支持 | 支持,8張顯卡 | 支持,6張顯卡 | 支持,57張顯卡 |
最大并發(fā)流時的最大訓練延時:5 分鐘 | 是 | 是 | 是 | 是 |
最大并發(fā)流時的最大推理延時:1 分鐘 | 是 | 是 | 是 | 是 |
服務器數量:1 臺 | 是 | 是 | 是 | 否 |
最大并發(fā)流時的高可靠性 | 是 | 是,但可能需要投入更多系統開發(fā)工作 | 是,但可能需要投入更多系統開發(fā)工作 | 是,但可能需要投入更多系統開發(fā)工作 |
低開發(fā)門檻,快速上市時間 | 是 | 設計總體系統架構和多塊顯卡間的資源共享機制極具挑戰(zhàn)性 | 設計總體系統架構和多塊顯卡間的資源共享機制極具挑戰(zhàn)性 | 設計總體系統架構和多塊顯卡間的資源共享機制極具挑戰(zhàn)性 |
總體擁有成本 | 小于57000 元(人民幣) | 高 | 高 | 高 |
表1:不同解決方案比較圖
總體而言,該方案具備如下優(yōu)勢:
圖8:蘑菇云人工智能教育方案在某學校的應用
AI為未來教育插上科技翅膀
除了人工智能教學之外,蘑菇云還致力于利用人工智能加速教育變革,發(fā)力教學內容智能化、教學互動化、教學任務自動化、學習環(huán)境自適應化、課程內容生成個性化、學習障礙判斷自動化等場景,通過人工智能等新技術幫助教學內容智能化、優(yōu)質教學內容在線化,能幫助提升教學效率、改善教育不公平性。
英特爾和蘑菇云將在人工智能+教育領域開展更加深入的合作,將創(chuàng)新的智慧化產品與技術賦能到教學環(huán)境之中,積極推動人工智能教育產品與服務的落地,助力人才的培養(yǎng)。
1 https://www.idc.com/getdoc.jsp?containerId=prCHC48196321
2數據援引自工業(yè)與信息化部人才交流中心發(fā)布的《人工智能產業(yè)人才發(fā)展報告(2019-2020 年版)》一文
3數據援引自拉勾招聘數據研究院發(fā)布的《2021人工智能人才報告》
4 http://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm
5 人工智能教育如何進校園,中國教育報 http://www.moe.gov.cn/jyb_xwfb/moe_2082/zl_2018n/2018_zl36/201805/t20180521_336578.html
6 周邵錦, 王帆. K-12人工智能教育的邏輯思考:學生智慧生成之路——兼論K-12人工智能教材[J]. 現代教育技術, 2019, 29(04):13-19.
7 胡波. 人工智能教育對于培養(yǎng)中學生信息素養(yǎng)的作用[J]. 新課程(中), 2018, 000(008):98.
8 何玥玥、呂麗婷、陳嘉耕. 我國人工智能教育的發(fā)展現狀分析與對策研究[J]. 教育探索, 2020, No.332(08):22-24.
9 測試配置:雙路英特爾?至強??牌5218R處理器(40核,80線程,2.1G),256GB總內存(DDR4 2666 RECC 16*16GB),960 GB DELL SATA 固態(tài)盤。
10 測試配置:雙路英特爾?至強??牌5218R處理器(40核,80線程,2.1G),256GB總內存(DDR4 2666 RECC 16*16GB),960 GB DELL SATA 固態(tài)盤。
實際性能受使用情況、配置和其他因素的差異影響。更多信息請見www.Intel.com/PerformanceIndex。
英特爾技術可能需要啟用硬件、軟件或激活服務。
具體成本和結果可能不同。
英特爾未做出任何明示和默示的保證,包括但不限于,關于適銷性、適合特定目的及不侵權的默示保證,以及在履約過程、交易過程或貿易慣例中引起的任何保證。
沒有任何產品或組件是絕對安全的。
英特爾并不控制或審計第三方數據。請您審查該內容,咨詢其他來源,并確認提及數據是否準確。
?英特爾公司版權所有。英特爾、英特爾標識以及其他英特爾商標是英特爾公司或其子公司在美國和/或其他國家的商標。
文中涉及的其它名稱及品牌屬于各自所有者資產。