通義千問7B預(yù)訓(xùn)練模型在多個權(quán)威基準(zhǔn)測評中表現(xiàn)出色,中英文能力遠超國內(nèi)外同等規(guī)模開源模型,部分能力甚至“躍級”趕超12B、13B尺寸開源模型。

在英文能力測評基準(zhǔn)MMLU上,通義千問7B模型得分超過一眾7B、12B、13B主流開源模型。該基準(zhǔn)包含57個學(xué)科的英文題目,考驗人文、社科、理工等領(lǐng)域的綜合知識和問題解決能力。

在中文常識能力測評基準(zhǔn)C-Eval上,通義千問在驗證集和測試集中都是得分最高的7B開源模型,展現(xiàn)了扎實的中文能力。相比英文世界熱鬧的AI開源生態(tài),中文社區(qū)缺少優(yōu)秀的基座模型。通義千問的加入有望為開源社區(qū)提供更多選擇,推動中國AI開源生態(tài)建設(shè)。

在數(shù)學(xué)解題能力評測GSM8K、代碼能力評測HumanEval等基準(zhǔn)上,通義千問7B模型也有不俗表現(xiàn),勝過所有同等尺寸開源模型和和部分大尺寸開源模型。

阿里云表示,開源大模型可以幫助用戶簡化模型訓(xùn)練和部署的過程,用戶不必從頭訓(xùn)練模型,只需下載預(yù)訓(xùn)練好的模型并進行微調(diào),就可快速構(gòu)建高質(zhì)量的模型。

開源生態(tài)對促進中國大模型的技術(shù)進步與應(yīng)用落地至關(guān)重要。今年7月,阿里云宣布將促進中國大模型生態(tài)的繁榮作為首要目標(biāo),向大模型創(chuàng)業(yè)公司提供智能算力、開發(fā)工具等全方位服務(wù)。2022年阿里云牽頭發(fā)起AI模型社區(qū)魔搭,以AI模型為核心服務(wù)AI開發(fā)者。目前,魔搭聚集了20多家頂尖人工智能機構(gòu)貢獻的1000多款開源模型,已經(jīng)成為中國大模型開源第一門戶。

附:開源地址

魔搭ModelScope:

https://modelscope.cn/models/qwen/Qwen-7B/summary;https://modelscope.cn/models/qwen/Qwen-7B/summary

Hugging Face:https://huggingface.co/Qwen

GitHub:https://github.com/QwenLM/Qwen-7B

分享到

xiesc

相關(guān)推薦