基于大模型評測平臺OpenCompass全集測試,日日新·商量大語言模型SenseChat V4,綜合整體評測成績水平比肩GPT-4
商湯??新·商量語??模型–數(shù)據(jù)分析版本(SenseChat-DataAnalysis V4)發(fā)布,在數(shù)據(jù)分析場景下的數(shù)據(jù)測試集(1000+題目)中以85.71%的正確率超過GPT–4,支持復(fù)雜表格、多表格、多文件的理解,實現(xiàn)數(shù)據(jù)清洗、數(shù)據(jù)運算、比較分析、趨勢分析,預(yù)測性分析、可視化等常見數(shù)據(jù)分析任務(wù),賦能財務(wù)分析、商業(yè)分析、銷售預(yù)測、市場分析、宏觀分析等多個應(yīng)用場景。
商湯推出的日日新·商量語言大模型-醫(yī)療版本“大醫(yī)”(SenseChat-Medical V4),在本次更新中實現(xiàn)了更強的多輪對話與上下文理解能力、以及更豐富的工具調(diào)用能力,有效實現(xiàn)專業(yè)醫(yī)學(xué)問答及復(fù)雜醫(yī)學(xué)任務(wù)推理,并支持更多模態(tài)醫(yī)學(xué)文件的智能解讀和交互問答。“大醫(yī)”在兩項行業(yè)權(quán)威評測——2023年職業(yè)藥劑師考試大模型評測、中文醫(yī)療大語言模型開放評測平臺MedBench中,均實現(xiàn)綜合評分排名第二,性能逼近GPT-4,其中職業(yè)藥劑師考試大模型評測中的兩個細(xì)分方向性能已超越GPT-4。
2023年職業(yè)藥劑師考試大模型評測結(jié)果,“大醫(yī)”綜合評分排名第二,并在兩個細(xì)分方向上性能超越GPT-4
覆蓋13個醫(yī)學(xué)場景的大醫(yī)Web端展示頁面
多模態(tài)是人工智能大模型重要的技術(shù)演進(jìn)方向,日日新·商量多模態(tài)大模型(SenseChat-Vision V4)全新推出,其擁有300億參數(shù),圖文理解能力處于全球領(lǐng)先水平,在權(quán)威評測基準(zhǔn)測試集MME Benchmark上綜合得分排名首位,綜合得分達(dá)2199.5(超過GPT-4V的1926.57),已在智能駕駛、智能車艙、電力行業(yè)等多個實際場景落地應(yīng)用,助力千行百業(yè)的產(chǎn)業(yè)升級。
多模態(tài)大模型權(quán)威綜合基準(zhǔn)測試MME Benchmark可以從定位、名人識別、景點識別、OCR、數(shù)學(xué)計算等14個維度來系統(tǒng)綜合評測模型的能力。
日日新·商量多模態(tài)大模型可回答交通場景中圖文內(nèi)容理解等復(fù)雜任務(wù)
商湯自研的日日新·秒畫文生圖大模型(SenseMirageV4)較此前版本,參數(shù)量提升至百億量級,通過Mixture of text experts、Spatial-aware CFG等算法優(yōu)化,語義理解能力與圖像質(zhì)感細(xì)節(jié)表現(xiàn)顯著增強,可達(dá)成電影級海報生成水平。同時結(jié)合Adversarial Distillation算法,秒畫SenseMirage-Turbo V4版本也對外發(fā)布,相較于V4基礎(chǔ)版本,可達(dá)到10倍推理加速效果。
秒畫SenseMirage V4全新升級,電影級圖片一鍵生成
率先支持不同模態(tài)工具調(diào)用的Function call & Assistants API 版本來了,大模型時代的專屬開發(fā)助手
大模型的能力前沿且豐富,為助力更多開發(fā)人員及相關(guān)行業(yè)更便捷、高效地用好大模型,商湯推出??新·商量大語言模型Function call & Assistants API 版本。
??新·商量大語言模型Function call & Assistants API 版本為開發(fā)人員提供一個靈活、高度可定制的工具調(diào)用框架,提供了聯(lián)網(wǎng)搜索,代碼解釋,圖文問答,??圖等多種?具調(diào)?,?持商湯??新?模型體系,賦能多?業(yè)場景。
與其他同類產(chǎn)品相比,??新·商量大語言模型Function call & Assistants API 版本率先支持不同模態(tài)的工具調(diào)用,能夠支持圖文結(jié)合的多模態(tài)交互和數(shù)據(jù)分析代碼執(zhí)行結(jié)果的直觀呈現(xiàn),從而解決更加復(fù)雜的問題,讓各種應(yīng)?程序中集成AI功能變得更加簡單和?效。
通過??新·商量大語言模型Function call & Assistants API,輕松調(diào)用內(nèi)置工具實現(xiàn)多模態(tài)交互(注:展示效果有加速處理)
創(chuàng)新場景應(yīng)用加速落地,商湯“日日新”大模型體系持續(xù)賦能多產(chǎn)業(yè)升級
大模型的出現(xiàn)帶來了人機交互范式的巨大轉(zhuǎn)換,依托商湯“日日新Sensenova”能力的快速迭代,小浣熊家族再添新成員——數(shù)據(jù)分析工具 “辦公小浣熊”,重塑大模型時代的應(yīng)用產(chǎn)品形態(tài)。
辦公小浣熊是一款無需編程或復(fù)雜操作即可使用的數(shù)據(jù)分析工具。通過自然語言輸入,辦公小浣熊結(jié)合商湯大模型體系的意圖識別、邏輯理解、代碼生成能力,自動將數(shù)據(jù)轉(zhuǎn)化為有意義的分析結(jié)果和可視化圖表。得益于商湯大模型體系的強大中文理解能力,該產(chǎn)品更適應(yīng)中國的數(shù)據(jù)分析需求。
辦公小浣熊演示頁面:輸入表格,輕松get 分析報告。體驗入口:https://raccoon.sensetime.com/
產(chǎn)品形態(tài)的出現(xiàn)是大模型技術(shù)落地應(yīng)用的嘗試之一,自2023年4月10日商湯“日日新SenseNova”問世以來,企業(yè)用戶超過3000家,覆蓋行業(yè)包括互聯(lián)網(wǎng)、游戲、文旅、教育、醫(yī)療健康、金融和編程等。
商湯始終推動降低大模型使用門檻,拓展人工智能落地場景,讓大模型真正在行業(yè)里用起來,未來將持續(xù)推進(jìn)“日日新SenseNova”大模型體系建設(shè),實現(xiàn)創(chuàng)新場景應(yīng)用,不斷推動大模型前置化,讓更多智能走向更多場景、更多行業(yè),攜手行業(yè)生態(tài)邁向AGI時代。