AI Infra整體架構(gòu):四層協(xié)同,全棧賦能
星環(huán)科技新一代AI Infra采用分層設(shè)計,從底層資源到上層應(yīng)用形成完整閉環(huán)。
Resources Platform作為基礎(chǔ),提供統(tǒng)一的資源管理能力,支持多種異構(gòu)計算資源;
AI-Ready Data Platform作為核心,提供多模型數(shù)據(jù)的統(tǒng)一存儲和處理能力;
AI Platform提供模型訓(xùn)練、推理和應(yīng)用開發(fā)能力;
Knowledge Platform則負(fù)責(zé)知識管理和工程化,將數(shù)據(jù)轉(zhuǎn)化為知識資產(chǎn)。
這四層架構(gòu)不是簡單疊加,而是深度融合、相互賦能,形成了一個完整的AI基礎(chǔ)設(shè)施生態(tài)。
通過這一架構(gòu),企業(yè)可以實現(xiàn)從數(shù)據(jù)到知識、從模型到應(yīng)用的全鏈路智能化轉(zhuǎn)型。
四、AI-Ready Data Platform:數(shù)據(jù)平臺的革命性創(chuàng)新
作為AI Infra的核心構(gòu)成,AI-Ready Data Platform是一個AI賦能的數(shù)據(jù)平臺,為AI生產(chǎn)和提供高質(zhì)量數(shù)據(jù)。該數(shù)據(jù)平臺以關(guān)系型、向量、圖、全文、時序等多模型數(shù)據(jù)統(tǒng)一存儲管理為基礎(chǔ),提供多模態(tài)數(shù)據(jù)自動處理、高效數(shù)據(jù)治理、特定領(lǐng)域知識構(gòu)建以及全流程的實時數(shù)據(jù)洞察能力,實現(xiàn)從數(shù)據(jù)產(chǎn)生到應(yīng)用于AI的全過程數(shù)據(jù)管理,一站式助力企業(yè)更高效地運用AI釋放數(shù)據(jù)價值。它具有五大核心能力:
1.AI-Ready Data多模型數(shù)據(jù):支持向量、圖、文檔、全文索引、關(guān)系型表等多種數(shù)據(jù)模型,為AI應(yīng)用提供豐富的數(shù)據(jù)基礎(chǔ);
2.非結(jié)構(gòu)化數(shù)據(jù)處理:能夠?qū)⒎墙Y(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為半結(jié)構(gòu)化、結(jié)構(gòu)化數(shù)據(jù),解決企業(yè)80%以上的非結(jié)構(gòu)化數(shù)據(jù)難以利用的問題;
3.數(shù)據(jù)治理:提供高效數(shù)據(jù)治理能力,確保數(shù)據(jù)的準(zhǔn)確性、一致性和可用性;
4.特定領(lǐng)域知識:將數(shù)據(jù)模型轉(zhuǎn)化為知識,提取和沉淀領(lǐng)域知識,為AI應(yīng)用提供知識基礎(chǔ);
5.全流程實時數(shù)據(jù)洞察:支持實時接入、實時處理、實時分析,滿足企業(yè)對數(shù)據(jù)時效性的高要求。
這些能力通過星環(huán)科技的多款產(chǎn)品得以實現(xiàn),包括Transwarp Corpus Studio(星環(huán)語料開發(fā)工具)、Transwarp Data Studio星環(huán)數(shù)據(jù)開發(fā)工具)、Transwarp Data Hub(星環(huán)一站式多模型大數(shù)據(jù)平臺)和Transwarp Knowledge Hub(星環(huán)知識平臺)。
多模型統(tǒng)一架構(gòu):AI-Ready Data Platform的技術(shù)核心
星環(huán)科技的AI-Ready Data Platform支持向量、圖、全文索引、文檔、時序數(shù)據(jù)等多數(shù)據(jù)模型,并實現(xiàn)了統(tǒng)一接口、統(tǒng)一計算引擎、統(tǒng)一存儲到和一資源管理,形成了完整的統(tǒng)一技術(shù)架構(gòu),用戶可以在接口和計算層屏蔽所有異構(gòu)數(shù)據(jù)帶來的差異化,以統(tǒng)一形態(tài)滿足目前以及未來各類垂直大模型場景的落地需求。星環(huán)科技自2020年實現(xiàn)多模型統(tǒng)一架構(gòu)以后,不斷拓展多模型能力,到2023年發(fā)布分布式向量數(shù)據(jù)庫后已完整支持業(yè)內(nèi)主流的11種數(shù)據(jù)模型,連續(xù)2年入選Gartner“數(shù)據(jù)庫產(chǎn)品品類最多的廠商之一”,并成為國內(nèi)首個通過信通院”多模數(shù)據(jù)庫產(chǎn)品評測”的廠商。
全流程實時數(shù)據(jù)洞察,加速數(shù)據(jù)價值創(chuàng)新
星環(huán)科技湖倉集統(tǒng)一平臺,端到端秒級數(shù)據(jù)分析:星環(huán)科技湖倉集統(tǒng)一數(shù)據(jù)平臺,基于統(tǒng)一的存儲、統(tǒng)一的資源管理、統(tǒng)一的計算引擎和統(tǒng)一的接口,一個平臺能夠同時支持批處理、交互式分析、實時數(shù)據(jù)處理和在線數(shù)據(jù)服務(wù)四類場景?;谛黔h(huán)科技一體化的數(shù)據(jù)平臺,端到端數(shù)據(jù)處理延時從過去的T+1天提速到T+1秒,實現(xiàn)數(shù)據(jù)落地即分析。并且,在數(shù)據(jù)處理分析性能方面相比業(yè)內(nèi)同類產(chǎn)品均都數(shù)倍的提升,例如在100TB TPC-DS測試場景中,數(shù)據(jù)分析性能相比Databricks(Photon)提升1倍,硬件成本降低一倍。星環(huán)科技自2017年實現(xiàn)湖倉一體架構(gòu)后,在實時、高并發(fā)數(shù)據(jù)寫入以及數(shù)據(jù)處理分析方面不斷創(chuàng)新突破,在2022年實現(xiàn)了湖倉集一體的架構(gòu),并且數(shù)據(jù)集市性能能夠達(dá)到甚至超越單獨的數(shù)據(jù)集市,幫助數(shù)百個客戶構(gòu)建統(tǒng)一的數(shù)據(jù)平臺,加速實時數(shù)據(jù)創(chuàng)新。
高性能分布式時序數(shù)據(jù)庫,PB級實時時序數(shù)據(jù)秒級分析:星環(huán)科技分布式時序數(shù)據(jù)庫Timelyre9.3版本實現(xiàn)了10倍的分析性能提升,能夠秒級分析PB級實時時序數(shù)據(jù),助力企業(yè)用戶實時處理傳感器、金融交易、系統(tǒng)日志、生產(chǎn)設(shè)備等實時產(chǎn)生的海量時序數(shù)據(jù),快速識別風(fēng)險或者定位故障原因。同時,分布式架構(gòu)可以線性擴展,滿足PB級到EB級數(shù)據(jù)的存儲需求,結(jié)合5-20倍的無損數(shù)據(jù)壓縮能力,有效減少存儲節(jié)點數(shù)據(jù)量,大幅降低成本。
五、Sophon LLMOps 1.6:四維進(jìn)化,催化AI × Data融合
星環(huán)科技在此次發(fā)布會上重點介紹了Sophon LLMOps 1.6平臺的四維進(jìn)化,作為企業(yè)級AI基礎(chǔ)設(shè)施,Sophon LLMOps統(tǒng)一支撐空間管理、模型、算力管理、數(shù)據(jù)管理、通用工具,實現(xiàn)智能體驅(qū)動的AI全流程運營,實現(xiàn)了從數(shù)據(jù)到智能、從模型到應(yīng)用的閉環(huán)升級,全面催化 AI × Data 的深度融合。
四大模塊協(xié)同:全生命周期統(tǒng)一管理
Sophon LLMOps平臺包含四大核心模塊:
星鑄(Model Foundry模型開發(fā)):支持主流HuggingFace大模型的一鍵導(dǎo)入、納管與部署,具備自動量化與推理加速能力。兼容多種國產(chǎn)GPU與推理引擎,適配企業(yè)級模型多環(huán)境管理需求。助力企業(yè)構(gòu)建穩(wěn)定、安全、高效的模型基礎(chǔ)能力;
星典(Knowledge Lodge知識工程):提供從知識構(gòu)建、審核、發(fā)布到優(yōu)化的全流程管理能力,支持多源知識融合與企業(yè)級知識體系建設(shè)。強化知識治理與問答應(yīng)用的支撐能力,是AI理解業(yè)務(wù)語義的核心模塊;
星解(Corpus Studio語料工程):新增數(shù)據(jù)資產(chǎn)化、文件編目與分布式語料處理能力,幫助企業(yè)快速準(zhǔn)備訓(xùn)練數(shù)據(jù)。支持語料標(biāo)準(zhǔn)化、自動標(biāo)注、協(xié)同審核,是高質(zhì)量數(shù)據(jù)供給的核心支撐平臺;
星構(gòu)(Agent Go應(yīng)用開發(fā)):支持智能體(Agent)、應(yīng)用鏈與插件的靈活編排與部署,全面兼容MCP協(xié)議。新增數(shù)據(jù)解析、知識工程等智能體,讓模型能力快速集成進(jìn)業(yè)務(wù)系統(tǒng),推動AI在各類場景中真正落地。
Sophon LLMOps還具備企業(yè)級AI基礎(chǔ)設(shè)施管理能力,提供對空間、工具、算力、模型、數(shù)據(jù)的統(tǒng)一管理,支撐大模型從開發(fā)到部署全過程的有序運行。這一能力使得AI能力成為企業(yè)級資產(chǎn),具備可監(jiān)管、可配置、可復(fù)用等特性。
一站式解決企業(yè)六大痛點
Sophon LLMOps平臺通過全生命周期統(tǒng)一管理,一站式解決了企業(yè)在AI應(yīng)用開發(fā)過程中面臨的六大痛點:
「難」:多模型適配難:通過統(tǒng)一的模型管理和適配機制,簡化了多模型的使用和集成;
「缺」:算力永遠(yuǎn)缺:提供高效的算力管理和調(diào)度能力,優(yōu)化算力資源利用。;
「難」:語料供給難:通過星解模塊提供專業(yè)的語料工程能力,解決語料供給問題;
「差」:準(zhǔn)確度差:結(jié)合知識工程和模型優(yōu)化,提高AI應(yīng)用的準(zhǔn)確度和可靠性;
「難」:新需求VS舊能力:大模型人工智能硬件需求、軟件開發(fā)、應(yīng)用、人才要求和傳統(tǒng)軟件都不一樣;
「貴」:應(yīng)用分散建設(shè)成本高。
通過這一平臺,企業(yè)可以構(gòu)建各種智能應(yīng)用,如客服助手、合規(guī)助手、財務(wù)分析、數(shù)據(jù)分析和決策助手等,滿足不同部門的業(yè)務(wù)需求。企業(yè)級管理能力,讓AI從分散開發(fā)走向統(tǒng)一運營,實現(xiàn)資源可控、流程可管、資產(chǎn)可用,加速AI在企業(yè)中的規(guī)?;涞?。
六、星環(huán)科技新一代AI Infra的行業(yè)應(yīng)用案例
從理論到實踐 星環(huán)科技的新一代AI Infra不僅在技術(shù)上實現(xiàn)了突破,更在實際應(yīng)用中展現(xiàn)了強大的價值。
實時湖倉集一體:一體化構(gòu)建AI × Data 實現(xiàn)端到端秒級數(shù)據(jù)分析
在此之前,用戶使用CDH、Hbase、Hive、Clickhouse等多個開源產(chǎn)品來實現(xiàn)多業(yè)務(wù)場景,存在數(shù)據(jù)冗余、處理鏈路長、時效性差等問題,通過星環(huán)科技構(gòu)建實時湖倉集一體平臺,可以基于一個平臺同時支持傳統(tǒng)數(shù)據(jù)應(yīng)用、實時數(shù)據(jù)洞察和AI大模型應(yīng)用。
遷移到星環(huán)實時湖倉集一體平臺后,在傳統(tǒng)數(shù)據(jù)應(yīng)用方面,整體性能大幅提升。例如在交易報表場景中,批處理性能提升1倍,在大屏駕駛艙場景中,OLAP分析性能提升高達(dá)10倍。
同時,星環(huán)科技實時湖倉集一體平臺的實時入庫、秒級分析能力可以助力金融機構(gòu)實現(xiàn)實時數(shù)據(jù)洞察,例如在實時風(fēng)控場景,可以實現(xiàn)秒級延時,數(shù)據(jù)落地即分析,助力金融更快地識別風(fēng)險和采取應(yīng)對措施;在手機銀行場景,每服務(wù)器可支持2000QPS的高并發(fā)在線數(shù)據(jù)服務(wù);在CRM等場景,星環(huán)科技實時湖倉集一體可支持HTAP的混合負(fù)載能力,避免數(shù)據(jù)搬遷帶來的延時,助力金融機構(gòu)實現(xiàn)更快的服務(wù)響應(yīng)。
此外,用戶可以AI-ready data platform快速構(gòu)建大模型應(yīng)用,例如基于星環(huán)科技數(shù)據(jù)分析助手無涯·問數(shù),可以實現(xiàn)自然語言做數(shù)據(jù)分析,并且準(zhǔn)確率達(dá)到95%以上;在智能營銷方面,過去需要幾天來做的數(shù)據(jù)處理和報告整理,基于星環(huán)科技知識平臺構(gòu)建營銷助手只需要幾分鐘即可實現(xiàn)數(shù)據(jù)處理和報告生成,大幅提高金融機構(gòu)營銷效率。
金融機構(gòu):打造企業(yè)級知識庫,為大模型應(yīng)用輸送高質(zhì)量語料
在銀行業(yè)的應(yīng)用中,星環(huán)科技幫助某銀行打造了企業(yè)級知識庫,解決了數(shù)據(jù)治理工程復(fù)雜、企業(yè)構(gòu)建應(yīng)用中缺乏高質(zhì)量數(shù)據(jù)與語料、數(shù)據(jù)孤島和領(lǐng)域知識匱乏等挑戰(zhàn)。
通過星典Knowledge Lodge和星解Corpus Studio,結(jié)合Sophon LLMOps平臺,構(gòu)建了統(tǒng)一 的企業(yè)級知識工程平臺,實現(xiàn)了知識資產(chǎn)的定義、管理、構(gòu)建和存儲全流程管理。最終形成了”4+1″知識庫體系,包括指標(biāo)、制度、運營、客服四大場景知識庫和金融行業(yè)通用知識庫, 支持智能問答、信貸助手、行業(yè)研究、代碼生成、財務(wù)分析、風(fēng)險分析、智能營銷、智能軟件工程、數(shù)字辦公和科研檢索等多種知識應(yīng)用。
這一案例充分體現(xiàn)了”AI × 企業(yè)私有數(shù)據(jù)”的核心理念,通過高質(zhì)量的企業(yè)知識庫,打造了銀行業(yè)的核心競爭力。
數(shù)據(jù)治理:AI賦能,實現(xiàn)全面自動化
星環(huán)科技在 AI 數(shù)據(jù)治理領(lǐng)域,以知識工程為核心,構(gòu)建了一套全面自動化、高效且精準(zhǔn)的解決方案,助力企業(yè)實現(xiàn)數(shù)據(jù)價值的深度挖掘與高效利用。星環(huán)科技語料平臺星解Corpus Studio,支持多源數(shù)據(jù)采集 ,PDF、Word 文檔及其他多種格式文件,無論來自網(wǎng)站公布的行業(yè)動態(tài),還是企業(yè)內(nèi)部規(guī)范,都能一站式匯聚,為后續(xù)的數(shù)據(jù)處理提供豐富素材,同時可以對采集到的語料進(jìn)行深度解析,精準(zhǔn)提取標(biāo)準(zhǔn)名稱、編號、發(fā)布單位等關(guān)鍵信息,并依據(jù)內(nèi)容類別進(jìn)行智能分類,形成高質(zhì)量語料。
星環(huán)科技知識工程平臺星典Knowledge Lodge進(jìn)一步解析語料正文、表格、圖片等信息,運用先進(jìn)的 AI 技術(shù)精準(zhǔn)抽取數(shù)據(jù)項、數(shù)據(jù)定義等關(guān)鍵知識要素,抽取的知識被整合進(jìn)知識庫,形成標(biāo)準(zhǔn)化、體系化的知識資產(chǎn)。知識庫涵蓋數(shù)據(jù)字典、數(shù)據(jù)質(zhì)量規(guī)則等豐富內(nèi)容,為企業(yè)數(shù)據(jù)治理提供知識支撐,同時支持知識的更新與維護(hù),確保知識的時效性與準(zhǔn)確性。
星環(huán)科技將各類數(shù)據(jù)治理工具封裝為 AI 數(shù)據(jù)治理 MCP Server,實現(xiàn) AI 與數(shù)據(jù)治理的無縫融合。憑借深度智能驅(qū)動,數(shù)據(jù)治理工具得以高效運作,這不僅突破了傳統(tǒng)數(shù)據(jù)治理的局限,更將智能化水準(zhǔn)推向新高度,極大地提升了整體工作效率,為數(shù)據(jù)治理領(lǐng)域樹立了智能化的新標(biāo)桿。
M域和O域統(tǒng)一視角:高效融合實現(xiàn)價值創(chuàng)新
星環(huán)科技時序數(shù)據(jù)庫Timelyre可以實現(xiàn)PB級實時時序數(shù)據(jù)分析,并且可以直接進(jìn)行機器學(xué)習(xí)。
不僅如此,基于星環(huán)科技統(tǒng)一技術(shù)架構(gòu),實現(xiàn)時序數(shù)據(jù)和關(guān)系型數(shù)據(jù)的統(tǒng)一存儲和庫內(nèi)跨模型融合分析,幫助企業(yè)構(gòu)建M域(如ERP、CRM)和O域(如運維、監(jiān)控、設(shè)備)的統(tǒng)一數(shù)據(jù)視角,更好地支撐經(jīng)營決策、質(zhì)量管控、供應(yīng)鏈優(yōu)化與運維監(jiān)控等多種場景的數(shù)據(jù)和業(yè)務(wù)價值實現(xiàn)。
這一案例場景展示了星環(huán)科技多模數(shù)據(jù)融合與實時分析如何為企業(yè)創(chuàng)造新的價值,通過打破數(shù)據(jù)孤島,實現(xiàn)了管理和生產(chǎn)的深度協(xié)同。
七、星環(huán)科技引領(lǐng)新一代企業(yè)AI基礎(chǔ)設(shè)施新時代
星環(huán)科技此次發(fā)布的新一代AI Infra,不僅是一系列技術(shù)產(chǎn)品,更是企業(yè)競爭力重構(gòu)的重要支撐。通過”AI × Data”的創(chuàng)新理念,星環(huán)科技為企業(yè)提供了從數(shù)據(jù)到知識、從模型到應(yīng)用的全鏈路解決方案,幫助企業(yè)在AI時代重構(gòu)競爭力。
在當(dāng)前大模型技術(shù)日益普及的背景下,星環(huán)科技敏銳地洞察到高質(zhì)量數(shù)據(jù)將成為企業(yè)差異化競爭的關(guān)鍵。通過AI-Ready Data Platform的五大核心能力,實現(xiàn)從數(shù)據(jù)產(chǎn)生到應(yīng)用于AI的全過程數(shù)據(jù)管理,一站式助力企業(yè)更高效地運用AI釋放數(shù)據(jù)價值;通過Sophon LLMOps平臺的四維進(jìn)化,企業(yè)可以構(gòu)建高質(zhì)量的AI應(yīng)用,解決多模型適配難、算力永遠(yuǎn)缺、語料供給難、準(zhǔn)確度差和企業(yè)架構(gòu)規(guī)劃難、應(yīng)用分散建設(shè)成本高等六大痛點。
從銀行業(yè)的企業(yè)級知識庫建設(shè),到數(shù)據(jù)治理的全面自動化,再到M域和O域的統(tǒng)一視角,星環(huán)科技的解決方案已在多個行業(yè)展現(xiàn)了強大的價值。這些成功案例不僅驗證了星環(huán)科技新一代AI Infra的可落地性,更展示了AI與數(shù)據(jù)融合為企業(yè)創(chuàng)造的實際價值。
展望未來,隨著AI技術(shù)的不斷發(fā)展和數(shù)據(jù)管理能力的持續(xù)提升,AI與數(shù)據(jù)的深度融合將重塑企業(yè)競爭格局。星環(huán)科技的新一代AI Infra為這一趨勢提供了技術(shù)基礎(chǔ)和實踐路徑,幫助企業(yè)在 AI時代贏得未來。
“企業(yè)落地AI是競爭力重構(gòu)”,在這個過程中,星環(huán)科技將繼續(xù)發(fā)揮技術(shù)引領(lǐng)者的作用,為企業(yè)提供全棧式的AI基礎(chǔ)設(shè)施解決方案,助力企業(yè)實現(xiàn)真正的智能化轉(zhuǎn)型。