IDC預測,到2028年全球數(shù)據量Global DataSphere將增長至393.8ZB,相比于2018年增長9.8倍。從2024到2028五年間生成的數(shù)據量將至少是過去10年生成的數(shù)據總量的2.2倍,約為過去5年生成的數(shù)據總量的2.9倍。具體來看,平均每年生成的數(shù)據中有10%是創(chuàng)建和采集的原始數(shù)據,其余為復制或消費的數(shù)據。

具體來看,全球數(shù)據量有以下趨勢:

? 2023年每秒產生4.2PB的數(shù)據,這一數(shù)字在2028年將增長至12.5PB;

? 由于數(shù)據分析和生成式AI的廣泛應用,企業(yè)數(shù)據占比將從64%增長至81%(2023至2028);

? 數(shù)據上云/云上服務更加明顯,到2028年,37%的數(shù)據將會在云端直接產生,超過60%的數(shù)據會最終存儲在云上;

A graph of blue bars

Description automatically generated with medium confidence

雖然數(shù)據量占比從2023年的92.9%降低至2028年的82.3%,但非結構化數(shù)據仍然是最主要的數(shù)據形式。值得注意的是,結構化數(shù)據的增長速度更快,2023-2028年復合年增長率達到49.3%,這主要是由元數(shù)據的增長推動的,元數(shù)據將數(shù)據情境化并賦予數(shù)據意義,從而實現(xiàn)數(shù)據分析以及聯(lián)合GenAI的數(shù)據驅動決策。

A green and blue pie chart

Description automatically generated

超實時數(shù)據和實時數(shù)據處理需求增多。2023年全球生成的數(shù)據中有5.2%為超實時數(shù)據(Ultra Real-Time,數(shù)據傳輸延遲<40ms),16.7%為實時數(shù)據(Real-Time,數(shù)據傳輸延遲≥40ms,≤200ms),78.1%為名義時間數(shù)據(Nominal-Time,數(shù)據傳輸延遲>200ms)。未來將會有更多的實時數(shù)據處理和分析需求出現(xiàn),以及GenAI的驅動,實時數(shù)倉、湖倉一體、數(shù)據集成工具、BI工具將有更多增長空間。

生成式AI也是影響數(shù)據圈的重要因素。當前GenAI生成數(shù)據中超過35%都為文本類型,但隨著技術的演進升級,到2028年,超過75%的生成數(shù)據將會均勻分布在文本、圖像、視頻類型,同時也有接近18%的數(shù)據為軟件代碼。因此技術供應商需要面向長期發(fā)展,預測由GenAI帶來的混合內容生成、處理和存儲需求,來提供更加低延遲、高性能的服務。

IDC中國高級分析師李浩然表示,數(shù)據量和關系復雜度的上升都會為數(shù)據管理工作帶來更大的挑戰(zhàn),企業(yè)在實現(xiàn)數(shù)據統(tǒng)一存儲、管理的同時,需要關注數(shù)據扁平化與數(shù)據間邏輯關聯(lián),避免數(shù)據多次復制導致的資源浪費,保證可通過AI、元數(shù)據分析技術來全局、一致的發(fā)現(xiàn)和管理數(shù)據資產。

分享到

zhupb

相關推薦