據(jù)市場研究公司IDC統(tǒng)計,未來10年里預(yù)計數(shù)字信息總量將在2009年到2020年期間增長44倍,全球數(shù)據(jù)使用量將達到大約35.2ZB(1ZB=10億TB)。與此同時,單個數(shù)據(jù)集的文件尺寸也將增加,導(dǎo)致對更大處理能力的需求以便分析和理解這些數(shù)據(jù)集。一項由UnisphereResearch對531名獨立Oracle用戶進行的調(diào)查發(fā)現(xiàn),百分之九十的企業(yè)的數(shù)據(jù)量在迅速上漲,其中16%的企業(yè)每年的增長率達到50%或更高。不少企業(yè)已經(jīng)感受到失控數(shù)據(jù)增長對績效造成的沖擊,其中發(fā)現(xiàn)87%的受訪者將企業(yè)的應(yīng)用程序性能問題歸咎于不斷增長的數(shù)據(jù)量。
有專家認為,"大數(shù)據(jù)"的推動因素主要是來自一些特大型公司,如谷歌、Youtube等。這些公司需要以非常優(yōu)化的方式分析數(shù)據(jù)和讓計算與存儲配合工作。另外,一些來自健康醫(yī)療、地理空間影像和數(shù)字媒體等行業(yè)的各種大數(shù)據(jù),很顯然,這些數(shù)據(jù)到不一定有多大,但是處理這些數(shù)據(jù)集通常要分配到幾個系統(tǒng)耗費超過24個小時的時間才能完成。