基于JMP軟件的關(guān)聯(lián)性分析篩選的界面

Text Mining文本挖掘

它是用來(lái)解決大數(shù)據(jù)“非結(jié)構(gòu)化”問(wèn)題的。通過(guò)先對(duì)文字、圖像等新媒體信息源進(jìn)行降維、去噪、轉(zhuǎn)換等處理,產(chǎn)生結(jié)構(gòu)化數(shù)據(jù),再用成熟的統(tǒng)計(jì)分析和數(shù)據(jù)挖掘方法進(jìn)行評(píng)價(jià)和解釋。這樣一來(lái),大數(shù)據(jù)的應(yīng)用范圍得到了極大的拓展。

基于JMP軟件的文本分析結(jié)果的最終展現(xiàn)界面

Imputation缺失數(shù)賦值

它是用來(lái)解決大數(shù)據(jù)“殘缺”問(wèn)題的。在有missing data的時(shí)候,我們并不完全排斥直接刪除的方法,但更多的時(shí)候,我們會(huì)在條件允許的情況下,用賦值的方法去替代原先的缺失值。具體的技術(shù)很多,簡(jiǎn)單的如計(jì)算平均值、中位數(shù)、眾數(shù)之類的統(tǒng)計(jì)量,復(fù)雜的如用回歸、決策樹、貝葉斯定理去預(yù)測(cè)缺失數(shù)的近似值等。這樣一來(lái),大數(shù)據(jù)的質(zhì)量大為改觀,為后期的分析與建模奠定了扎實(shí)的基礎(chǔ)。

基于JMP軟件的缺失數(shù)賦值方法選擇的操作界面

Robust Modeling穩(wěn)健建模

它是用來(lái)解決大數(shù)據(jù)“異常”問(wèn)題的。在融入了自動(dòng)識(shí)別、重要性加權(quán)等處理手段后,分析人員既直接消除了個(gè)別強(qiáng)影響點(diǎn)的敏感程度,又綜合考慮了所有數(shù)據(jù)的影響,增強(qiáng)了模型的抗干擾能力,使得模型體現(xiàn)出良好的預(yù)測(cè)特性,由此做出的業(yè)務(wù)決策自然變得更加科學(xué)、精準(zhǔn)。

基于JMP軟件的模型穩(wěn)健擬合的報(bào)表界面

總之,我們必須要對(duì)大數(shù)據(jù)有一個(gè)全面、客觀的認(rèn)識(shí)。只有在不同的業(yè)務(wù)和數(shù)據(jù)背景下采用不同的戰(zhàn)略戰(zhàn)術(shù),才能在大數(shù)據(jù)時(shí)代,真正發(fā)揮大數(shù)據(jù)的杠桿作用,有效提高企業(yè)的運(yùn)營(yíng)效率和市場(chǎng)競(jìng)爭(zhēng)力。

分享到

zhoujianding

相關(guān)推薦