圖一:陳國良院士
陳國良院士認為不是所有的P類問題都可以有效的并行計算,小數(shù)據(jù)是可解的,大數(shù)據(jù)就面臨不可解的問題??山鈫栴}的經(jīng)典定義是多項式時間內(nèi)可以解決問題,而不可解問題指理論上能夠解,但是實際上求解時間太長而無法用的問題,大數(shù)據(jù)就是屬于不可解問題。
大數(shù)據(jù)遇到不可解問題,就可以用NC計算來解決,關鍵是怎么把大數(shù)據(jù)劃分,必須要有一定的劃分標準,陳國良院士認為提出的大數(shù)據(jù)劃分標準是數(shù)據(jù)的距離和度量,在數(shù)學上,度量空間是一個集合,集合中的元素之間的距離就叫度量。
陳國良院士認為在度量空間中,我們可按照數(shù)據(jù)到支撐點的遠近距離進行三中劃分:超平面劃分、完全超平面樹、有利點劃分。
最后,陳國良院士表示大數(shù)據(jù)計算理論基本的研究方法學是大數(shù)據(jù)統(tǒng)一表示、大數(shù)據(jù)分解方法、大數(shù)據(jù)計算;可行方案是:度量空間表示、距離劃分技術(shù)、NC類計算理論;實施方法包括,將不同數(shù)據(jù)丑類成統(tǒng)一數(shù)據(jù)類型,將數(shù)據(jù)之間關系抽象成統(tǒng)一的距離函數(shù)等等。