Neo4j亞太區(qū)副總裁Nik Vora先生

其實(shí)答案也很簡單,這是一種圖數(shù)據(jù)庫的技術(shù),通過對實(shí)體和關(guān)系抽取,通過研究發(fā)現(xiàn)數(shù)據(jù)背后的秘密。

仍然以糖尿病的研究為例,簡單說糖尿病是一種代謝性疾病,但僅僅查看代謝數(shù)據(jù)是不夠的,研究人員需要尋找、研究更多的線索,也許考慮其他學(xué)科,如基因組學(xué)或蛋白質(zhì)組學(xué)。

無論如何,在人體代謝中一切都是相互關(guān)聯(lián)的;一個(gè)基因編碼會關(guān)聯(lián)某種蛋白質(zhì)、代謝物,而代謝物會影響、調(diào)節(jié)另外一種基因,可以說我們的代謝是由數(shù)千種相互連接的成分組成的網(wǎng)絡(luò),這就一個(gè)圖數(shù)據(jù)模型。

借助對這種復(fù)雜的圖數(shù)據(jù)模型的研究,也許我們會找到應(yīng)對糖尿病的辦法。

同樣的在各行各業(yè),擁有和積累了大量的數(shù)據(jù),如果利用圖數(shù)據(jù)庫技術(shù),對這些數(shù)據(jù)關(guān)系進(jìn)行研究,會帶來許多新的發(fā)現(xiàn)和驚喜。

“世界領(lǐng)先的汽車制造商沃爾沃也在使用Neo4j圖數(shù)據(jù)庫應(yīng)用于知識圖譜,每輛沃爾沃汽車都有近200個(gè)傳感器、400個(gè)應(yīng)用程序,涉及1萬+信號源和3萬+機(jī)械部件,所有的這些數(shù)據(jù)必須保持協(xié)同,任何錯(cuò)誤都會帶來安全隱患?!? Nik Vora說。

“如果按照傳統(tǒng)的方式將這些數(shù)據(jù)存儲在excel表格或傳統(tǒng)關(guān)系型數(shù)據(jù)庫中,將很難形成各種數(shù)據(jù)關(guān)系的單一視圖?!?Nik Vora補(bǔ)充說。

沃爾沃使用Neo4j圖數(shù)據(jù)庫作為知識圖譜的應(yīng)用,各種隱藏的數(shù)據(jù)關(guān)系一目了然。以此為基礎(chǔ),研究人員從不同層次進(jìn)行知識挖掘,運(yùn)用圖技術(shù)進(jìn)行模型訓(xùn)練和數(shù)據(jù)分析,為車輛和行車安全提供了保障。

Nik Vora表示:中國作為制造大國,有深厚的生產(chǎn)能力和數(shù)據(jù)積累,更應(yīng)該用好圖數(shù)據(jù)庫技術(shù)。作為一家瑞典的公司,Nik Vora重視中國市場,愿意加大中國市場投入,幫助中國從制造大國變?yōu)橹圃鞆?qiáng)國。

2021年是我國“十四五”規(guī)劃的開局之年,也是我國“加快數(shù)字發(fā)展建設(shè)數(shù)字中國”的關(guān)鍵之年。其中,數(shù)據(jù)創(chuàng)新的作用舉足輕重。毫無疑問,圖數(shù)據(jù)庫技術(shù)將帶來新的思維和突破。應(yīng)該抓緊對圖數(shù)據(jù)庫技術(shù)的研究。

對于圖數(shù)據(jù)庫技術(shù)而言,數(shù)據(jù)實(shí)體和關(guān)系的抽取非常重要,僅僅依靠人力,其難度很大。但是好的消息在于:循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN、LSTM)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)和 Transformer 等AI技術(shù)的應(yīng)用,為數(shù)據(jù)實(shí)體和關(guān)系的自動(dòng)抽取帶來幫助,這也為數(shù)據(jù)研究帶來新的契機(jī)。

世界上永遠(yuǎn)不缺少美好的事物,只是缺少發(fā)現(xiàn)美的眼睛!數(shù)據(jù)創(chuàng)新應(yīng)用也是如此,人類很多難以突破的問題,其答案就隱藏在這些關(guān)系的背后,等待我們?nèi)グl(fā)現(xiàn)。

一萬年太久,只爭朝夕!

分享到

songjy

相關(guān)推薦