上線這幾天,我比較感興趣的就是這個叫Consensus的GPT。
這是一個基于人工智能的研究助理,它檢索了Consensus(共識)網(wǎng)站上的2億篇學(xué)術(shù)論文,用戶可以問它某個主題有哪些論文,并且能給你這些論文的準確鏈接,找到出處鏈接。
作為關(guān)注數(shù)據(jù)存儲領(lǐng)域的內(nèi)容編輯,我問了它關(guān)于閃存存儲有哪些論文。
它提到了這樣幾篇論文,看起來是分了三大類,其實都是用來提高NAND閃存性能和可靠性的。
我挑選了一個跟AI有關(guān)的論文,末尾還提供有論文的鏈接,它會把我引導(dǎo)到Consensus網(wǎng)站上。
AI讓我了解了這篇論文的大致信息,我很快就了解到:
傳統(tǒng)機器學(xué)習(xí)在NAND故障預(yù)測方面存在問題,基于預(yù)訓(xùn)練的模型在某些NAND下表現(xiàn)可能很好,但換了NAND顆粒之后就不行了,為了重新適應(yīng)新的NAND需要重新訓(xùn)練模型,這很麻煩。
而新的叫LightWarner的無模型強化學(xué)習(xí)算法,算是一個故障預(yù)測器,可以動態(tài)學(xué)習(xí)閃存錯誤特性,它可以更快地適應(yīng)不同閃存芯片,不同壽命周期的錯誤特性變化,從而降低模型遷移的成本。
論文中還提到,在對六種類型的3D閃存芯片進行評估時,LightWarner的表現(xiàn)比傳統(tǒng)監(jiān)督式機器學(xué)習(xí)方法故障預(yù)測準確率高了約10%。
這種高預(yù)測準確率意味著LightWarner能夠有效識別即將發(fā)生的故障,從而有助于提前采取措施,避免數(shù)據(jù)丟失或系統(tǒng)故障。
還能了解到,LightWarner的一個主要優(yōu)勢是其對不同閃存芯片類型的適應(yīng)性,這使其在不斷變化和發(fā)展的存儲技術(shù)領(lǐng)域中具有重要的實用價值。
該模型還可以提升數(shù)據(jù)存儲系統(tǒng)的整體穩(wěn)定性和可靠性,對于如云計算、大數(shù)據(jù)分析領(lǐng)域也都有價值。
我比較好奇,這個強化學(xué)習(xí)的訓(xùn)練過程是如何完成的?于是就試著追問了一下:
這里大致解釋了系統(tǒng)會收集各種數(shù)據(jù),通過數(shù)據(jù)積累和對模型的優(yōu)化,一步步優(yōu)化模型,雖然講的很有條理,但與我想要的答案有些許偏差。
于是我試著問的更具體一點:
它列舉了可用于訓(xùn)練的幾種方式,包括常用于訓(xùn)練的各個芯片,還提到了用服務(wù)器和云基礎(chǔ)設(shè)施的方案,基本等于白問,估計論文里也沒有這些介紹。
最后,我問它,如果要把LightWarner部署,作用于SSD里,應(yīng)該用什么方案,它是這么說的:
它的回答倒是很全面,幾種可能,以及要注意的點都列舉出來了。
由于我沒法直接從IEEE下載論文,最多也只能看到一點摘要信息,對照來看,GPT說的沒有明顯錯誤。
目前看來,Consensus對于希望快速了解有哪些論文,想快速了解論文大致要解決什么問題的人,還是很有幫助的。
如果有朋友對這個論文感興趣,可以試著自行下載獲取。多說一句,六位作者全都是國內(nèi)大學(xué)的研究者,Consensus提到的其他論文的作者也都至少是華人居多。