DNA的四種脫氧核苷酸(A,G,C,T)可被用來對數據進行編碼
過去,有些研究團隊一直試圖向活細胞中的基因組寫入數據,但是這種方式有一些不足之處。首先,細胞會死亡,這并不是你存儲學期論文的好方法。另外,細胞還會分裂、復制,其中會不斷發(fā)生變異,從而改變數據的內容。
為了解決這些問題,一個由波士頓哈佛醫(yī)學院合成生物學家喬治-丘奇(George Church)領導的研究團隊發(fā)明了一種DNA信息歸檔系統(tǒng),完全不需要利用細胞。相反,利用的是一臺噴墨打印機,從而將化學合成的一小段DNA嵌入到一塊微型玻璃芯片的表面。為了給數字文件進行編碼,研究人員把文件劃分為微小的數據塊,并把這些數據塊以A、C、G、T(DNA的四種脫氧核苷酸)的字母組合來表示,放棄了過去在計算機上的1和0編碼方法。每條DNA片段還包含了一個數字“條碼”,用來記錄數據在原文件中的位置信息。在讀取信息時,需要DNA測序儀和電腦將所有片段按序重新組合起來,并轉換為數字的格式。計算機還需要負責處理錯誤信息,因為每個數據塊都可能會被復制上千次,經過比對,任何小錯誤都可以被發(fā)現和糾正。
為了證實這一系統(tǒng)在實際應用中的能力,該團隊使用了這種DNA芯片將丘奇同他人合著的一本遺傳學書籍進行了編碼。他們成功了。在將書籍內容轉換為DNA的信息、并將其翻譯成數字存儲模式后,該系統(tǒng)顯示的出錯率為每百萬比特僅兩個錯誤,相當于一些小小的拼寫錯誤。這同DVD的性能差不多,遠遠好過硬盤。本周五,該團隊在《科學》雜志上發(fā)布的報告稱,考慮到DNA芯片的體積非常小,它成為了目前世界上最密集的信息存儲介質。
不過,你最好別急著將閃存上的數據復制到基因存儲上。美國馬里蘭州羅克維爾市克雷格-文特爾研究所的合成生物學家丹尼爾-吉布森(Daniel Gibson)表示,DNA測序儀和其他設備的成本相當高,目前還不適宜推廣,但是這一領域發(fā)展迅速,這項科技將會變得更便宜、更快速和更輕便。吉布森過去領導的研究團隊曾合成了世界上第一個最完整的基因組,并在DNA中加入了一些額外的信息作為“水印”。不過,這些研究人員使用的是三個字母的編碼系統(tǒng),要比丘奇團隊的效率低一些,但是卻成功阻止了活體細胞的復制,從而不會將DNA轉換為蛋白質。吉布森說,“如果DNA要被用來存儲信息,并且使用環(huán)境不在實驗室里,那么你還需要DNA測序儀的幫助,而這是很不現實的。”丘奇不同意這種觀點。他表示,除非某人有意識的“破壞”他的DNA數據存儲系統(tǒng),否則信息將非常安全。