DNA數(shù)據(jù)存儲(chǔ)系統(tǒng)使用微膠囊來減少錯(cuò)誤和損失
2023-05-10 11:04:25 | 來源:cnBeta | 編輯: |
2023-05-10 11:04:25 | 來源:cnBeta | 編輯: |
未來的數(shù)據(jù)中心可能會(huì)取消硬盤庫,轉(zhuǎn)而使用大自然已經(jīng)使用了數(shù)十億年的存儲(chǔ)介質(zhì)--DNA。在使之成為現(xiàn)實(shí)的一個(gè)重要步驟中,科學(xué)家們已經(jīng)創(chuàng)建了一個(gè)使用微膠囊讀取和組織文件的新系統(tǒng)。
像人類建造的許多東西一樣,大自然在數(shù)據(jù)存儲(chǔ)方面擊敗了我們,它的系統(tǒng)大大優(yōu)于我們能想出的任何東西。DNA以令人難以置信的密度包裝信息--一克這種東西可以容納215PB,或2.15億GB的數(shù)據(jù),這意味著互聯(lián)網(wǎng)目前生成的全部內(nèi)容都可以保存在一個(gè)裝滿DNA的鞋盒里。最近的工作甚至發(fā)現(xiàn)了通過在字母湯中添加新的字母來使數(shù)據(jù)密度翻倍的方法。
此外,DNA的數(shù)據(jù)保存可以是非常持久的。我們目前的硬件往往會(huì)在幾十年內(nèi)退化,但在適當(dāng)?shù)臈l件下,DNA有可能被保存數(shù)百萬年。最后,它需要更少的能源來維護(hù),減少大規(guī)模數(shù)據(jù)中心的電費(fèi)。
但當(dāng)然,也有一個(gè)問題。將數(shù)據(jù)寫入DNA并將其讀回是復(fù)雜而昂貴的過程,可能會(huì)損壞DNA本身并帶來錯(cuò)誤。但現(xiàn)在一項(xiàng)新的突破可能有助于使整個(gè)系統(tǒng)更加實(shí)用。
目前,從DNA中檢索數(shù)據(jù)是通過一種叫做聚合酶鏈?zhǔn)椒磻?yīng)(PCR)的技術(shù)完成的。含有數(shù)據(jù)的DNA鏈都在一種湯中自由游動(dòng),每條鏈都有一個(gè)特定的序列標(biāo)記,就像一個(gè)文件名。當(dāng)你需要某個(gè)文件時(shí),一個(gè)匹配的引物被用來搜索湯,并附著到所需的DNA鏈上。然后這個(gè)DNA被復(fù)制數(shù)百萬次,以便系統(tǒng)能夠找到它并讀取文件。問題是,每次讀取時(shí)都會(huì)使原始數(shù)據(jù)退化,而且一次讀取多個(gè)文件變得很困難。
為了解決這個(gè)問題,研究人員將DNA包裹在由蛋白質(zhì)和聚合物制成的微膠囊中,每個(gè)膠囊中都有一個(gè)文件被固定。當(dāng)加熱到50°C(122°F)以上時(shí),膠囊將自己密封起來,因此PCR復(fù)制只能單獨(dú)影響每個(gè)文件。當(dāng)溫度再次降低時(shí),副本脫離,而原始文件仍被固定。
這意味著原始文件的質(zhì)量不會(huì)隨著每次讀取而降低,大大減少了錯(cuò)誤。該團(tuán)隊(duì)表示,該系統(tǒng)可以同時(shí)讀取多達(dá)25個(gè)文件,并且在三次讀取后僅損失0.3%的文件,而不是現(xiàn)有方法的35%。
為了使該系統(tǒng)更容易搜索,科學(xué)家們給每個(gè)文件貼上了熒光標(biāo)簽,每個(gè)膠囊都有自己的顏色,使數(shù)據(jù)可以被分類、分離和排序。最終,該團(tuán)隊(duì)設(shè)想了一個(gè)數(shù)據(jù)中心,在這個(gè)中心,信息被編碼到一個(gè)區(qū)域的DNA上,而機(jī)器人手臂可以選擇單個(gè)膠囊,讀取數(shù)據(jù)并將其放回。
"現(xiàn)在只是等待,直到DNA合成的成本進(jìn)一步下降,"該研究的主要作者Tom de Greef說。"然后這項(xiàng)技術(shù)就可以應(yīng)用了"。