在大數(shù)據(jù)時代,全球數(shù)據(jù)量呈指數(shù)級增長,海量數(shù)據(jù)是AI解鎖大模型的鑰匙。當(dāng)前,硬盤、磁帶、U盤等硅基存儲介質(zhì)存在壽命短、能耗高、占用空間大等問題,難以滿足日益增長的數(shù)據(jù)存儲需求。

DNA作為天然的數(shù)據(jù)信息編碼存儲材料,因高密度、長壽命、低能耗等優(yōu)點,成為具有潛力的解決大數(shù)據(jù)存儲困境的替代方案。但是,多數(shù)DNA數(shù)據(jù)存儲技術(shù)采用類似雕版印刷的設(shè)計策略,存儲用DNA使用一次、合成一次,合成成本高,耗時長,限制了DNA存儲技術(shù)的實際應(yīng)用。

為突破現(xiàn)有DNA存儲技術(shù)的應(yīng)用瓶頸,中國科學(xué)院北京基因組研究所(國家生物信息中心)陳非團隊、計算技術(shù)研究所譚光明和卜東波團隊以及中科計算技術(shù)西部研究院段勃團隊,借鑒我國古代四大發(fā)明之活字印刷術(shù)的邏輯,提出了經(jīng)濟高效的DNA活字存儲設(shè)計思路。它的核心是DNA活字,由預(yù)制的20nt短雙鏈DNA片段構(gòu)成,可編碼1字節(jié)的內(nèi)容、地址或校驗數(shù)據(jù)信息,且每個片段兩端帶有4nt的粘性末端,通過一步多級酶連技術(shù)形成DNA活字塊。這些活字塊可通過活字塊兩端的限制性酶切位點克隆到質(zhì)粒中直接體外保存,亦可通過轉(zhuǎn)化大腸桿菌體內(nèi)保存。

進一步,為實現(xiàn)DNA活字存儲流程自動化,該團隊研發(fā)了可實現(xiàn)DNA活字高通量打印寫入的設(shè)備——DNA活字噴墨打印機“畢昇一號”?!爱厱N一號”可以打印存儲并100%精準(zhǔn)解碼文本、圖片、音頻和視頻等類型的計算機數(shù)據(jù)存儲文件。

類似于活字印刷的復(fù)用性和靈活性,上述DNA活字存儲技術(shù)展現(xiàn)出成本和效率優(yōu)勢。這一成果為DNA數(shù)據(jù)存儲技術(shù)的未來發(fā)展提供了新的思考范式。

相關(guān)研究成果作為封面文章發(fā)表在《先進科學(xué)》(Advanced Science)上。研究工作得到國家重點研發(fā)計劃和國家自然科學(xué)基金等的支持。

論文鏈接

科研人員研發(fā)出DNA數(shù)據(jù)活字存儲打印系統(tǒng)-肽度TIMEDOO

DNA活字存儲流程圖

來源:中科院