РЭКЛЯМА

ДНК як носьбіт для захоўвання велізарных камп'ютэрных дадзеных: рэальнасць вельмі хутка?

Прарыўнае даследаванне робіць значны крок наперад у пошуках распрацоўкі a ДНК-сістэма захоўвання лічбавых даных.

Лічбавы gegevens сёння расце з экспанентнай хуткасцю з-за нашай залежнасці ад гаджэтаў і патрабуе надзейнага доўгатэрміновага захоўвання. Захоўванне даных паступова становіцца складанай задачай, таму што сучасная лічбавая тэхналогія не можа даць рашэнне. Напрыклад, за апошнія два гады было створана больш лічбавых дадзеных, чым за ўсю гісторыю кампутары, насамрэч кожны дзень у свеце ствараецца 2.5 квінтыльёна байт {1 квінтыльён байт = 2,500,000 2,500,000,000 XNUMX тэрабайт (ТБ) = XNUMX XNUMX XNUMX XNUMX гігабайт (ГБ)} даных. Сюды ўваходзяць даныя на сайтах сацыяльных сетак, анлайн-банкаўскія аперацыі, запісы кампаній і арганізацый, даныя са спадарожнікаў, назіранне, даследаванні, распрацоўкі і г. д. Гэтыя даныя велізарныя і неструктураваныя. Такім чынам, у цяперашні час гэта вялікая праблема, каб справіцца з вялікімі патрабаваннямі да сховішча для дадзеных і іх экспанентным ростам, асабліва для арганізацый і карпарацый, якім патрабуецца надзейнае доўгатэрміновае захоўванне.

У цяперашні час даступныя варыянты: жорсткі дыск, аптычныя дыскі (CD), карты памяці, флэш-назапашвальнікі, а таксама больш дасканалыя магнітафонныя стужкі або аптычныя дыскі BluRay, якія захоўваюць прыкладна да 10 тэрабайт (ТБ) дадзеных. Такія назапашвальнікі, хоць і выкарыстоўваюцца звычайна, маюць шмат недахопаў. Па-першае, яны маюць нізкі і сярэдні тэрмін прыдатнасці, і яны павінны захоўвацца пры ідэальнай тэмпературы і вільготнасці, каб яны маглі праслужыць шмат дзесяцігоддзяў і, такім чынам, патрабуюць спецыяльна распрацаваных фізічных памяшканняў для захоўвання. Амаль усе яны спажываюць шмат энергіі, грувасткія і непрактычныя і могуць быць пашкоджаны пры простым падзенні. Некаторыя з іх вельмі дарагія, часта пакутуюць ад памылак дадзеных і, такім чынам, недастаткова надзейныя. Варыянт, які быў агульнапрыняты арганізацыяй, называецца воблачнымі вылічэннямі - дамоўленасць, пры якой кампанія ў асноўным наймае «звонкі» сервер для апрацоўкі ўсіх сваіх патрабаванняў да ІТ і захоўвання дадзеных, які называюць «воблака». Адным з асноўных недахопаў воблачных вылічэнняў з'яўляюцца праблемы бяспекі і канфідэнцыяльнасці, а таксама ўразлівасць перад хакерамі. Ёсць таксама іншыя праблемы, такія як высокія выдаткі, абмежаваны кантроль з боку бацькоўскай арганізацыі і залежнасць ад платформы. Воблачныя вылічэнні па-ранейшаму лічацца добрай альтэрнатывай для доўгатэрміновага захоўвання. Тым не менш, падобна, што лічбавая інфармацыя, якая ствараецца ва ўсім свеце, безумоўна, абганяе нашу здольнасць захоўваць яе, і неабходныя яшчэ больш надзейныя рашэнні, каб задаволіць гэты патоп дадзеных, забяспечваючы пры гэтым маштабаванасць з улікам будучых патрэбаў у сховішчы.

Ці можа ДНК дапамагчы ў сховішчы кампутара?

Наш ДНК (Дэзаксірыбануклеінавая кіслата) разглядаецца як захапляльны альтэрнатыўны сродак для захоўвання лічбавых дадзеных. ДНК гэта матэрыял, які самаўзнаўляецца, прысутны амаль ва ўсіх жывых арганізмах і складае нашу генетычную інфармацыю. Штучны або сінтэтычны ДНК з'яўляецца трывалым матэрыялам, які можа быць выраблены з выкарыстаннем камерцыйна даступных машын для сінтэзу алігануклеатыдаў. Асноўнай перавагай ДНК з'яўляецца яе даўгавечнасць ДНК служыць у 1000 разоў даўжэй, чым крэмній (крэмніевы чып - матэрыял, які выкарыстоўваецца для будаўніцтва кампутары). Дзіўна, толькі адзін кубічны міліметр ДНК можа змяшчаць квінтыльён байт дадзеных! ДНК таксама з'яўляецца звышкампактным матэрыялам, які ніколі не псуецца і можа захоўвацца ў прахалодным сухім месцы на працягу сотняў стагоддзяў. Ідэя выкарыстання ДНК для захоўвання існуе ўжо даўно, яшчэ ў 1994 годзе. Асноўная прычына ў тым, што інфармацыя захоўваецца ў камп'ютары і ў нашых ДНК – паколькі абодва захоўваюць чарцяжы інфармацыі. Камп'ютар захоўвае ўсе дадзеныя як 0 і 1, а ДНК захоўвае ўсе дадзеныя жывога арганізма, выкарыстоўваючы чатыры асновы - тымін (T), гуанін (G), адэнін (A) і цытазін (C). Такім чынам, ДНК можна было б назваць стандартным назапашвальнікам, як і кампутар, калі гэтыя асновы можна прадставіць як 0 (асновы A і C) і 1 (асновы T і G). ДНК трывалая і даўгавечная, самае простае адлюстраванне заключаецца ў тым, што наш генетычны код - схема ўсёй нашай інфармацыі, якая захоўваецца ў ДНК - эфектыўна перадаецца ад аднаго пакалення да наступнага шматразовым спосабам. Усе гіганты праграмнага і апаратнага забеспячэння імкнуцца выкарыстоўваць сінтэтычную ДНК для захоўвання велізарных аб'ёмаў, каб дасягнуць сваёй мэты па рашэнні доўгатэрміновага архівавання даных. Ідэя заключаецца ў тым, каб спачатку пераўтварыць камп'ютэрны код 0 і 1 у код ДНК (A, C, T, G), затым пераўтвораны код ДНК выкарыстоўваецца для атрымання сінтэтычных ланцугоў ДНК, якія потым можна змясціць у халоднае захоўванне. Кожны раз, калі патрабуецца, ланцужкі ДНК можна выняць з халоднага сховішча, а іх інфармацыю расшыфраваць з дапамогай машыны для секвенавання ДНК, і паслядоўнасць ДНК, нарэшце, перакладаецца назад у двайковы кампутарны фармат 1 і 0 для чытання на кампутары.

Гэта было паказана1 што ўсяго некалькі грамаў ДНК могуць захоўваць квінтыльёны байтаў дадзеных і захоўваць іх некранутымі да 2000 гадоў. Аднак гэта простае разуменне сутыкнулася з некаторымі праблемамі. Па-першае, гэта даволі дорага і таксама вельмі павольна запісваць дадзеныя ў ДНК, гэта значыць фактычнае пераўтварэнне 0 і 1 у асновы ДНК (A, T, C, G). Па-другое, пасля таго, як дадзеныя «запісаны» на ДНК, знайсці і атрымаць файлы становіцца складана, і патрабуецца тэхніка, званая ДНК секвеніраванне - працэс вызначэння дакладнага парадку асноў у а ДНК малекула -пасля чаго дадзеныя дэкадуюцца назад у 0 і 1 с.

Нядаўняе даследаванне2 навукоўцы з Microsoft Research і Універсітэта Вашынгтона дасягнулі «выпадковага доступу» да захоўвання ДНК. Аспект «выпадковага доступу» вельмі важны, таму што гэта азначае, што інфармацыя можа быць перададзена ў або з месца (як правіла, памяць), у якім кожнае месца, незалежна ад таго, дзе ў паслядоўнасці, і можа быць даступны непасрэдна. Выкарыстоўваючы гэтую тэхніку выпадковага доступу, файлы можна здабываць са сховішча ДНК выбарча ў параўнанні з ранейшым спосабам, калі для такога пошуку патрабавалася паслядоўнасць і дэкадаванне цэлага набору дадзеных ДНК, каб знайсці і выцягнуць некалькі патрэбных файлаў. Важнасць «выпадковага доступу» яшчэ больш узрастае, калі аб'ём дадзеных павялічваецца і становіцца велізарным, так як ён памяншае колькасць паслядоўнасці, якую неабходна выканаць. Гэта ўпершыню ў гісторыі выпадковы доступ быў паказаны ў такім вялікім маштабе. Даследчыкі таксама распрацавалі алгарытм для больш эфектыўнага дэкадавання і аднаўлення дадзеных з большай талерантнасцю да памылак дадзеных, што робіць працэдуру паслядоўнасці таксама хутчэйшай. У гэтым даследаванні было закадавана больш за 13 мільёнаў сінтэтычных алігануклеатыдаў ДНК, якія ўяўляюць сабой дадзеныя памерам 200 МБ, якія складаюцца з 35 файлаў (змяшчаюць відэа, аўдыё, выявы і тэкст) памерам ад 29 КБ да 44 МБ. Гэтыя файлы былі атрыманы асобна без памылак. Акрамя таго, аўтары распрацавалі новыя алгарытмы, якія з'яўляюцца больш надзейнымі і талерантнымі да памылак пры запісе і чытанні паслядоўнасцяў ДНК. Гэта даследаванне апублікавана ў Nature Biotechnology у буйным прагрэсе, які паказвае жыццяздольную, маштабную сістэму для захоўвання і пошуку ДНК.

Сістэма захавання ДНК выглядае вельмі прывабна, таму што яна мае высокую шчыльнасць даных, высокую стабільнасць і яе лёгка захоўваць, але перад яе паўсюдным прыняццем, відавочна, паўстала шмат праблем. Нешматлікія фактары - гэта час і працаёмкае расшыфроўка ДНК (секвеніраванне), а таксама сінтэз ДНК. Тэхніка патрабуе большай дакладнасці і шырэйшага ахопу. Нават калі ў гэтай галіне былі дасягнуты поспехі, дакладны фармат, у якім даныя будуць захоўвацца ў доўгатэрміновай перспектыве, як ДНК усё яшчэ развіваецца. Microsoft паабяцала палепшыць вытворчасць сінтэтычнай ДНК і вырашыць праблемы для распрацоўкі цалкам працаздольнай ДНК Сістэма захоўвання да 2020 года.

***

{Вы можаце прачытаць арыгінальную даследчую працу, націснуўшы на спасылку DOI, прыведзены ніжэй у спісе цытуемых крыніц}

Крыніца (я)

1. Erlich Y and Zielinski D 2017. DNA Fountain забяспечвае надзейную і эфектыўную архітэктуру захоўвання. Навука. 355 (6328). https://doi.org/10.1126/science.aaj2038

2. Organick L і соавт. 2018. Выпадковы доступ у буйнамаштабным сховішчы дадзеных ДНК. Прырода Біятэхналогіі. 36. https://doi.org/10.1038/nbt.4079

Каманда SCIEU
Каманда SCIEUhttps://www.ScientificEuropean.co.uk
Scientific European® | SCIEU.com | Значныя поспехі ў навуцы. Ўздзеянне на чалавецтва. Натхняюць розумы.

Падпішыцеся на нашу рассылку

Каб быць у курсе ўсіх апошніх навін, прапаноў і спецыяльных аб'яў.

Самыя папулярныя артыкулы

У Паўднёвай Афрыцы ўпершыню знойдзены выкапні найбуйнейшага дыназаўра

Навукоўцы раскапалі найбуйнейшую закамянеласць дыназаўра, якая...

COVID-19: Ацэнка імунітэту статка і абароны ад вакцын

Статак імунітэт да COVID-19, як кажуць, дасягнуты...
- Рэклама -
94,443Вентылятарыяк
47,678паслядоўнікіпрытрымлівацца
1,772паслядоўнікіпрытрымлівацца
30падпісчыкіпадпісвацца