ДНК сможет сохранить всю информацию человечества

07.03.2017 | Наука и непознанное 01502

У человечества намечается огромная проблема с хранением данных. За последние два года люди создали больше информации, чем за всю предыдущую историю. И этот поток информации скоро превзойдет вместимость жестких дисков.

Исследователи сообщают, что нашли новый способ кодировать цифровую информацию в ДНК. В одном грамме ДНК можно хранить 215 петабайтов (215 млн гигабайтов) данных. Таким образом, вся информация, когда-либо созданная человеком, будет занимать контейнер размером с пару грузовиков.

ДНК имеет много преимуществ для хранения цифровой информации. Она ультракомпактна и может храниться тысячи лет в прохладном сухом месте. И люди всегда смогут расшифровать ее. «ДНК не деградирует со временем, как кассеты или диски, и не устареет», — говорит Янив Эрлих, ученый из Колумбийского университета (США).

Ученые сохраняют цифровую информацию в ДНК с 2012 года.Тогда генетики из Гарвардского университета (США) Джордж Черч, Сри Косури и их коллеги зашифровали книгу из 52 тысяч слов в тысячи фрагментов ДНК, используя нити из четырехбуквенного алфавита — A, G, T и C, чтобы закодировать нули и единицы оцифрованного файла.

Эта система шифрования была относительно неэффективной и могла хранить только 1,28 петабайта на грамм ДНК. Другие подходы сработали лучше. Но ни одна не позволила ДНК сохранить более половины ее максимальной вместимости. ДНК может выдержать около 1,8 бита на нуклеотид ДНК (число не достигает 2 бит из-за редких, но неизбежных ошибок чтения и записи).u

Эрлих решил, что он подойдет ближе к этому лимиту. Поэтому он и Дина Зилински обратились к алгоритмам, которые были использованы для шифровки и расшифровки информации. Они начали с 6 файлов, которые включали полную компьютерную операционную систему, компьютерный вирус, французский фильм 1895 года под названием «Прибытие поезда на вокзал Ла-Сьота» и исследование 1948 года теоретика Клода Шэннона. Сперва ученые конвертировали файлы в двоичные цепочки единиц и нулей, сжали их в один базовый файл, а потом разделили данные на короткие цепочки бинарного кода. Они разработали алгоритм под названием «Фонтан ДНК», который в случайном порядке упаковывает цепочки в так называемые «капли». К ним исследователи добавили дополнительные теги, чтобы пересобрать их позже в правильном порядке. Всего ученые сгенерировали цифровой список из 72 тысяч цепочек ДНК, каждая 200 знаков в длину.

Они послали их в виде текстовых файлов в стартап «Твист Биосайенс» в Калифорнии, где синтезировали нити ДНК. Спустя две недели Эрлих и Зилински получили по почте ампулу с частичкой ДНК, в которой были зашифрованы их файлы. Чтобы расшифровать их, ученые использовали современную технологию секвенирования ДНК. Секвенции были отправлены в компьютер, который перевел генетический код снова в бинарный и использовал тэги, чтобы вновь собрать шесть оригинальных файлов. Технология сработала так хорошо, что новые файлы не содержали ошибок.

Однако Косури и Эрлих отметили, что новый подход не готов к масштабному использованию. Они потратили 7 тысяч долларов, чтобы синтезировать 2 мегабайта информации в файлы, и еще 2 тысячи долларов, чтобы ее прочитать. По сравнению с другими формами хранения данных, запись и чтение с ДНК относительно медленные.

Источник: www.gismeteo.ru

Подпишитесь на канал Русских Вестей в Телеграме

Все вести раздела