Генетика + кибернетика = 739 килобайт на молекуле ДНК
Журнал «Nature» опубликовал статью об исследовании, проведенном британским специалистом по биоинформатике доктором Ником Голдменом и его коллегами. Команда Голдмена разработала методику, позволяющую записывать любую цифровую информацию и хранить ее в виде молекулы дезоксирибонуклеиновой кислоты (ДНК), что обеспечивает практически вечную сохранность данных. На одну молекулу синтетической ДНК ученые записали 739 Кб различной информации, а затем смогли считать ее со 100%-ной точностью и аккуратностью.
Вот, что вместилось у исследователей на одну молекулу кислоты: все сонеты Шекспира в одном текстовом файле, статья об открытии двойной спирали ДНК в формате PDF, аудиофрагмент речи Мартина Лютера Кинга, а также цветная фотография в формате JPEG.
Первые фрагменты цифровой информации были сохранены в молекуле нуклеиновой кислоты в 1988 году. Тогда это было дорого и сложно, в общем, непрактично. Даже в недавнем 2012 году стоимость и длительность процесса записи и чтения с ДНК оправдывали себя лишь в случае создания архива со сроком хранения 100 лет. Вновь презентованный метод позволяет окупать молекулярные архивы с 50-летней гарантией уже в первые десять лет.
Хранение цифровой информации, которой становится только больше, — одна из мировых компьютерных проблем. Количество данных удваивается на планете каждые два года. Нужны они или нет — другой вопрос. Ожидается, что в 2020 году на Земле будет храниться около 40 триллионов гигабайт цифровой информации. Вместе с тем, физические размеры носителей год от года минимизируются. То есть, хоть хранение и проблема, но разрешимая. Сложнее то, что цифровые системы приходится постоянно обновлять, т.к. ни один из носителей информации нельзя считать совершенно надежным. Каждый перенос информации сопровождается потерями, а что-то важное, записанное когда-то на дискету, нынешний компьютер физически не может распознать. Задачу о долговременной совместимости носителя и устройства может решить применение для хранения данных синтетических ДНК.
Если ученым удается прочитать наследственный код пещерного человека, жившего в докомпьютерную эпоху сотни тысяч лет назад, значит, и храниться будут данные на ДНК в «цифре» столько лет, сколько надо. Теоретически, в одном грамме нуклеиновой кислоты можно уместить 455 миллиардов Гб информации. Все фильмы мира — в одной пробирке. Считывать и размножать такие данные можно очень часто, притом без потерь.
Доктор Голдмен и его команда в чем-то поступили также, как их предшественники. Данные записаны на нуклеотиды, и считываются с них. Однако в новом случае оказалось возможным использовать ДНК именно как «дискету».
Каждый файл в компьютере — это последовать нулей и единиц. Для хранения той или иной информации используются кодировки. Например, в молекуле ДНК азотистые основания аденин, гуанин, цитозин и тимин обозначаются как A, G, C, T. А запись буквы «Т» будет следующей последовательностью: ТAGAT. Слово «Thou» в шекспировском сонете, в таком случае, кодируется так: TAGATGTGTACAGACTACGC. Аналогично кодировщик поступает с двоичным кодом звуковых, графических и прочих файлов.
Пока что скорость записи и чтения с/на ДНК ощутимо уступает привычным цифровым носителям, однако лиха ведь беда начало. Глядишь, и компьютерным вирусом можно будет в буквальном смысле заразиться.