Молекулы ДНК могут стать надежной и емкой альтернативой жестким дискам в качестве накопителей для хранения фотографий. В Федеральной политехнической школе Лозанны (EPFL) ведется работа над новым стандартом сжатия изображений, специально предназначенным для этой перспективной технологии.
Уже через несколько лет человечество будет делать более двух триллионов фото ежегодно. Часть из них останется на смартфонах, но большинство будет храниться в облаке, заполняя жесткие диски дата-центров. Однако у этих систем есть ограничения по объему данных и сроку их хранения, не говоря уже о влиянии на окружающую среду, передает naukatv.ru
Одной из альтернатив может стать хранение изображений в ДНК.
«По нашим оценкам, один грамм ДНК способен вместить около 215 миллионов гигабайт данных. Это эквивалентно 860 000 внешним жестким дискам емкостью 250 Гб с примерно 50 000 фотографий на каждом», — говорит профессор Турадж Эбрахими, возглавляющий в EPFL группу обработки мультимедиа.
Тысячи лет хранения
ДНК содержит всю информацию, необходимую организмам для жизни, роста и размножения. И она может хранить эти данные очень долго. В 2022 году ученые обнаружили ДНК во льдах Гренландии возрастом два миллиона лет.
Сегодня благодаря прогрессу в секвенировании и синтезе ДНК ученые могут читать и записывать этот «код жизни». Цепочки ДНК кодируют генетическую информацию с помощью последовательностей четырех нуклеотидов: аденина (A), тимина (T), цитозина (C) и гуанина (G).
Первый шаг для записи данных в ДНК— преобразование бинарного формата (0, 1) в последовательности нуклеотидов A, T, C, G. Затем их соединяют в цепочки ДНК и хранят в подходящих условиях. Когда приходит время прочитать данные, процесс повторяют в обратном порядке.
JPEG DNA — стандарт нового поколения
Этот подход обладает огромным потенциалом для долгосрочного архивирования, но есть и препятствия. Одно из них — высокая стоимость, другое — большое время, необходимое для сохранения и воспроизведения данных. Однако и преимущества велики: высокая плотность записи, долгий срок службы и низкое энергопотребление.
С 2014 года Эбрахими возглавляет Объединенную группу экспертов по фотографии JPEG (Joint Photographic Experts Group) и прилагает значительные усилия, чтобы идти в ногу со временем. Стандарт JPEG DNA — его последний масштабный проект.
«Это настоящий вызов — точно воссоздать изображения после их кодирования, синтеза, хранения, амплификации и секвенирования. Но с общепринятым стандартом инженеры смогут разрабатывать эффективные методы кодирования и сжатия изображений», — уверен профессор.
Его исследовательская группа разработала процедуру кодирования для оценки различных методов хранения на основе ДНК. Она включает набор эталонных изображений для тестирования, критерии сравнения методов, механизмы коррекции ошибок и техники работы с биохимическими ограничениями, такими как частота и порядок символов ДНК, которые могут дестабилизировать цепочки.
Кодирование для ДНК
Для работы с особенно большими мультимедийными файлами подготовлен новый алгоритм сжатия изображений, эффективно преобразующий бинарные данные в последовательности ДНК. Фото в формате .jpg не требуют предварительного декодирования. Их алгоритм не только быстр и надежен, но и требует меньше синтетической ДНК, вычислительных ресурсов и обеспечивает лучшее визуальное качество.
Инженеры EPFL совместно с комитетом JPEG интегрировали в стандарт JPEG DNA как исходный код (для сжатия изображений), так и кодирование для зашумленных каналов (чтобы сделать программу устойчивее к ошибкам и адаптировать ее к биохимическим ограничениям ДНК).
«Благодаря последним достижениям в области искусственного интеллекта и машинного обучения мы сможем усовершенствовать стандарт JPEG DNA, улучшив механизмы кодирования и коррекции ошибок, сохранив их совместимость с синтаксисом стандарта и процедурой декодирования», — заключил исследователь.
Комитет JPEG планирует представить международный стандарт JPEG DNA в 2026 году, он уже экспонируется в швейцарском павильоне на Всемирной выставке в Осаке.