Криптологи компании Microsoft разработали алгоритм шифрования последовательностей ДНК, который позволяет анализировать их традиционными биоинформатическими методами и при этом не дает скомпроментировать обладателя генома. Технология была представлена на конференции Американского научного общества AAAS, кратко о ней пишет Science.
Технология превращает последовательность ДНК в гомоморфную криптосистему. Суть такой системы заключается в том, что пользователь может манипулировать данными, не расшифровывая их. При этом результат манипуляции после расшифровки окажется таким же, как если бы манипуляции проводились с незакодированной информацией.
Впервые подобная система была представлена в 2009 году компанией IBM. Она построена на базе математических решеток — решеткой в n-мерном векторном пространстве называется множество линейных комбинаций с целочисленными коэффициентами векторов из фиксированного базиса. Для нужд криптографии используются задачи нахождения вектора минимальной длины по заданному базису и задачи нахождения вектора решетки, ближайшего к некоторому произвольному вектору в пространстве. Эти задачи сложно решить, однако, проверить уже имеющееся решение достаточно просто. Такая односторонняя сложность обеспечивает криптографическую устойчивость алгоритмов.
Работа с гомоморфно-закодированной информацией требует гораздо больших вычислительных мощностей, чем манипуляции с открытыми последовательностями. Поэтому, чтобы сделать систему практически применимой, ученым пришлось изменить чисто гомоморфный алгоритм и пожертвовать гибкостью вычислений в пользу их скорости. В качестве примера применимости, авторы утверждают, что им удалось с помощью обычного персонального компьютера рассчитать риск инфаркта на основе генетической информации пациента всего за 0,2 секунды. Впрочем, характер использованной генетической информации в сообщении Science не уточнен.
Сейчас в массовых генетических исследованиях используются анонимные, но открытые последовательности ДНК. В начале 2013 года Янив Эрлих (Yaniv Erlich) из Биомедицинского института Уайтхеда в Кембридже показал, что на основе открытых генетических данных можно установить личности людей, которым она принадлежит. Следует отметить, что это стало возможным из-за того, что данные о гаплотипе, а также о происхождении, возрасте и месте жизни тех, кого удалось деанонимизировать Эрлиху, были публично официально публично доступны.