Le stockage d’information sur ADN est une technologie émergente qui constitue une solution durable (quelques dizaines de milliers d’années), à faible impact énergétique et extrêmement compacte [Church12]. Le stockage d’informations numériques sur ADN a été pour l’instant effectué sur des pools d’oligonucléotides synthétisés, stockés et lus in vitro. Alors que cette méthodologie s’est révélée utile pour démontrer la faisabilité du stockage numérique sur ADN, elle présente de nombreuses limitations. Afin de lever ces limitations et de développer des systèmes de stockage sur ADN plus performants, nous développons des solutions d’archivage originale in vivo, en rupture avec les technologies existantes.
Ce stage est financé par Sorbonne Université dans le cadre du projet émergence DNA SYSTEM et s’effectuera en collaboration avec deux équipes de recherche en informatique (BD et DELYS) et deux équipes en biologie (Z. Xu et S. Lemaire) qui développent de nouvelles techniques pour le stockage et la manipulation de l’information numérique sur ADN. Ce stage implique également des interactions fortes entre ces différentes équipes.
Ce stage de master visera à poursuivre ces travaux en étudiant le problème d’encodage et de décodage de séquences binaires 0/1 en séquences DNA ACGT avec des propriétés particulières, intégrées dans le support physique. Cet encodage doit être biocompatible et biosécurisé et permettre la manipulation (copie, édition, lecture, écriture) de longs fragments d’ADN in vivo et in vitro. Il existe déjà un algorithme de biocompatibilité qui utilise un encodage flexible Church-Gao-Kosuri (0=A=C ; 1=T=G) et permet de moduler des séquences afin qu’elles satisfassent des contraintes spécifiques comme par exemple :
[Church12] Church, G. M., Gao, Y., & Kosuri, S. (2012). Next-generation digital information storage in DNA. Science, 337(6102), 1628-1628.
[Tulpan06]Tulpan, D. C. (2006). Effective heuristic methods for DNA strand design (Doctoral dissertation, University of British Columbia).