La DNA Data Storage Alliance presentó sus especificaciones inaugurales para Almacenamiento de datos basado en ADN esta semana. Esta especificación describe un método para codificar información esencial dentro de un archivo de datos de ADN, crucial para desarrollar y comercializar un ecosistema de almacenamiento interoperable.
El almacenamiento de datos de ADN utiliza cadenas cortas de ácido desoxirribonucleico (ADN) llamadas oligonucleótidos (oligos) mezcladas entre sí sin un esquema de ordenamiento físico específico. Este medio de almacenamiento carece de un controlador dedicado y de un medio organizativo para comprender la proximidad de un subcomponente del medio a otro. El almacenamiento de ADN difiere significativamente de los medios tradicionales como cinta, HDD y SSD, que tienen estructuras fijas y controladores que pueden leer y escribir datos de los medios estructurados. La falta de estructura física del ADN requiere un enfoque único para iniciar la recuperación de datos, lo que conlleva sus peculiaridades en cuanto a estandarización.
Para abordar esto, el grupo de trabajo SNIA DNA Archive Rosetta Stone (DARS), parte de DNA Data Storage Alliance, ha desarrollado dos especificaciones, Sector Zero y Sector One, para facilitar el proceso de inicio de un archivo de ADN.
Sector Cero sirve como punto de partida, proporcionando los detalles mínimos necesarios para que el lector del archivo identifique la entidad responsable de sintetizar el ADN (por ejemplo, Dell, Microsoft, Twist Bioscience) y el CODEC utilizado para codificar el Sector Uno (por ejemplo, Super Codec, Hyper Codec, Códec de Jimbob). Sector Zero consta de 70 bases: las primeras 35 bases identifican al proveedor y las segundas 35 bases identifican el códec. La información del Sector Cero permite el acceso y la decodificación de los datos almacenados en el Sector Uno. La cantidad de datos almacenados en SZ es pequeña y cabe en un único oligonucleótido.
Sector uno amplía esto al incluir una descripción del contenido, una tabla de archivos y los parámetros necesarios para transferir datos a un secuenciador. Esta especificación garantiza que el cuerpo principal del archivo sea accesible y legible, allanando el camino para la recuperación de datos. El Sector Uno contiene exactamente 150 bases y abarcará múltiples oligonucleótidos.
«Un objetivo clave de DNA Data Storage Alliance es establecer y publicar especificaciones y estándares que permitan que crezca un ecosistema interoperable de almacenamiento de datos de ADN.» dijo Dave Landsman, de la junta directiva de DNA Data Storage Alliance. «Con la publicación de las primeras especificaciones de la Alianza, damos un paso importante para lograr ese objetivo. Sector Zero y Sector One ahora están disponibles públicamente, lo que permite a las empresas que trabajan en el espacio adoptarlos e implementarlos.«
La DNA Data Storage Alliance está dirigida por Catalog Technologies, Inc., Quantum Corporation, Twist Bioscience Corporation y Western Digital (aunque no estamos seguros de si la división NAND o HDD de Western Digital es responsable del desarrollo de la especificación). Mientras tanto, numerosos gigantes de la industria, incluido Microsoft, apoyan la DNA Data Storage Alliance.
Fuente: SNIA