A medida que el aumento drástico en los precios de las memorias flash y los volúmenes masivos de datos amenazan las iniciativas de Inteligencia Artificial, surgen arquitecturas de datos autónomas y de múltiples niveles junto con el archivo basado en ADN para estabilizar la infraestructura empresarial.

La rápida integración de la Inteligencia Artificial (IA) en el entorno empresarial ha expuesto un desajuste fundamental entre las cargas de trabajo computacionales modernas y las arquitecturas de almacenamiento heredadas. Durante décadas, la infraestructura de datos corporativa se acumuló de forma incremental, construida proyecto por proyecto para resolver necesidades inmediatas. Hoy en día, las demandas simultáneas de rendimiento de IA, ciberresiliencia y soberanía de datos han saturado estos entornos aislados. Con los precios de la memoria flash cuadruplicados y proyecciones de mayores incrementos, el enfoque tradicional de adquirir productos de almacenamiento específicos más rápidos o económicos ha alcanzado sus límites económicos y físicos, forzando una reevaluación de los modelos operativos de infraestructura de datos.

En el núcleo de la actual tensión de la infraestructura se encuentra la constatación de que la IA no representa un caso de uso único y uniforme. Por el contrario, abarca un amplio espectro operativo. En un extremo, la ejecución de Modelos de Lenguaje Grandes (LLM) requiere una utilización extrema de las GPU y la entrega de datos con latencia de microsegundos; en el otro, la retención a largo plazo de conjuntos de datos masivos exige un archivado profundo y rentable. La presión financiera para gestionar este espectro se ha intensificado debido a los estrictos límites de consumo energético en los centros de datos y al encarecimiento de la memoria flash, cuyo precio se ha multiplicado por cuatro.

Para hacer frente a esta convergencia de fuerzas del mercado, el proveedor de software de infraestructura de datos Scality ha introducido su plataforma Autonomous Data Infrastructure (ADI). Operando como un appliance de software desplegado sobre metal puro (bare-metal) en hardware x86 estándar de forma local (on-premises), Scality ADI establece un nuevo modelo operativo. En lugar de obligar a las organizaciones a pasar por ciclos disruptivos de renovación de hardware, la pila definida por software se integra directamente en el sistema operativo de Scality para gestionar los ciclos de vida de los datos de forma autónoma bajo una única plataforma y espacio de nombres. Esta arquitectura gestiona más de 12 exabytes de datos de producción a nivel global, con clientes que incluyen a diez de las 20 principales empresas de telecomunicaciones y siete de los quince bancos globales más grandes. Las implementaciones individuales escalan a dominios de fallo de un solo RING de 250 petabytes de capacidad útil, albergando más de seis billones de objetos en 70 países.

El marco técnico de Scality ADI se apoya en cuatro pilares estructurales primarios: arquitectura Multiscale, Cores, AI Connect y Guardian. El sistema logra una latencia de microsegundos en el almacenamiento de objetos, alejando a este medio de su clasificación histórica como un almacenamiento puramente frío. A través de protocolos propietarios y S3 sobre Acceso Directo a Memoria Remota (RDMA), la plataforma habilita un nuevo «nivel caliente» (hot tier) que transmite datos directamente desde entornos de GPU extremas al almacenamiento frío, manteniendo una utilización óptima de las GPU. Por el contrario, para los niveles templados (warm tiers) que utilizan unidades de disco duro (HDD), el sistema garantiza un rendimiento de 2 gigabytes por segundo por petabyte.

Un componente central de esta infraestructura es el copiloto de IA Guardian. Operando a través de una conexión de Model Context Protocol (MCP), Guardian utiliza un LLM interno y propietario para proporcionar operaciones agénticas dentro de la pila de software. Este marco permite que agentes externos se conecten directamente al sistema, posibilitando el mantenimiento autónomo, la recuperación rápida y auditorías de control rigurosas. Para garantizar la seguridad operativa, la plataforma funciona con directrices estructurales estrictas (guardrails) en lugar de actuar como una «caja negra» no monitorizable. Un aspecto crucial es el modelo de «código abierto para inspección» (open code): aunque no es de código abierto tradicional (open-source), permite a los clientes corporativos y proveedores de servicios inspeccionar el código fuente y contribuir directamente a su desarrollo, asegurando una arquitectura de confianza transparente y soberana. La flexibilidad de escalado se extiende desde «Ateska» —la huella de almacenamiento más pequeña del mercado capaz de escalar hasta 1 petabyte— hasta configuraciones a escala de exabytes.

Mientras que las demandas inmediatas de la IA se centran en el rendimiento en tiempo real, la preservación a largo plazo de los datos de entrenamiento y las cargas de trabajo soberanas presenta un desafío existencial independiente. Los soportes tradicionales como las cintas y los discos requieren ciclos de renovación continuos y de alto consumo energético. Para abordar el nivel final del ciclo de vida de los datos, Scality ha establecido una alianza estratégica con Biomemory, pionera en sistemas industriales de almacenamiento de datos basados en ADN. Bajo este acuerdo, el CEO de Scality, Jerome Lecat, se ha incorporado al consejo de administración de Biomemory para alinear las hojas de ruta técnicas de ambas entidades.

Biomemory, fundada en 2021 a partir de investigaciones de la Universidad de la Sorbona y los laboratorios nacionales del CNRS en Francia, aceleró recientemente su preparación comercial mediante la adquisición de activos de Catalog Technologies, pionera en el almacenamiento de ADN. La alianza tiene como objetivo integrar el almacenamiento de ADN como un nivel de archivo frío estandarizado y ultraseguro dentro de los entornos modernos de almacenamiento de objetos, específicamente bajo el plano de control de Scality ADI y su marco de ciberresiliencia CORE5.

El almacenamiento de datos en ADN está transitando de la investigación de laboratorio a una solución de TI industrializada, optimizada para escenarios de «guardar para siempre, leer raras veces». El medio biológico ofrece una alta densidad, inmutabilidad segura, una capacidad de retención de 150 años, requisitos de renovación de soporte cercanos a cero y consumo energético nulo cuando está en reposo. Esta capa de infraestructura está dirigida directamente a archivos nacionales, repositorios genómicos, registros financieros o sanitarios regulados y cargas de trabajo de defensa donde la pérdida de datos acarrea graves consecuencias legales o sociales. En lugar de sustituir a los niveles existentes de flash o disco, el almacenamiento en ADN sirve como la culminación lógica de un espectro multinivel gestionado, ofreciendo una vía eficiente energéticamente para el almacenamiento frío masivo.

Por Jakob Jung

El Dr. Jakob Jung es redactor jefe de Security Storage y Channel Germany. Lleva más de 20 años trabajando en el periodismo especializado en TI. A lo largo de su carrera ha colaborado con Computer Reseller News, Heise Resale, Informationweek, Techtarget (almacenamiento y centros de datos) y ChannelBiz. Además, colabora como freelance con numerosas publicaciones del sector de las TI, entre las que se incluyen Computerwoche, Channelpartner, IT-Business, Storage-Insider y ZDnet. Sus temas principales son el canal, el almacenamiento, la seguridad, los centros de datos, los sistemas ERP y CRM. Contacto – Contacto por correo electrónico: jakob.jung@security-storage-und-channel-germany.de

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Aviso sobre Cookies en WordPress por Real Cookie Banner