Google DeepMind ha presentado AlphaGenome, una inteligencia artificial capaz de procesar hasta un millón de pares de bases de ADN y predecir miles de propiedades regulatorias. Basado en arquitecturas híbridas y entrenado con datos multi-ómicos, este sistema supera a modelos específicos en la interpretación de la región no codificante del genoma.
Introducción al reto genómico
El genoma humano consta de más de 3 100 millones de pares de bases, de los que apenas un 2 % codifica proteínas. El 98 % restante, conocido como ADN no codificante, influye en la regulación génica y está implicado en numerosas enfermedades. Comprender cómo pequeñas variantes alteran esa regulación sigue siendo uno de los mayores desafíos en biología molecular.
La ‘materia oscura’ del ADN
Los elementos regulatorios – promotores, enhancers y sitios de unión proteica – operan a grandes distancias lineales y tridimensionales dentro del núcleo. Analizar millones de combinaciones de secuencias y su impacto funcional exige modelos capaces de integrar contexto local y global.
Limitaciones de enfoques anteriores
Modelos como Enformer o Hyena interpretaban fragmentos de hasta 100 kb con tareas concretas. Su especialización dificultaba un análisis simultáneo de múltiples propiedades regulatorias.
AlphaGenome: arquitectura y funcionamiento
AlphaGenome combina redes neuronales convolucionales para detectar motivos locales y transformadores para capturar interacciones a larga distancia en secuencias de hasta 1 Mb.
Flujo de datos
-
Entrada de secuencia de 1 000 000 de bases.
-
Extracción de características locales con CNN.
-
Modelado de relaciones de largo alcance con bloques de atención.
-
Salida de predicciones para miles de pistas genómicas: expresión, accesibilidad, empalme y unión proteica.
Entrenamiento multi-ómico
Se utilizan datos de múltiples proyectos internacionales que cubren numerosas mediciones experimentales en células humanas y de modelo.
Evaluación de desempeño
AlphaGenome se sometió a 26 benchmarks de predicción de efectos de variantes. Superó a los mejores modelos específicos en 24, mejorando la exactitud en empalme y accesibilidad de cromatina.
Comparación con modelos previos
La novedad de AlphaGenome radica en su enfoque unificado y su capacidad de predicción de alta resolución.
Ventajas clave
-
Cobertura amplia: regiones codificantes y no codificantes.
-
Resolución de un solo nucleótido: impacto de variantes puntuales.
-
Eficiencia: optimizado para secuencias de gran longitud.
Desafíos y limitaciones
Aplicaciones y perspectivas futuras
El potencial abarca investigación básica y traslacional.
Descubrimiento de variantes causales
Permite priorizar mutaciones asociadas a enfermedades genéticas y cáncer.
Terapias genómicas y biología sintética
Facilita diseñar guías de edición más precisas y predecir actividad de promotores sintéticos antes de su síntesis.
Integración en laboratorios
DeepMind ofrece acceso no comercial vía API y planea liberar el modelo completo próximamente.
Elemento |
Detalle |
Entrada máxima |
1 000 000 pares de bases |
Salidas |
Más de 1 000 propiedades regulatorias |
Arquitectura |
CNN + transformadores |
Conjuntos de datos |
Múltiples fuentes multi-ómicas |
Resumen
AlphaGenome representa un avance decisivo en genómica computacional, al ofrecer un modelo único que predice con alta precisión los efectos funcionales de variantes en todo el genoma. Su combinación de arquitecturas y entrenamiento multi-ómico le confiere versatilidad y rendimiento superiores a enfoques anteriores. Disponible en vista previa para la comunidad científica, sienta las bases para nuevas aplicaciones en diagnóstico, tratamiento y biología sintética.
Referencias
https://www.biorxiv.org/content/10.1101/2025.06.25.661532v1
https://deepmind.google.com/science/alphagenome/