CLOSED
S&PNASDAQDOWR2KVIXAAPLMSFTNVDAGOOGLMETAAMZNTSLAAVGOGOLDWTIUSDPEN
Yahoo · 60s · delay ~15min
LIVE
BTCETHSOLXRPADABNBDOGE
CoinGecko · 30s
NVIDIA Lanza Cosmos 3: Modelo de IA para Robots y Vehículos Autónomos
Papers

NVIDIA Lanza Cosmos 3: Modelo de IA para Robots y Vehículos Autónomos

MarkTechPost (AI/ML News)3 de junio de 2026Cortesia de MarkTechPost (AI/ML News)

Segun MarkTechPost (AI/ML News), el equipo de inteligencia artificial de NVIDIA ha presentado Cosmos 3, un modelo de base omnimodal diseñado para impulsar la toma de decisiones en entornos físicos. Este sistema integra tres capacidades clave: razonamiento físico, generación de mundos virtuales y producción de acciones. Todos estos módulos operan dentro de una sola arquitectura abierta, eliminando la necesidad de combinar múltiples modelos separados. La innovación radica en su estructura de dos torres, una basada en un modelo de visión-lenguaje autoregresivo, que interpreta imágenes, videos y textos para comprender contextos físicos como el movimiento de objetos o interacciones entre ellos. Esta torre es considerada el núcleo cognitivo del sistema. La segunda torre, por su parte, genera predicciones sobre futuras observaciones y secuencias de acción mediante un proceso de difusión que incorpora principios de física. Los resultados de esta generación se basan directamente en la comprensión del primer módulo, estableciendo una dirección de flujo unidireccional desde razonamiento hasta acción. Aunque el modelo puede ejecutar la fase de razonamiento de forma independiente, la generación de acciones siempre requiere el funcionamiento conjunto de ambas torres.

NVIDIA ha definido tres variantes del modelo: Edge, Nano y Super, todas construidas sobre la misma arquitectura dual. Cada versión se adapta a diferentes escalas de uso. El Cosmos3-Nano, por ejemplo, cuenta con 16 mil millones de parámetros y se basa en una arquitectura densa de 8 mil millones de parámetros derivada del Qwen3-VL. Su diseño prioriza eficiencia en entornos con recursos limitados, como dispositivos de bordo. El modelo Super, por su parte, está diseñado para tareas complejas en entornos industriales, como vigilancia en almacenes o conducción autónoma. La disponibilidad de los pesos entrenados, scripts de entrenamiento, herramientas de implementación y conjuntos de datos abiertos permite a investigadores y desarrolladores replicar y adaptar el sistema a necesidades específicas.

Para el lector peruano, este avance tiene implicaciones directas en sectores clave como la logística y la manufactura. En el país, donde la automatización de almacenes y la movilidad urbana son puntos de crecimiento estratégico, herramientas como Cosmos 3 pueden potenciar la eficiencia de operaciones. Los sistemas que integran percepción, predicción y acción en un solo modelo permiten una respuesta más ágil ante cambios en entornos reales, reduciendo errores y mejorando la toma de decisiones en tiempo real. Aunque aún en etapa inicial, este tipo de tecnologías podría ser adoptado en centros de distribución, fábricas o incluso vehículos de transporte urbano, ofreciendo un paso clave hacia infraestructuras más inteligentes y adaptativas.