Hexo Labs Lanza SIA: Agente Autocorregido para IA

Segun MarkTechPost (AI/ML News), Hexo Labs ha presentado SIA (Self-Improving AI), un marco abierto bajo licencia MIT diseñado para permitir que los agentes de inteligencia artificial mejoren de forma continua, sin intervención humana directa. Esta innovación busca romper con la limitación común de los sistemas actuales, que dejan de evolucionar una vez que los usuarios dejan de ajustarlos. En lugar de modificar solo el entorno que rodea el modelo, SIA integra cambios en dos componentes críticos: el esqueleto del agente y los pesos del modelo mismo, dentro de un ciclo autónomo de aprendizaje.

El sistema divide un agente específico en dos módulos funcionales. El primero, el esqueleto o "harness", encierra la instrucción inicial, la lógica para seleccionar herramientas, las políticas de reintentos y el código para extraer respuestas. El segundo, los pesos del modelo, son actualizados directamente. El flujo de trabajo se impulsa por tres componentes: un agente meta que construye el esqueleto a partir de una especificación de tarea y código de referencia; un agente especializado que ejecuta la tarea y registra cada paso; y un agente de retroalimentación que analiza toda la trayectoria y decide qué acción tomar. Cada ejecución permite que el sistema seleccione una de dos opciones: actualizar el esqueleto manteniendo los pesos originales, o modificar los pesos sin alterar el esqueleto. Este proceso se repite en un bucle autónomo, impulsado por la retroalimentación constante.

El modelo base utilizado es OpenAI GPT-oss-120B, y los ajustes de pesos se realizan mediante una técnica llamada LoRA, con una rango de 32. Los agentes meta y de retroalimentación operan sobre Claude Sonnet 4.6. Los entrenamientos se ejecutan en GPUs H100 mediante la plataforma RL de Modal. Los investigadores definen dos modos operativos: SIA-H, que solo actualiza el esqueleto, y SIA-W+H, que combina ambas acciones. En pruebas con tres dominios distintos, se observó que los cambios en los pesos generan ganancias superiores a las obtenidas con solo ajustes en el esqueleto. En el caso del conjunto LawBench, que clasifica 191 cargos penales chinos, el esqueleto inicial logró un rendimiento del 50,0%, mientras que los ajustes en pesos permitieron superar esa marca.

Para el lector peruano, este avance refleja una tendencia clave en el desarrollo de tecnologías de inteligencia artificial: el paso de sistemas programados a entornos que aprenden y se adaptan de forma autónoma. Aunque aún se encuentran en fases experimentales, innovaciones como SIA podrían transformar sectores clave como el derecho, la contabilidad o el asesoramiento financiero, donde la precisión y la velocidad de respuesta son vitales. Si bien el uso generalizado aún está lejos, el enfoque de mejora continua puede servir como modelo para futuras aplicaciones que requieran operar en entornos dinámicos, como los servicios de asesoría en inversiones o la gestión de riesgos.