Segun MarkTechPost (AI/ML News), un equipo compuesto por investigadores de la Universidad de Illinois Urbana-Champaign, UC Berkeley y Chroma ha desarrollado Harness-1, una agente de búsqueda basada en aprendizaje por reforzamiento. Esta solución, construida sobre el modelo gpt-oss-20b y con una arquitectura de 20 mil millones de parámetros, alcanza un promedio de recuperación curada de 0.730 en ocho benchmarks, posicionándose solo por debajo de Opus-4.6 entre los sistemas evaluados. La innovación radica en separar las funciones de toma de decisiones y gestión de estado, evitando que un solo modelo se encargue de ambas tareas.
El sistema no responde directamente a preguntas. En su lugar, genera una lista ordenada de documentos que luego son procesados por un modelo posterior. La operación se estructura como un bucle en un entorno de estado permanente. Cada interacción comienza con una acción emitida por la política, que decide qué buscar, qué validar y cuándo finalizar. El estado del proceso se almacena en un entorno que incluye un conjunto de documentos compactados, una selección final de hasta 30 elementos etiquetados por nivel de relevancia —muy alto, alto, aceptable o bajo—, un repositorio completo de fragmentos recuperados y un grafo de evidencias que organiza la relación entre los datos obtenidos.
Este diseño introduce un concepto conocido como "desplazamiento cognitivo estatal", donde el modelo principal se enfoca en decisiones semánticas, mientras el entorno gestiona el historial y la coherencia del proceso. Al separar estas funciones, se evita que el modelo se sobrecargue con tareas de almacenamiento y actualización, lo cual mejora la estabilidad y la eficiencia del sistema. Los pesos del modelo y el código del entorno han sido liberados públicamente, permitiendo a otros investigadores replicar y adaptar el sistema a sus propios escenarios.
Para los peruanos, este avance tiene implicaciones directas en el desarrollo de tecnologías de búsqueda inteligente. En entornos como el sector financiero, donde se requieren respuestas precisas y basadas en evidencia, herramientas que pueden filtrar y organizar información de forma estructurada son clave. Por ejemplo, un inversionista que busca datos sobre tasas de interés o rendimientos de bonos podría beneficiarse de un sistema que no solo encuentre resultados, sino que los clasifique por confiabilidad y validez. Esto permite tomar decisiones más informadas, reduciendo riesgos asociados a la selección de fuentes poco confiables. En un contexto donde el acceso a datos técnicos puede ser limitado, esta tecnología podría ser un pilar para mejorar la transparencia y la calidad de las decisiones económicas.
