Según MarkTechPost (AI/ML News), el agente abierto de Nous Research, Hermes, ha incorporado una funcionalidad de búsqueda de herramientas que resuelve una limitación crítica en los sistemas de inteligencia artificial basados en protocolos de contexto. Esta novedad permite a los usuarios gestionar eficientemente la carga de información que se carga en cada interacción, evitando que el espacio disponible para instrucciones se sobrecargue.
El problema central radica en cómo los protocolos de contexto (MCP) generan una sobrecarga significativa al enviar esquemas de herramientas a cada turno, incluso cuando solo se requieren unas pocas. En una configuración real con cinco servidores MCP y treinta herramientas, el tamaño promedio del mensaje alcanza 45,000 tokens, de los cuales casi el 50% —alrededor de 22,000— proviene de esquemas de herramientas. Datos internos de Anthropic indican que, sin optimización, los esquemas pueden consumir hasta 134,000 tokens. En entornos típicos, el costo de atención a herramientas oscila entre 15,000 y 60,000 tokens por interacción. Esto genera dos consecuencias directas: el gasto elevado en generaciones iniciales, que puede alcanzar entre 7 y 10 centavos por turno, y una pérdida de precisión al enfrentar múltiples opciones irrelevantes, lo que provoca parálisis en la toma de decisiones.
La solución propuesta por Hermes consiste en una capa de despliegue progresivo que solo carga los esquemas de herramientas cuando son necesarios. En su nueva versión, al activar la búsqueda de herramientas, el sistema reemplaza los elementos de herramientas en el conjunto visible por tres intermediarios: uno para copiar código, otro para usar un navegador distinto y una función específica que permite realizar una búsqueda en el catálogo de herramientas pendientes. Posteriormente, el modelo puede describir un esquema individual o ejecutar una herramienta según el contexto. Este enfoque transforma el flujo de interacción, reduciendo la carga inicial y mejorando la eficiencia.
Para el lector peruano, este desarrollo es especialmente relevante en entornos donde la conectividad y el uso eficiente de recursos son esenciales. Empresas de servicios, pequeñas empresas o incluso usuarios que gestionan finanzas o tareas administrativas con asistentes digitales pueden beneficiarse de esta mejora. Al evitar que cada consulta se vea saturada por información innecesaria, se optimiza el tiempo de respuesta y se reducen los costos operativos. En un contexto de crecimiento digital en el Perú, donde el acceso a tecnologías avanzadas está aumentando, esta innovación puede facilitar el uso más sostenible y accesible de inteligencia artificial, permitiendo que más usuarios logren integrar herramientas de inteligencia sin necesidad de inversiones masivas en infraestructura.
