CLOSED
S&PNASDAQDOWR2KVIXAAPLMSFTNVDAGOOGLMETAAMZNTSLAAVGOGOLDWTIUSDPEN
Yahoo · 60s · delay ~15min
LIVE
BTCETHSOLXRPADABNBDOGE
CoinGecko · 30s
Sistema Agente de IA Superar Fronteras en Pruebas de Codificación
Papers

Sistema Agente de IA Superar Fronteras en Pruebas de Codificación

MarkTechPost (AI/ML News)15 de mayo de 2026Cortesia de MarkTechPost (AI/ML News)

Según MarkTechPost (AI/ML News), Poetiq ha logrado un avance significativo en el campo de las inteligencias artificiales mediante su Meta-System, que desarrolla de forma automática un entorno de ejecución adaptable para modelos de lenguaje, sin necesidad de ajustar directamente los parámetros internos de los modelos ni de entrenarlos específicamente. Este sistema ha sido validado en el benchmark LiveCodeBench Pro (LCB Pro), un test diseñado para medir la capacidad de un modelo para resolver problemas de programación en C++, con enfoque en lógica procedural compleja y rendimiento ejecutivo. Los resultados muestran que el sistema logra mejorar el rendimiento de modelos líderes sin intervención humana directa. En el cuarto trimestre de 2025, el modelo GPT 5.5 High con el entorno optimizado de Poetiq alcanza un puntaje del 93,9% en LCB Pro, un incremento de 4,3 puntos frente a su rendimiento base de 89,6%. El modelo Gemini 3.1 Pro, al cual el sistema se ha adaptado específicamente, mejora de 78,6% a 90,9%, superando incluso a Gemini 3 Deep Think, un modelo interno de Google que no está disponible públicamente para evaluación externa.

LiveCodeBench Pro fue creado para evitar dos fallos comunes en pruebas de IA: la contaminación de datos y el sobreajuste. Los ejercicios provienen de competencias de programación reconocidas, y las soluciones se verifican mediante un marco de pruebas robusto, donde el código debe cumplir no solo con la salida correcta, sino también con límites de memoria y tiempo de ejecución. Este enfoque garantiza que los resultados reflejen habilidades reales de resolución de problemas, no solo memorización. La selección del benchmark no es casual: Poetiq ha publicado tres resultados técnicos en este ámbito, y LCB Pro representa una prueba de alta complejidad que evalúa la creatividad y la capacidad de diseño de soluciones en entornos reales, en lugar de simplemente aplicar herramientas o corregir errores.

Para los lectores peruanos, este avance resalta la importancia de integrar tecnologías de inteligencia artificial en entornos de desarrollo y gestión de sistemas. Aunque aún no se han implementado en mercados locales, los avances como este podrían acelerar el acceso a herramientas de automatización de código, especialmente en sectores como el software, la innovación tecnológica o la digitalización de pequeñas y medianas empresas. En un contexto donde el desarrollo de software es clave para el crecimiento económico, entender cómo los sistemas de IA pueden mejorar la calidad del código sin necesidad de ajustes manuales, permite a profesionales y emprendedores tomar decisiones más informadas sobre la inversión en tecnologías emergentes. No se trata solo de mejorar el rendimiento de modelos, sino de democratizar el acceso a soluciones inteligentes que pueden ser aplicadas en entornos reales, con menor barrera técnica y tiempo de implementación.