Segun MarkTechPost (AI/ML News), un equipo de investigadores de Sina Weibo Inc (China) ha desarrollado VibeThinker-3B, un modelo de inteligencia artificial con 3 mil millones de parámetros que logra rendimientos comparables a modelos de hasta 671 mil millones y 1 trillón de parámetros. Este avance representa una alternativa al enfoque tradicional de escalar modelos mediante billones de parámetros, demostrando que una arquitectura compacta puede alcanzar resultados verificables en tareas específicas como matemáticas, programación y ciencias de la ingeniería. El modelo no se entrena desde cero, sino que se post-entrena mediante tres técnicas: fine-tuning supervisado, aprendizaje por recompensa y auto-distilación. Este proceso se basa en el principio de Spectrum-to-Signal Post-Training (SSP), desarrollado previamente en VibeThinker-1.5B, que permite definir un espacio amplio de razonamientos posibles (espectro) y luego fortalecer los caminos correctos (señal).
La eficiencia del modelo se evidencia en su rendimiento en múltiples pruebas. En AIME26, alcanza un puntaje de 94.3, cifra que se sitúa en el mismo rango que DeepSeek V3.2 (671B) y Kimi K2.5 (1T). En LiveCodeBench v6, obtiene 80.2 porcentajes de respuestas correctas en la primera intento, mientras que en OJBench, un test de código, registra 38.6, un resultado que queda por debajo de los modelos más grandes. Su desempeño en HMMT25 es de 89.3 y en BruMO25 alcanza 93.8. En una evaluación de 400 problemas de nivel olímpico (IMO-AnswerBench), logra un resultado de 76.4. Los pesos del modelo requieren una versión específica de transformadores (4.54.0 o superior), y para una inferencia más rápida se recomiendan herramientas como vLLM (0.10.1) o SGLang (0.4.9.post6). El tamaño de los pesos en formato BF16 es de aproximadamente 6 GB, lo que permite su ejecución en una sola GPU, facilitando su acceso a usuarios y entornos técnicos más modestos.
Para los lectores peruanos, este desarrollo tiene un significado práctico. A pesar de que los modelos grandes siguen dominando en tareas abiertas y de conocimiento general, VibeThinker-3B ofrece una alternativa viable para aplicaciones específicas como resolución de problemas matemáticos o desarrollo de código en entornos académicos y pequeñas empresas. En un contexto donde el acceso a computación potente puede ser limitado, el hecho de que un modelo pequeño logre rendimientos comparables a grandes modelos puede abrir puertas a innovaciones más inclusivas. Además, al estar bajo licencia MIT, su uso es libre y abierto, lo que favorece la replicabilidad y la adaptación a necesidades locales. En un país donde muchas instituciones aún enfrentan desafíos de infraestructura tecnológica, este tipo de avances puede ser clave para democratizar el acceso a herramientas de inteligencia artificial.
