Segun MarkTechPost (AI/ML News), Liquid AI ha presentado dos nuevos modelos de recuperación de información: LFM2.5-Embedding-350M y LFM2.5-ColBERT-350M. Ambos contienen 350 millones de parámetros y forman parte de la primera generación de modelos bidireccionales dentro de la familia LFM. Estos modelos se desarrollaron a partir del checkpoint LFM2.5-350M-Base, lanzado en marzo, y introducen modificaciones clave que transforman la arquitectura de un decodificador causal en un codificador bidireccional. Este cambio permite que cada token considere tanto su contexto anterior como posterior, lo que mejora significativamente la precisión en tareas de recuperación de información.
El modelo LFM2.5-Embedding-350M actúa como un encriptador denso, generando un solo vector por documento. Este enfoque permite búsquedas rápidas y una indexación económica, ideal para entornos donde el tiempo de respuesta es crítico y los recursos de almacenamiento son limitados. Por otro lado, el LFM2.5-ColBERT-350M emplea una estrategia de interacción tardía, convirtiendo cada token en un vector independiente. Esto facilita una comparación palabra por palabra entre consultas y documentos, elevando la exactitud y la capacidad de generalización. Aunque requiere una indexación más grande, también permite reordenar resultados obtenidos en una primera fase sin necesidad de construir un índice completo. El límite de longitud de consulta se establece en 32 tokens.
Ambos modelos están diseñados para aplicaciones de búsqueda en contextos cortos, como catálogos de productos, bases de conocimiento frecuentemente consultadas o documentos de soporte. Liquid AI los presenta como soluciones directas que pueden integrarse sin modificaciones significativas en pipelines existentes de Redes de Información Agregada (RAG). Estos modelos ya están disponibles en Hugging Face bajo la licencia LFM Open License v1.0, lo que facilita su acceso y uso por desarrolladores y equipos técnicos.
Para los lectores peruanos, esta evolución en modelos de inteligencia artificial representa una oportunidad para mejorar la eficiencia en servicios digitales. Empresas locales que gestionan bases de conocimiento en múltiples idiomas —como bancos, agencias de salud o plataformas de educación— pueden aprovechar estas herramientas para ofrecer búsquedas más rápidas y precisas. Además, su bajo consumo de recursos los hacen viables para entornos con infraestructura limitada, como pequeñas y medianas empresas. La capacidad de soportar 11 idiomas también abre puertas a la inclusión de usuarios que hablan diferentes lenguas, fortaleciendo el acceso digital en un país diverso.
