CLOSED
S&PNASDAQDOWR2KVIXAAPLMSFTNVDAGOOGLMETAAMZNTSLAAVGOGOLDWTIUSDPEN
Yahoo · 60s · delay ~15min
LIVE
BTCETHSOLXRPADABNBDOGE
CoinGecko · 30s
Mistral Lanza OCR 4 para mejoras en procesamiento de documentos
Papers

Mistral Lanza OCR 4 para mejoras en procesamiento de documentos

MarkTechPost (AI/ML News)24 de junio de 2026Cortesia de MarkTechPost (AI/ML News)

Segun MarkTechPost (AI/ML News), Mistral AI ha presentado OCR 4, una actualización clave de su tecnología de reconocimiento óptico de caracteres. Esta versión introduce una salida estructurada que va más allá de la simple extracción de texto, ofreciendo cajas de delimitación, clasificación de bloques y puntuaciones de confianza por palabra. El modelo maneja 170 idiomas distribuidos en 10 grupos lingüísticos, destacando su eficacia en lenguas poco comunes y de baja disponibilidad de datos. En pruebas independientes, anotadores evaluaron OCR 4 frente a múltiples sistemas, registrando una ventaja promedio del 72 por ciento. El costo se fija en $4 por 1.000 páginas, reduciéndose a $2 mediante el uso de la opción Batch-API. Una sola interfaz permite la generación tanto de contenido crudo como de resultados estructurados según esquemas predefinidos.

La evolución de OCR 4 radica en su enfoque estructurado. En lugar de convertir un documento en texto plano, el modelo entiende y organiza cada elemento gráfico. Cada sección, como títulos, tablas, fórmulas matemáticas o firmas, es identificada por su tipo y localizada mediante cajas de delimitación. Además, cada palabra recibe una puntuación de confianza que refleja el nivel de certeza del modelo en su interpretación. Esta información permite que los sistemas downstream no solo identifiquen el contenido, sino también su posición, su función dentro del documento y el grado de confiabilidad de la lectura. Específicamente, este detalle es esencial para tareas como citaciones precisas, eliminación de datos sensibles y validaciones humanas.

El modelo soporta formatos estándar de empresas, como PDF, DOC, PPT y OpenDocument, y es capaz de ejecutarse en un solo contenedor. Esta característica facilita la integración en entornos empresariales que requieren control total sobre sus datos, especialmente en contextos de cumplimiento regulatorio. La capacidad de auto-hospedaje garantiza que las organizaciones puedan gestionar sus datos sin depender de plataformas externas, optimizando tanto la seguridad como la eficiencia operativa.

Para los lectores peruanos, esta tecnología representa una herramienta poderosa en el manejo de documentos oficiales, contratos o informes administrativos. En un contexto donde la gestión de documentos en múltiples idiomas —como el queco, aymara o español— es común en instituciones públicas y privadas, OCR 4 permite una lectura más precisa y estructurada. Además, su enfoque en confiabilidad y localización ayuda a reducir errores en procesos de auditoría, cumplimiento o análisis financiero. A medida que los sectores como el gobierno, educación o banca digital adoptan tecnologías avanzadas, herramientas como OCR 4 podrían convertirse en pilares clave para la digitalización eficiente y segura de información.

Mistral Lanza OCR 4 para mejoras en procesamiento de documentos | Reditua