Clibrain, una startup con sede en Madrid, se une a la competencia de la IA generativa con Lince, un modelo de lenguaje grande (LLM) optimizado para el español. Lince Zero, su primer lanzamiento, se basa en tecnologías de código abierto y busca comprender mejor los matices lingüísticos del español que los modelos existentes como ChatGPT. La compañía planea lanzar un modelo fundacional más potente y modelos específicos para diferentes dominios, ofreciendo acceso a través de una API y aplicaciones propias. Clibrain apuesta por la calidad lingüística sobre el tamaño del modelo, enfocándose en un mercado de hispanohablantes que buscan una mayor comprensión nativa.

¿Qué es Lince Zero y cuál es su propósito?
Lince Zero es un modelo de lenguaje grande (LLM) optimizado para el idioma español, lanzado por la startup Clibrain, con sede en Madrid. Su propósito principal es abordar la falta de atención que los modelos de lenguaje convencionales prestan al español, ofreciendo un modelo que pueda comprender y generar texto en español con mayor precisión y matices. Clibrain identifica que, aunque existen LLMs que manejan el español, su enfoque dedicado permitirá a Lince Zero y a futuros modelos comprender mejor las sutilezas lingüísticas del español, considerando sus variadas dialectos y contextos culturales en los más de 20 países donde se habla. Lince Zero se basa en tecnologías de código abierto existentes y es un primer paso hacia el desarrollo de un modelo fundacional más potente llamado Lince.

¿Cómo planea Clibrain diferenciarse de otros modelos de lenguaje que también soportan el español, como ChatGPT?
Clibrain planea diferenciarse enfocándose completamente en el idioma español, lo que les permite entrenar sus modelos en un corpus de datos dedicado y de alta calidad en español. Elena González-Blanco, cofundadora y CEO de Clibrain, destaca que poseen un corpus único de datos de entrenamiento gracias a sus años de investigación lingüística y contactos en el campo de la lengua española. Este enfoque les permitirá construir modelos que no solo sean masivos, sino que también ofrezcan una calidad lingüística superior, entendiendo mejor los matices y sutilezas del español que otros modelos podrían pasar por alto. Además, Clibrain planea lanzar modelos de dominio entrenados sobre su modelo fundacional, ampliando aún más su capacidad para comprender y generar texto en español en contextos específicos.

¿Cuál es la hoja de ruta de Clibrain para el desarrollo de sus modelos de lenguaje Lince?
La hoja de ruta de Clibrain comienza con el lanzamiento de Lince Zero, un modelo de 7 mil millones de parámetros basado en tecnologías de código abierto. El siguiente paso es el desarrollo de Lince, un modelo fundacional más potente con 40 mil millones de parámetros, que no será de código abierto y se ofrecerá a través de una API a clientes de pago. Clibrain también planea integrar el modelo Lince en sus propias aplicaciones de comunicación y productividad (CliChat, CliCall y CliBot). A futuro, la empresa tiene la intención de desarrollar modelos multimodales que puedan responder a imágenes y audio, además de texto, ampliando las capacidades de sus modelos de lenguaje para el mercado hispanohablante.


Artículo Original: https://techcrunch.com/2023/07/12/lince-llm/


Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *