LLaVA de código abierto desafía al GPT-4

El reconocimiento de imágenes GPT-4 ya tiene un nuevo competidor: LLaVA

Ángel Leonardo Torres
1 min readOct 10, 2023

Investigadores de Stanford, UW-Madison y Columbia presentaron LLaVA, un nuevo sistema de IA de código abierto que podría rivalizar con GPT-4 en comprensión visual y lingüística. Es de código abierto y de uso completamente gratuito.

Los detalles:

  • LLaVA conecta CLIP (un sistema de IA que entiende imágenes) con LLaMA, un modelo de IA de texto de código abierto.
  • En una demostración, LLaVA demostró que podía entender y mantener conversaciones sobre imágenes, de forma muy similar al sistema privado GPT-4, a pesar de contar con muchos menos datos de entrenamiento.
  • A diferencia del GPT-4 privado, el código de LLaVA, los pesos del modelo entrenado y los datos de entrenamiento generados están disponibles gratuitamente en Internet.

Por qué es importante:

LLaVA demuestra el potencial de la tecnología abierta para impulsar la inteligencia artificial basada en el lenguaje visual. Aunque probablemente no pueda competir con GPT-4, su accesibilidad y sus buenos resultados iniciales son impresionantes.

--

--

Ángel Leonardo Torres
Ángel Leonardo Torres

Written by Ángel Leonardo Torres

Todo evolucionana ¿te vas a quedar atras?

No responses yet