LLaVA de código abierto desafía al GPT-4
El reconocimiento de imágenes GPT-4 ya tiene un nuevo competidor: LLaVA
1 min readOct 10, 2023
Investigadores de Stanford, UW-Madison y Columbia presentaron LLaVA, un nuevo sistema de IA de código abierto que podría rivalizar con GPT-4 en comprensión visual y lingüística. Es de código abierto y de uso completamente gratuito.
Los detalles:
- LLaVA conecta CLIP (un sistema de IA que entiende imágenes) con LLaMA, un modelo de IA de texto de código abierto.
- En una demostración, LLaVA demostró que podía entender y mantener conversaciones sobre imágenes, de forma muy similar al sistema privado GPT-4, a pesar de contar con muchos menos datos de entrenamiento.
- A diferencia del GPT-4 privado, el código de LLaVA, los pesos del modelo entrenado y los datos de entrenamiento generados están disponibles gratuitamente en Internet.
Por qué es importante:
LLaVA demuestra el potencial de la tecnología abierta para impulsar la inteligencia artificial basada en el lenguaje visual. Aunque probablemente no pueda competir con GPT-4, su accesibilidad y sus buenos resultados iniciales son impresionantes.