Con Claude 2.1, Anthropic se lanza a la yugular de OpenAI
Anthropic, rival de OpenAI, hace aún más útil su chatbot Claude
Mientras OpenAI atraviesa una crisis existencial, Anthropic, la startup de IA respaldada por Google y fundada por antiguos ingenieros de OpenAI que la abandonaron por desacuerdos sobre la dirección cada vez más comercial de la empresa a medida que avanzaba su asociación con Microsoft, ha actualizado su chatbot.
Anthropic ha anunciado que la última actualización de su chatbot, Claude 2.1, es capaz de procesar hasta 200.000 tokens de contexto, equivalentes a 150.000 palabras o 500 páginas de texto, lo que lo colocaría un paso por delante del recién anunciado GPT-4 Turbo.
Esto permite a los usuarios cargar y analizar documentos técnicos completos, largos informes financieros o incluso extensas obras literarias.
Claude 2.1 pretende ofrecer mejores resúmenes, respuestas a preguntas, previsiones de tendencias y otras perspectivas en comparación con la versión anterior, al tener en cuenta más información contextual.
Características adicionales de Claude 2.1
- Además de la ventana contextual más grande, Claude 2.1 llega con reducciones significativas en las tasas de alucinación a la mitad y que puede hacer cosas como buscar en Internet o utilizar una calculadora mediante herramientas personalizables. El chatbot también admite ahora instrucciones personalizadas y persistentes y tiene una nueva ventana de prueba para probar las instrucciones.
Las alucinaciones, o la información errónea, siguen siendo frecuentes en esta generación de chatbots de IA. Sin embargo, Anthropic afirma que Claude 2.1 ha reducido su tasa de alucinaciones a la mitad en comparación con Claude 2.0. La empresa atribuye parte del progreso a una mayor capacidad para separar las afirmaciones incorrectas de la admisión de incertidumbre, lo que hace que Claude 2.1 tenga el doble de probabilidades de admitir que no sabe una respuesta en lugar de proporcionar una incorrecta.
- Según Anthropic, Claude 2.1 también comete un 30 por ciento menos de errores en documentos extremadamente largos. Además, tiene una tasa entre tres y cuatro veces menor de “concluir erróneamente que un documento apoya una afirmación concreta” cuando utiliza ventanas de contexto más robustas.
- La función de 200.000 tokens duplica lo que Claude podía manejar antes, y es un límite significativamente más alto que el tope de 32.000 tokens de la versión más cara de GPT-4. Anthropic lo califica de “primicia en el sector” y afirma que permite al chatbot analizar cargas de bases de código enteras u obras como la “Ilíada”. El mayor número de tokens es exclusivo del plan Pro de la empresa.
- Anthropic también ha acercado un poco más a Claude a ChatGPT con la nueva función beta de uso de herramientas. Los usuarios pueden ahora conectar herramientas API, y Claude elegirá la mejor para el trabajo dependiendo del contexto. Eso incluye el uso de una calculadora o la búsqueda en la web, y la empresa dice que los usuarios pueden pedir llamadas específicas a la API utilizando el lenguaje natural.
La empresa cita ejemplos como el uso de una calculadora para ecuaciones complejas, la traducción de lenguaje sencillo a llamadas a API estructuradas, el uso de una API de búsqueda web, el acceso a API privadas de clientes o la conexión a conjuntos de datos de productos. La empresa advierte de que la función de uso de herramientas está en fase inicial de desarrollo e insta a los clientes a que envíen sus comentarios.
- Por último, la empresa ha actualizado su consola de desarrollador con una ventana de prueba para probar nuevas instrucciones y ha añadido la posibilidad de dar a Claude instrucciones persistentes personalizadas. Al igual que con GPT-4, esto significa que puedes personalizar el chatbot para que responda de formas específicas o con personalidades concretas.